Pliki dostępne w sekcji pobierania testu ULTRA

Zaktualizowano dnia

W sekcji pobierania testu ULTRA możesz znaleźć różne typy plików wygenerowanych na podstawie Twoich danych z sekwencjonowania całego genomu, WGS. Pliki te są zorganizowane w dwóch głównych sekcjach: „Pobieranie” i „Pobieranie techniczne”.

Po pierwsze, sekcja „Pobieranie” obejmuje dwa pliki w formacie CSV, zaprojektowane tak, aby zapewnić użytkownikowi prostsze i bardziej dostępne doświadczenie. Pliki te mają strukturę podobną do raw data generowanych przez platformy genotypowania i są przeznaczone dla użytkowników niebędących ekspertami, aby mogli wygodniej eksplorować swoje dane genetyczne. Ponadto zostały przygotowane w celu ułatwienia ich ewentualnego wykorzystania na zewnętrznych platformach analizy genetycznej.

  • TMG MyVariants: to plik, którego format i zawartość zostały dostosowane w celu maksymalizacji kompatybilności z zewnętrznymi platformami analizy genetycznej. Jego celem jest zaoferowanie użytkownikowi prostego, ustrukturyzowanego pliku podobnego do raw data z genotypowania, ułatwiając w ten sposób przeglądanie części informacji genetycznych uzyskanych dzięki WGS.

  • TMG MyVariants Ultra: zawiera wszystkie informacje zawarte w TMG MyVariants, a ponadto obejmuje te warianty, w których Twój genotyp nie jest referencyjny/referencyjny. Oznacza to, że pozwala szerzej przeglądać pozycje, w których Twoje DNA różni się od genomu referencyjnego. Plik ten został zaprojektowany tak, aby użytkownik mógł w prostszy sposób eksplorować swoją zmienność genetyczną, bez konieczności bezpośredniej pracy z bardziej złożonymi plikami bioinformatycznymi.

Po drugie, sekcja „Pobieranie techniczne” udostępnia użytkownikowi pliki w formatach powszechnie stosowanych w przepływach analizy genomowej. Pliki te są skierowane do zaawansowanych użytkowników, bioinformatyków, badaczy lub specjalistów, którzy chcą przeprowadzać bardziej szczegółowe analizy techniczne.

  • Plik FASTQ: to surowy plik wyjściowy z urządzenia do sekwencjonowania. Zawiera nieprzetworzone odczyty DNA wraz z wynikami jakości, które wskazują wiarygodność każdego odczytu. Jest to jeden z najbardziej kompletnych formatów, ponieważ zachowuje początkowe informacje wygenerowane podczas sekwencjonowania. Jest to jednak również plik o dużym rozmiarze, a jego użycie wymaga wiedzy bioinformatycznej oraz specjalistycznych narzędzi do przetwarzania.

  • Plik VCF (Variant Call Format): to wynik bioinformatycznego przetwarzania danych sekwencjonowania po ich wyrównaniu i porównaniu z genomem referencyjnym (GRCh37). Zawiera informacje o wariantach zidentyfikowanych w DNA użytkownika, czyli o pozycjach, w których wykryto różnicę względem genomu referencyjnego. Format ten jest szeroko stosowany w genetyce i bioinformatyce do analizy, filtrowania i interpretacji wariantów genomowych.

  • Plik CRAM: to skompresowany format binarny wykorzystywany do przechowywania danych z sekwencjonowania genomowego wyrównanych względem genomu referencyjnego (GRCh37). Zawiera informacje o odczytach DNA uzyskanych po sekwencjonowaniu, wskazując, w której pozycji genomu referencyjnego się wyrównują, wraz z danymi jakościowymi i innymi metadanymi technicznymi. Wymaga specjalistycznych narzędzi bioinformatycznych oraz, w wielu przypadkach, genomu referencyjnego użytego podczas wyrównania, aby można go było prawidłowo zinterpretować. Podobnie jak FASTQ, jest to plik techniczny i duży, dlatego jest przeznaczony głównie dla zaawansowanych użytkowników, bioinformatyków lub badaczy.