Nella sezione download del test ULTRA puoi trovare diversi tipi di file generati a partire dai tuoi dati di Sequenziamento dell’Intero Genoma, WGS. Questi file sono organizzati in due sezioni principali: “Download” e “Download tecnici”.
In primo luogo, la sezione “Download” include due file in formato CSV, progettati per offrire all’utente un’esperienza più semplice e accessibile. Questi file hanno una struttura simile ai raw data generati dalle piattaforme di genotipizzazione e sono pensati affinché utenti non esperti possano esplorare i propri dati genetici in modo più comodo. Inoltre, sono stati preparati per facilitarne il possibile utilizzo su piattaforme di analisi genetica di terze parti.
-
TMG MyVariants: è un file il cui formato e contenuto sono stati adattati per massimizzare la compatibilità con piattaforme esterne di analisi genetica. Il suo obiettivo è offrire all’utente un file semplice, strutturato e simile ai raw data di genotipizzazione, facilitando così la consultazione di una parte delle informazioni genetiche ottenute tramite WGS.
-
TMG MyVariants Ultra: contiene tutte le informazioni incluse in TMG MyVariants e, inoltre, incorpora quelle varianti in cui il tuo genotipo non è riferimento/riferimento. Ciò significa che consente di consultare in modo più ampio le posizioni in cui il tuo DNA presenta una differenza rispetto al genoma di riferimento. Questo file è progettato affinché l’utente possa esplorare la propria variabilità genetica in modo più semplice, senza dover lavorare direttamente con file bioinformatici più complessi.
In secondo luogo, la sezione “Download tecnici” mette a disposizione dell’utente file in formati abituali nei flussi di analisi genomica. Questi file sono rivolti a utenti avanzati, bioinformatici, ricercatori o professionisti che desiderano eseguire analisi tecniche più specifiche.
-
File FASTQ: è il file di output grezzo della macchina di sequenziamento. Contiene le letture di DNA non processate, insieme ai punteggi di qualità che indicano l’affidabilità di ciascuna lettura. È uno dei formati più completi, poiché conserva le informazioni iniziali generate durante il sequenziamento. Tuttavia, è anche un file di grandi dimensioni e il suo utilizzo richiede conoscenze bioinformatiche, oltre a strumenti specifici per la sua elaborazione.
-
File VCF (Variant Call Format): è il risultato dell’elaborazione bioinformatica dei dati di sequenziamento dopo il loro allineamento e confronto con un genoma di riferimento (GRCh37). Contiene informazioni sulle varianti identificate nel DNA dell’utente, cioè quelle posizioni in cui è stata rilevata una differenza rispetto al genoma di riferimento. Questo formato è ampiamente utilizzato in genetica e bioinformatica per l’analisi, il filtraggio e l’interpretazione delle varianti genomiche.
-
File CRAM: è un formato binario compresso utilizzato per archiviare dati di sequenziamento genomico allineati a un genoma di riferimento (GRCh37). Contiene le informazioni delle letture di DNA ottenute dopo il sequenziamento, indicando in quale posizione del genoma di riferimento si allineano, insieme a dati di qualità e altri metadati tecnici. Richiede strumenti bioinformatici specifici e, in molti casi, il genoma di riferimento utilizzato durante l’allineamento per poter essere interpretato correttamente. Come il FASTQ, è un file tecnico e di grandi dimensioni, quindi è rivolto principalmente a utenti avanzati, bioinformatici o ricercatori.
