Filer tillgängliga i nedladdningssektionen för ULTRA-testet

Uppdaterad den

I nedladdningssektionen för ULTRA-testet kan du hitta olika typer av filer som genererats från dina data från helgenomsekvensering, WGS. Dessa filer är organiserade i två huvudavsnitt: “Nedladdningar” och “Tekniska nedladdningar”.

För det första innehåller avsnittet “Nedladdningar” två filer i CSV-format, utformade för att ge användaren en enklare och mer tillgänglig upplevelse. Dessa filer har en struktur som liknar raw data som genereras av genotypningsplattformar och är avsedda för att icke-expertanvändare ska kunna utforska sina genetiska data på ett smidigare sätt. Dessutom har de förberetts för att underlätta eventuell användning på tredjepartsplattformar för genetisk analys.

  • TMG MyVariants: är en fil vars format och innehåll har anpassats för att maximera kompatibiliteten med externa plattformar för genetisk analys. Syftet är att erbjuda användaren en enkel, strukturerad fil som liknar raw data från genotypning, vilket gör det lättare att konsultera en del av den genetiska information som erhållits genom WGS.

  • TMG MyVariants Ultra: innehåller all information som ingår i TMG MyVariants och inkluderar dessutom de varianter där din genotyp inte är referens/referens. Det innebär att filen gör det möjligt att på ett bredare sätt konsultera de positioner där ditt DNA skiljer sig från referensgenomet. Denna fil är utformad för att användaren ska kunna utforska sin genetiska variabilitet på ett enklare sätt utan att behöva arbeta direkt med mer komplexa bioinformatiska filer.

För det andra tillhandahåller avsnittet “Tekniska nedladdningar” filer i format som är vanliga inom genomiska analysflöden. Dessa filer är inriktade på avancerade användare, bioinformatiker, forskare eller yrkespersoner som vill utföra mer specifika tekniska analyser.

  • FASTQ-fil: är den råa utdatafilen från sekvenseringsmaskinen. Den innehåller obearbetade DNA-läsningar tillsammans med kvalitetspoäng som anger tillförlitligheten för varje läsning. Det är ett av de mest kompletta formaten, eftersom det bevarar den ursprungliga informationen som genereras under sekvenseringen. Det är dock också en stor fil och användningen kräver bioinformatisk kunskap samt specifika verktyg för bearbetning.

  • VCF-fil (Variant Call Format): är resultatet av den bioinformatiska bearbetningen av sekvenseringsdata efter alignering och jämförelse med ett referensgenom (GRCh37). Den innehåller information om de varianter som identifierats i användarens DNA, det vill säga de positioner där en skillnad jämfört med referensgenomet har upptäckts. Detta format används ofta inom genetik och bioinformatik för analys, filtrering och tolkning av genomiska varianter.

  • CRAM-fil: är ett komprimerat binärt format som används för att lagra genomiska sekvenseringsdata alignerade mot ett referensgenom (GRCh37). Den innehåller information om de DNA-läsningar som erhållits efter sekvenseringen och anger vid vilken position i referensgenomet de aligneras, tillsammans med kvalitetsdata och andra tekniska metadata. Den kräver specifika bioinformatiska verktyg och, i många fall, det referensgenom som användes under aligneringen för att kunna tolkas korrekt. Precis som FASTQ är det en teknisk och stor fil, och den är därför främst avsedd för avancerade användare, bioinformatiker eller forskare.