In de downloadsectie van de ULTRA-test kun je verschillende soorten bestanden vinden die zijn gegenereerd uit je Whole Genome Sequencing-gegevens, WGS. Deze bestanden zijn georganiseerd in twee hoofdonderdelen: “Downloads” en “Technische downloads”.
Ten eerste bevat het onderdeel “Downloads” twee bestanden in CSV-formaat, ontworpen om de gebruiker een eenvoudigere en toegankelijkere ervaring te bieden. Deze bestanden hebben een structuur die vergelijkbaar is met de raw data die worden gegenereerd door genotyperingsplatforms en zijn bedoeld zodat niet-deskundige gebruikers hun genetische gegevens gemakkelijker kunnen verkennen. Daarnaast zijn ze voorbereid om mogelijk gebruik op externe platforms voor genetische analyse te vergemakkelijken.
-
TMG MyVariants: is een bestand waarvan het formaat en de inhoud zijn aangepast om de compatibiliteit met externe platforms voor genetische analyse te maximaliseren. Het doel is om de gebruiker een eenvoudig, gestructureerd bestand te bieden dat vergelijkbaar is met genotyperings-raw data, waardoor het raadplegen van een deel van de via WGS verkregen genetische informatie wordt vergemakkelijkt.
-
TMG MyVariants Ultra: bevat alle informatie die is opgenomen in TMG MyVariants en bevat daarnaast de varianten waarbij jouw genotype niet referentie/referentie is. Dit betekent dat je uitgebreider de posities kunt raadplegen waar jouw DNA een verschil vertoont ten opzichte van het referentiegenoom. Dit bestand is ontworpen zodat de gebruiker zijn genetische variabiliteit eenvoudiger kan verkennen, zonder rechtstreeks met complexere bio-informaticabestanden te hoeven werken.
Ten tweede stelt het onderdeel “Technische downloads” bestanden beschikbaar in formaten die gebruikelijk zijn binnen genomische analyseworkflows. Deze bestanden zijn gericht op gevorderde gebruikers, bio-informatici, onderzoekers of professionals die specifiekere technische analyses willen uitvoeren.
-
FASTQ-bestand: is het ruwe uitvoerbestand van de sequencingmachine. Het bevat de onbewerkte DNA-reads, samen met de kwaliteitsscores die de betrouwbaarheid van elke read aangeven. Het is een van de meest volledige formaten, omdat het de oorspronkelijke informatie bewaart die tijdens sequencing wordt gegenereerd. Het is echter ook een groot bestand en het gebruik ervan vereist bio-informaticakennis, evenals specifieke tools voor verwerking.
-
VCF-bestand (Variant Call Format): is het resultaat van de bio-informatische verwerking van sequencinggegevens na uitlijning en vergelijking met een referentiegenoom (GRCh37). Het bevat informatie over de varianten die in het DNA van de gebruiker zijn geïdentificeerd, dat wil zeggen de posities waar een verschil ten opzichte van het referentiegenoom is gedetecteerd. Dit formaat wordt veel gebruikt in genetica en bio-informatica voor de analyse, filtering en interpretatie van genomische varianten.
-
CRAM-bestand: is een gecomprimeerd binair formaat dat wordt gebruikt om genomische sequencinggegevens op te slaan die zijn uitgelijnd met een referentiegenoom (GRCh37). Het bevat de informatie van de DNA-reads die na sequencing zijn verkregen, waarbij wordt aangegeven op welke positie in het referentiegenoom ze worden uitgelijnd, samen met kwaliteitsgegevens en andere technische metadata. Het vereist specifieke bio-informaticatools en in veel gevallen het referentiegenoom dat tijdens de uitlijning is gebruikt om het correct te kunnen interpreteren. Net als FASTQ is het een technisch en groot bestand, waardoor het voornamelijk bedoeld is voor gevorderde gebruikers, bio-informatici of onderzoekers.
