I downloadsektionen for ULTRA-testen kan du finde forskellige typer filer, der er genereret ud fra dine data fra helgenomsekventering, WGS. Disse filer er organiseret i to hovedafsnit: “Downloads” og “Tekniske downloads”.
For det første omfatter afsnittet “Downloads” to filer i CSV-format, der er designet til at give brugeren en enklere og mere tilgængelig oplevelse. Disse filer har en struktur, der ligner raw data genereret af genotypningsplatforme, og er beregnet til, at ikke-ekspertbrugere kan udforske deres genetiske data på en mere brugervenlig måde. Derudover er de forberedt for at lette deres mulige brug på tredjepartsplatforme til genetisk analyse.
-
TMG MyVariants: er en fil, hvis format og indhold er tilpasset for at maksimere kompatibiliteten med eksterne platforme til genetisk analyse. Formålet er at tilbyde brugeren en enkel, struktureret fil, der ligner raw data fra genotypning, og dermed gøre det lettere at konsultere en del af den genetiske information, der er opnået via WGS.
-
TMG MyVariants Ultra: indeholder alle oplysningerne i TMG MyVariants og inkluderer desuden de varianter, hvor din genotype ikke er reference/reference. Det betyder, at filen gør det muligt at konsultere de positioner mere omfattende, hvor dit DNA adskiller sig fra referencegenomet. Denne fil er designet, så brugeren kan udforske sin genetiske variabilitet på en enklere måde uden at skulle arbejde direkte med mere komplekse bioinformatiske filer.
For det andet stiller afsnittet “Tekniske downloads” filer til rådighed for brugeren i formater, der er almindelige inden for genomiske analysearbejdsgange. Disse filer er rettet mod avancerede brugere, bioinformatikere, forskere eller fagfolk, der ønsker at udføre mere specifikke tekniske analyser.
-
FASTQ-fil: er den rå outputfil fra sekventeringsmaskinen. Den indeholder de ubehandlede DNA-læsninger sammen med kvalitetsscorer, der angiver pålideligheden af hver læsning. Det er et af de mest komplette formater, da det bevarer den oprindelige information, der genereres under sekventeringen. Det er dog også en stor fil, og brugen kræver bioinformatisk viden samt specifikke værktøjer til behandling.
-
VCF-fil (Variant Call Format): er resultatet af den bioinformatiske behandling af sekventeringsdata efter deres alignering og sammenligning med et referencegenom. Den indeholder information om de varianter, der er identificeret i brugerens DNA, dvs. de positioner, hvor der er påvist en forskel i forhold til referencegenomet. Dette format anvendes bredt inden for genetik og bioinformatik til analyse, filtrering og fortolkning af genomiske varianter.
-
CRAM-fil: er et komprimeret binært format, der bruges til at lagre genomiske sekventeringsdata aligneret mod et referencegenom. Den indeholder information om de DNA-læsninger, der er opnået efter sekventeringen, og angiver, på hvilken position i referencegenomet de aligneres, sammen med kvalitetsdata og andre tekniske metadata. Den kræver specifikke bioinformatiske værktøjer og i mange tilfælde det referencegenom, der blev brugt under aligneringen, for at kunne fortolkes korrekt. Ligesom FASTQ er det en teknisk og stor fil, og den er derfor primært rettet mod avancerede brugere, bioinformatikere eller forskere.
