Im Download-Bereich des ULTRA-Tests verfügbare Dateien

Aktualisiert am

Im Download-Bereich des ULTRA-Tests finden Sie verschiedene Dateitypen, die aus Ihren Daten der Ganzgenomsequenzierung, WGS, generiert wurden. Diese Dateien sind in zwei Hauptbereiche unterteilt: „Downloads“ und „Technische Downloads“.

Zunächst umfasst der Bereich „Downloads“ zwei Dateien im CSV-Format, die darauf ausgelegt sind, dem Nutzer eine einfachere und zugänglichere Erfahrung zu bieten. Diese Dateien haben eine ähnliche Struktur wie die von Genotypisierungsplattformen generierten Raw Data und sind dafür gedacht, dass auch nicht fachkundige Nutzer ihre genetischen Daten komfortabler erkunden können. Außerdem wurden sie vorbereitet, um eine mögliche Nutzung auf Drittanbieterplattformen für genetische Analysen zu erleichtern.

  • TMG MyVariants: ist eine Datei, deren Format und Inhalt angepasst wurden, um die Kompatibilität mit externen Plattformen für genetische Analysen zu maximieren. Ziel ist es, dem Nutzer eine einfache, strukturierte Datei anzubieten, die den Raw Data der Genotypisierung ähnelt und so die Abfrage eines Teils der durch WGS gewonnenen genetischen Informationen erleichtert.

  • TMG MyVariants Ultra: enthält alle Informationen aus TMG MyVariants und zusätzlich jene Varianten, bei denen Ihr Genotyp nicht Referenz/Referenz ist. Das bedeutet, dass die Datei eine umfassendere Abfrage der Positionen ermöglicht, an denen sich Ihre DNA vom Referenzgenom unterscheidet. Diese Datei wurde entwickelt, damit der Nutzer seine genetische Variabilität auf einfachere Weise erkunden kann, ohne direkt mit komplexeren bioinformatischen Dateien arbeiten zu müssen.

Zweitens stellt der Bereich „Technische Downloads“ dem Nutzer Dateien in Formaten zur Verfügung, die in genomischen Analyse-Workflows üblich sind. Diese Dateien richten sich an fortgeschrittene Nutzer, Bioinformatiker, Forscher oder Fachleute, die spezifischere technische Analysen durchführen möchten.

  • FASTQ-Datei: ist die rohe Ausgabedatei der Sequenzierungsmaschine. Sie enthält die unverarbeiteten DNA-Reads zusammen mit den Qualitätswerten, die die Zuverlässigkeit jedes Reads angeben. Es ist eines der vollständigsten Formate, da es die während der Sequenzierung erzeugten Ausgangsinformationen bewahrt. Allerdings handelt es sich auch um eine sehr große Datei, deren Nutzung bioinformatische Kenntnisse sowie spezifische Werkzeuge zur Verarbeitung erfordert.

  • VCF-Datei (Variant Call Format): ist das Ergebnis der bioinformatischen Verarbeitung der Sequenzierungsdaten nach deren Ausrichtung und dem Vergleich mit einem Referenzgenom (GRCh37). Sie enthält Informationen über die im DNA des Nutzers identifizierten Varianten, also jene Positionen, an denen ein Unterschied zum Referenzgenom festgestellt wurde. Dieses Format wird in der Genetik und Bioinformatik häufig für die Analyse, Filterung und Interpretation genomischer Varianten verwendet.

  • CRAM-Datei: ist ein komprimiertes Binärformat zur Speicherung genomischer Sequenzierungsdaten, die gegen ein Referenzgenom (GRCh37) ausgerichtet wurden. Sie enthält die Informationen der nach der Sequenzierung erhaltenen DNA-Reads und gibt an, an welcher Position des Referenzgenoms sie ausgerichtet sind, zusammen mit Qualitätsdaten und weiteren technischen Metadaten. Für die korrekte Interpretation sind spezifische bioinformatische Werkzeuge und in vielen Fällen das während der Ausrichtung verwendete Referenzgenom erforderlich. Wie FASTQ ist sie eine technische und große Datei und richtet sich daher hauptsächlich an fortgeschrittene Nutzer, Bioinformatiker oder Forscher.