Die CRAM-Datei ist ein komprimiertes Format, das zur Speicherung genomischer Sequenzierungsdaten verwendet wird, die zuvor gegen ein Referenzgenom ausgerichtet wurden. Im Zusammenhang mit der Ganzgenomsequenzierung (WGS), die die Analyse von 100 % Ihrer DNA ermöglicht, enthält die CRAM-Datei die durch die Sequenzierung erzeugten DNA-Reads sowie deren Position innerhalb des Referenzgenoms und die zugehörigen Qualitätsinformationen.
Im Gegensatz zur FASTQ-Datei, die die Rohdaten enthält, die direkt von der Sequenzierungsmaschine erzeugt werden, stellt die CRAM-Datei einen späteren Schritt der bioinformatischen Analyse dar. Das bedeutet, dass die Reads bereits verarbeitet und ausgerichtet wurden, sodass bestimmt werden kann, in welcher Region des Genoms sich jedes DNA-Fragment befindet.
CRAM wird von Bioinformatikern, Genetikern und Forschern verwendet, die fortgeschrittene Analysen ausgerichteter genomischer Daten durchführen möchten, wie z. B. die Überprüfung bestimmter Genomregionen, die Identifizierung von Varianten, die Analyse der Abdeckung oder die Validierung bestimmter genetischer Befunde. Es ist auch nützlich für Nutzer, die eine verarbeitete und kompaktere Version ihrer genomischen Daten für zukünftige Analysen aufbewahren möchten.
Eigenschaften der CRAM-Datei:
-
Hohe Komprimierung: Benötigt dank eines effizienteren Komprimierungssystems weniger Speicherplatz als andere ausgerichtete Formate.
-
Ausgerichtete Reads: Enthält Informationen über die Position jedes Reads im Referenzgenom.
-
Qualitätsinformationen: Bewahrt relevante technische Daten wie Qualitätswerte und andere Metadaten im Zusammenhang mit der Sequenzierung und Ausrichtung auf.
-
Speichereffizienz: Besonders nützlich für WGS-Daten, da große Mengen genomischer Informationen kompakter gespeichert werden können.
Einschränkungen
-
Abhängigkeit vom Referenzgenom: Um eine CRAM-Datei korrekt lesen und interpretieren zu können, ist in der Regel dasselbe Referenzgenom erforderlich, das während der Ausrichtung verwendet wurde.
-
Nicht für Menschen direkt lesbar: Sie können eine CRAM-Datei nicht direkt „lesen“, um Informationen über Ihre genetischen Merkmale oder Prädispositionen zu erhalten. Dafür sind spezifische bioinformatische Werkzeuge zur Visualisierung oder Analyse erforderlich.
-
Erfordert technisches Fachwissen: Die Nutzung richtet sich an fortgeschrittene Nutzer, Bioinformatiker oder Fachleute, die mit der Analyse genomischer Daten vertraut sind.
Formate und Download:
Neben CRAM bieten wir auch andere technische Formate wie FASTQ und VCF an. Sie können diese Dateien direkt über Ihr tellmeGen-Benutzerkonto herunterladen.
Technische Anforderungen:
-
Betriebssystem: Linux oder macOS wird empfohlen, obwohl die Nutzung auch unter Windows mit kompatiblen Tools oder Umgebungen wie WSL möglich ist.
-
Spezifische Software: Bioinformatische Werkzeuge wie samtools, IGV, bcftools oder andere spezialisierte Programme.
-
RAM: Für WGS-Analysen werden 32 GB oder mehr empfohlen.
-
Speicherplatz: Obwohl die CRAM-Datei weniger Speicherplatz benötigt als FASTQ, wird empfohlen, über ausreichend Speicherkapazität zu verfügen, um mit vollständigen genomischen Daten arbeiten zu können.
Dieses Format eignet sich für fortgeschrittene Nutzer, die mit bereits ausgerichteten genomischen Daten arbeiten und spezifischere, effizientere und detailliertere technische Analysen ihres vollständigen Genoms durchführen möchten.
