CRAM-filen är ett komprimerat format som används för att lagra genomiska sekvenseringsdata som tidigare har alignerats mot ett referensgenom. I samband med helgenomsekvensering (WGS), som gör det möjligt att analysera 100 % av ditt DNA, innehåller CRAM-filen de DNA-läsningar som genereras genom sekvenseringen, tillsammans med deras position i referensgenomet och tillhörande kvalitetsinformation.
Till skillnad från FASTQ-filen, som innehåller rådata som genereras direkt av sekvenseringsmaskinen, representerar CRAM-filen ett senare steg i den bioinformatiska analysen. Det innebär att läsningarna redan har bearbetats och alignerats, vilket gör det möjligt att veta i vilken region av genomet varje DNA-fragment är placerat.
CRAM används av bioinformatiker, genetiker och forskare som vill utföra avancerade analyser av alignerade genomiska data, till exempel granskning av specifika regioner i genomet, identifiering av varianter, täckningsanalys eller validering av vissa genetiska fynd. Det är även användbart för användare som vill spara en bearbetad och mer kompakt version av sina genomiska data för framtida analyser.
Egenskaper hos CRAM-filen:
-
Hög komprimering: Tar mindre plats än andra alignerade format tack vare ett mer effektivt komprimeringssystem.
-
Alignerade läsningar: Innehåller information om positionen för varje läsning i referensgenomet.
-
Kvalitetsinformation: Bevarar relevanta tekniska data, såsom kvalitetspoäng och andra metadata kopplade till sekvensering och alignering.
-
Lagringseffektivitet: Är särskilt användbar för WGS-data, eftersom den gör det möjligt att lagra stora mängder genomisk information på ett mer kompakt sätt.
Begränsningar
-
Beroende av referensgenomet: För att kunna läsa och tolka en CRAM-fil korrekt krävs vanligtvis samma referensgenom som användes under aligneringen.
-
Inte läsbar direkt för människor: Du kan inte “läsa” en CRAM-fil direkt för att få information om dina genetiska egenskaper eller predispositioner. Den kräver specifika bioinformatiska verktyg för att visualiseras eller analyseras.
-
Kräver teknisk kunskap: Användningen är avsedd för avancerade användare, bioinformatiker eller yrkespersoner som är vana vid analys av genomiska data.
Format och nedladdning:
Utöver CRAM erbjuder vi även andra tekniska format som FASTQ och VCF. Du kan ladda ner dessa filer direkt från ditt tellmeGen-användarkonto.
Tekniska krav:
-
Operativsystem: Linux eller macOS rekommenderas, även om det också kan användas i Windows med kompatibla verktyg eller miljöer som WSL.
-
Specifik programvara: Bioinformatiska verktyg såsom samtools, IGV, bcftools eller andra specialiserade program.
-
RAM: 32 GB eller mer rekommenderas för WGS-analyser.
-
Lagring: Även om CRAM-filen tar mindre plats än FASTQ rekommenderas det att ha tillräcklig lagringskapacitet för att arbeta med fullständiga genomiska data.
Detta format är lämpligt för avancerade användare som vill arbeta med redan alignerade genomiska data och utföra mer specifika, effektiva och detaljerade tekniska analyser av hela sitt genom.
