ULTRA test के downloads section में आप अपने Whole Genome Sequencing, WGS, data से generated विभिन्न प्रकार की files पा सकते हैं। ये files दो मुख्य sections में organized हैं: “Downloads” और “Technical downloads”.
सबसे पहले, “Downloads” section में CSV format की दो files शामिल हैं, जिन्हें user को अधिक simple और accessible experience देने के लिए design किया गया है। इन files की structure genotyping platforms द्वारा generated raw data जैसी है और इन्हें non-expert users के लिए बनाया गया है ताकि वे अपने genetic data को अधिक आसानी से explore कर सकें। इसके अलावा, इन्हें third-party genetic analysis platforms पर possible use को facilitate करने के लिए तैयार किया गया है।
-
TMG MyVariants: यह एक file है जिसका format और content external genetic analysis platforms के साथ compatibility को maximize करने के लिए adapted किया गया है। इसका उद्देश्य user को एक simple, structured file प्रदान करना है, जो genotyping raw data जैसी हो, जिससे WGS के माध्यम से प्राप्त genetic information के एक हिस्से को consult करना आसान हो जाता है।
-
TMG MyVariants Ultra: इसमें TMG MyVariants में included सारी information होती है और इसके अलावा वे variants भी शामिल होते हैं जिनमें आपका genotype reference/reference नहीं होता। इसका मतलब है कि यह उन positions को अधिक व्यापक रूप से consult करने की अनुमति देता है जहाँ आपका DNA reference genome से अलग है। यह file इस तरह design की गई है कि user अपनी genetic variability को अधिक सरल तरीके से explore कर सके, बिना अधिक complex bioinformatics files के साथ सीधे काम किए।
दूसरी ओर, “Technical downloads” section user को genomic analysis workflows में commonly used formats वाली files उपलब्ध कराता है। ये files advanced users, bioinformaticians, researchers या professionals के लिए focused हैं जो अधिक specific technical analyses करना चाहते हैं।
-
FASTQ file: यह sequencing machine की raw output file है। इसमें unprocessed DNA reads होते हैं, साथ ही quality scores भी होते हैं जो प्रत्येक read की reliability को indicate करते हैं। यह सबसे complete formats में से एक है, क्योंकि यह sequencing के दौरान generated initial information को preserve करता है। हालांकि, यह एक large file भी है और इसके use के लिए bioinformatics knowledge तथा processing के लिए specific tools की आवश्यकता होती है।
-
VCF file (Variant Call Format): यह sequencing data के alignment और reference genome से comparison के बाद bioinformatics processing का result है। इसमें user के DNA में identified variants की information होती है, यानी वे positions जहाँ reference genome (GRCh37) की तुलना में कोई difference detected हुआ है। यह format genetics और bioinformatics में genomic variants के analysis, filtering और interpretation के लिए widely used है।
-
CRAM file: यह एक compressed binary format है जिसका उपयोग reference genome के against aligned genomic sequencing data को store करने के लिए किया जाता है। इसमें sequencing के बाद obtained DNA reads की information होती है, जो बताती है कि वे reference genome (GRCh37) की किस position पर align होती हैं, साथ ही quality data और अन्य technical metadata भी शामिल होते हैं। इसे सही ढंग से interpret करने के लिए specific bioinformatics tools और कई मामलों में alignment के दौरान used reference genome की आवश्यकता होती है। FASTQ की तरह, यह भी एक technical और large file है, इसलिए यह mainly advanced users, bioinformaticians या researchers के लिए intended है।
