VCF फ़ाइल क्या है और इसका क्या उपयोग है?

अपडेट किया गया

VCF (Variant Call Format) फ़ाइल आपके डेटा को FASTQ प्रारूप में संसाधित करने का परिणाम है। यह फ़ाइल आपके कच्चे डीएनए की तुलना "संदर्भ जीनोम" (एक मानक मानव मॉडल) से करती है। VCF फ़ाइल उन स्थानों को सूचीबद्ध करती है जहाँ आपका डीएनए संदर्भ जीनोम से भिन्न होता है, यानी आपकी आनुवंशिकी में पाए जाने वाले वेरिएंट (SNPs, सम्मिलन या विलोपन)।

VCF फ़ाइलें आमतौर पर .vcf.gz प्रारूप में संपीड़ित होती हैं। जैव सूचना विज्ञान उपकरण इन संपीड़ित फ़ाइलों को सीधे पढ़ने के लिए डिज़ाइन किए गए हैं, हालाँकि इन्हें 7zip या gzip जैसे उपकरणों के साथ डीकंप्रेस भी किया जा सकता है।

यह किसके लिए उपयोगी है?

  • जिज्ञासु उपयोगकर्ता: यदि आप किसी विशिष्ट आनुवंशिक उत्परिवर्तन को खोजना चाहते हैं (उदाहरण के लिए, गुणसूत्र 14, स्थिति 64877827 पर MTHFD1 जीन में)।
  • तृतीय-पक्ष विश्लेषण: यदि आप अपने डेटा को अन्य सेवाओं पर अपलोड करना चाहते हैं जो पूर्वजता या स्वास्थ्य के बारे में जानकारी प्राप्त करने के लिए WGS डेटा स्वीकार करती हैं, तो यह प्रारूप आवश्यक मानक है।

ताकत

  • कार्रवाई योग्य: इस फ़ाइल में वास्तविक आनुवंशिक डेटा होता है।
  • कॉम्पैक्ट: केवल अंतरों को सूचीबद्ध करके, यह कच्चे FASTQ फ़ाइलों (FASTQ के बारे में प्रश्न का लिंक) की तुलना में बहुत छोटा होता है।

सीमाएँ

  • संसाधित डेटा: फ़ाइल tellmeGen द्वारा उपयोग किए गए वर्तमान संदर्भ जीनोम (GRCh37) पर निर्भर करती है। यदि संदर्भ मॉडल बदलता है, तो यह फ़ाइल पुरानी हो जाएगी, जो कि FASTQ फ़ाइल के विपरीत है।

फ़ाइल को कैसे खोलें और उपयोग करें

  • बुनियादी उपयोग: डीकंप्रेस करने के बाद, इसे टेक्स्ट फ़ाइल के रूप में खोला जा सकता है (Windows पर Notepad++ के साथ, Mac पर TextMate के साथ)।
  • उन्नत उपयोग: वेरिएंट को दृश्य रूप से देखने के लिए VCF व्यूअर या Integrative Genomics Viewer (IGV) का उपयोग करें। आप अपनी VCF फ़ाइल के साथ संचालन करने के लिए Galaxy जैसे तृतीय-पक्ष टूल का भी उपयोग कर सकते हैं।

सिस्टम आवश्यकताएँ

  • ऑपरेटिंग सिस्टम: Windows, Mac या Linux।
  • RAM: 8GB मानक।
  • भंडारण: <1GB।