একটি CRAM ফাইল কী এবং WGS (হোল জিনোম সিকোয়েন্সিং) বিশ্লেষণে এটি কীভাবে ব্যবহার করা হয়?

আপডেট করা হয়েছে

CRAM ফাইল হল একটি সংকুচিত বিন্যাস যা একটি রেফারেন্স জিনোমের বিরুদ্ধে পূর্ব-সাজানো জিনোমিক সিকোয়েন্সিং ডেটা সংরক্ষণ করতে ব্যবহৃত হয়। পুরো জিনোম সিকোয়েন্সিং (WGS) এর পরিপ্রেক্ষিতে, যা আপনার 100% DNA বিশ্লেষণ করতে দেয়, CRAM ফাইলে সিকোয়েন্সিং দ্বারা তৈরি DNA রিড, রেফারেন্স জিনোমের মধ্যে তাদের অবস্থান এবং সংশ্লিষ্ট মানের তথ্য থাকে।

একটি FASTQ ফাইলের বিপরীতে, যা সরাসরি সিকোয়েন্সিং মেশিন দ্বারা উত্পাদিত কাঁচা ডেটা ধারণ করে, CRAM ফাইল বায়োইনফরমেটিক্স বিশ্লেষণের একটি পরবর্তী পর্যায়কে উপস্থাপন করে। এর মানে হল যে রিডগুলি ইতিমধ্যেই প্রক্রিয়া করা হয়েছে এবং সাজানো হয়েছে, যা জেনে নিতে দেয় যে DNA-এর প্রতিটি খণ্ড জিনোমের কোন অঞ্চলে অবস্থিত।

CRAM বায়োইনফরমেটিক্স, জেনেটিসিস্ট এবং গবেষকদের দ্বারা ব্যবহৃত হয় যারা সাজানো জিনোমিক ডেটার উপর উন্নত বিশ্লেষণ করতে চান, যেমন জিনোমের নির্দিষ্ট অঞ্চলগুলি পর্যালোচনা করা, ভেরিয়েন্টগুলি সনাক্ত করা, কভারেজ বিশ্লেষণ করা, অথবা নির্দিষ্ট জেনেটিক ফলাফলগুলি যাচাই করা। এটি এমন ব্যবহারকারীদের জন্যও কার্যকর যারা ভবিষ্যতের বিশ্লেষণের জন্য তাদের জিনোমিক ডেটার একটি প্রক্রিয়াজাত এবং আরও কমপ্যাক্ট সংস্করণ সংরক্ষণ করতে চান।

CRAM ফাইলের বৈশিষ্ট্য: 

  • উচ্চ কম্প্রেশন: এটি অন্যান্য সাজানো বিন্যাসগুলির চেয়ে কম জায়গা নেয় কারণ এটি আরও দক্ষ কম্প্রেশন সিস্টেম ব্যবহার করে।

  • সাজানো রিড: এতে রেফারেন্স জিনোমে প্রতিটি রিডের অবস্থান সম্পর্কে তথ্য থাকে। 

  • মানের তথ্য: এটি প্রাসঙ্গিক প্রযুক্তিগত ডেটা সংরক্ষণ করে, যেমন গুণমানের স্কোর এবং সিকোয়েন্সিং এবং অ্যালাইনমেন্টের সাথে সম্পর্কিত অন্যান্য মেটাডেটা।

  • স্টোরেজ দক্ষতা: এটি WGS ডেটার জন্য বিশেষভাবে উপযোগী, কারণ এটি বড় পরিমাণের জিনোমিক তথ্য আরও কমপ্যাক্ট উপায়ে সংরক্ষণ করতে দেয়।

সীমাবদ্ধতা

  • রেফারেন্স জিনোমের উপর নির্ভরশীলতা: একটি CRAM ফাইল সঠিকভাবে পড়তে এবং ব্যাখ্যা করতে, সাধারণত অ্যালাইনমেন্টের সময় ব্যবহৃত একই রেফারেন্স জিনোম থাকা প্রয়োজন।

  • মানুষের জন্য পঠনযোগ্য নয়: আপনার জেনেটিক বৈশিষ্ট্য বা প্রবণতা সম্পর্কে তথ্য পেতে আপনি সরাসরি একটি CRAM ফাইল "পড়তে" পারবেন না। এটি দেখতে বা বিশ্লেষণ করার জন্য নির্দিষ্ট বায়োইনফরমেটিক্স সরঞ্জাম প্রয়োজন।

  • প্রযুক্তিগত জ্ঞান প্রয়োজন: এর ব্যবহার উন্নত ব্যবহারকারী, বায়োইনফরমেটিক্স বা জিনোমিক ডেটা বিশ্লেষণে পরিচিত পেশাদারদের জন্য নির্দেশিত।

বিন্যাস এবং ডাউনলোড:

CRAM ছাড়াও, আমরা FASTQ এবং VCF এর মতো অন্যান্য প্রযুক্তিগত বিন্যাসও অফার করি। আপনি tellmeGen-এ আপনার ব্যবহারকারী অ্যাকাউন্ট থেকে সরাসরি এই ফাইলগুলি ডাউনলোড করতে পারেন।

প্রযুক্তিগত প্রয়োজনীয়তা:

  • অপারেটিং সিস্টেম: লিনাক্স বা ম্যাকওএস সুপারিশ করা হয়, যদিও এটি সামঞ্জস্যপূর্ণ সরঞ্জাম বা WSL এর মতো পরিবেশ ব্যবহার করে উইন্ডোজেও ব্যবহার করা যেতে পারে।

  • নির্দিষ্ট সফটওয়্যার: বায়োইনফরমেটিক্স সরঞ্জাম যেমন samtools, IGV, bcftools বা অন্যান্য বিশেষ প্রোগ্রাম।

  • RAM: WGS বিশ্লেষণের জন্য 32 GB বা তার বেশি সুপারিশ করা হয়।

  • স্টোরেজ: যদিও CRAM ফাইল FASTQ এর চেয়ে কম জায়গা নেয়, তবে পুরো জিনোমিক ডেটা নিয়ে কাজ করার জন্য পর্যাপ্ত স্টোরেজ ক্ষমতা রাখার পরামর্শ দেওয়া হয়।

এই বিন্যাসটি উন্নত ব্যবহারকারীদের জন্য উপযুক্ত যারা ইতিমধ্যে সাজানো জিনোমিক ডেটা নিয়ে কাজ করতে চান এবং তাদের পুরো জিনোমের আরও নির্দিষ্ট, দক্ষ এবং বিস্তারিত প্রযুক্তিগত বিশ্লেষণ করতে চান।