ULTRAテストのダウンロードセクションで利用可能なファイル

更新日

ULTRA検査のダウンロードセクションでは、全ゲノムシーケンシング(WGS)データから生成されたさまざまな種類のファイルを確認できます。これらのファイルは、「ダウンロード」と「技術ダウンロード」という2つの主要なセクションに整理されています。

まず、「ダウンロード」セクションには、ユーザーによりシンプルでアクセスしやすい体験を提供するために設計されたCSV形式の2つのファイルが含まれています。これらのファイルは、ジェノタイピングプラットフォームによって生成されるraw dataに似た構造を持ち、専門知識のないユーザーでも自身の遺伝データをより簡単に探索できるように設計されています。さらに、第三者の遺伝子解析プラットフォームでの利用を容易にするために準備されています。

  • TMG MyVariants外部の遺伝子解析プラットフォームとの互換性を最大限に高めるために、形式と内容が調整されたファイルです。その目的は、ユーザーにシンプルで構造化された、ジェノタイピングraw dataに似たファイルを提供し、WGSによって得られた遺伝情報の一部を確認しやすくすることです。

  • TMG MyVariants UltraTMG MyVariantsに含まれるすべての情報に加えて、あなたのジェノタイプがリファレンス/リファレンスではないバリアントも含まれています。つまり、あなたのDNAがリファレンスゲノムと異なる位置を、より広範に確認することができます。このファイルは、より複雑なバイオインフォマティクスファイルを直接扱うことなく、ユーザーが自身の遺伝的多様性をより簡単に探索できるように設計されています。

次に、「技術ダウンロード」セクションでは、ゲノム解析ワークフローで一般的に使用される形式のファイルをユーザーに提供しています。これらのファイルは、より具体的な技術解析を行いたい上級ユーザー、バイオインフォマティシャン、研究者、または専門家を対象としています。

  • FASTQファイル:シーケンシング装置から出力される生データファイルです。未処理のDNAリードと、各リードの信頼性を示す品質スコアが含まれています。シーケンシング中に生成された初期情報を保持しているため、最も完全な形式の1つです。ただし、ファイルサイズが大きく、使用にはバイオインフォマティクスの知識と処理用の専用ツールが必要です。

  • VCFファイル(Variant Call Format):シーケンシングデータをアラインメントし、リファレンスゲノムと比較した後のバイオインフォマティクス処理の結果です (GRCh37)。ユーザーのDNAで特定されたバリアント、つまりリファレンスゲノムとの差異が検出された位置に関する情報が含まれています。この形式は、ゲノムバリアントの解析、フィルタリング、解釈のために、遺伝学およびバイオインフォマティクスで広く使用されています。

  • CRAMファイル:リファレンスゲノムにアラインメントされたゲノムシーケンシングデータを保存するために使用される圧縮バイナリ形式です (GRCh37)。シーケンシング後に得られたDNAリードの情報が含まれ、リファレンスゲノム上のどの位置にアラインメントされるかを示すとともに、品質データやその他の技術的メタデータも含まれます。正しく解釈するには、専用のバイオインフォマティクスツールと、多くの場合、アラインメント時に使用されたリファレンスゲノムが必要です。FASTQと同様に、技術的かつ大容量のファイルであるため、主に上級ユーザー、バイオインフォマティシャン、または研究者を対象としています。