Файлы, доступные в разделе загрузок теста ULTRA

Обновлено

В разделе загрузок теста ULTRA вы можете найти различные типы файлов, созданных на основе ваших данных полногеномного секвенирования, WGS. Эти файлы организованы в два основных раздела: «Загрузки» и «Технические загрузки».

Во-первых, раздел «Загрузки» включает два файла в формате CSV, разработанные для более простого и доступного пользовательского опыта. Эти файлы имеют структуру, похожую на raw data, генерируемые платформами генотипирования, и предназначены для того, чтобы пользователи без специальных знаний могли удобнее изучать свои генетические данные. Кроме того, они подготовлены для облегчения их возможного использования на сторонних платформах генетического анализа.

  • TMG MyVariants: это файл, формат и содержание которого были адаптированы для максимальной совместимости с внешними платформами генетического анализа. Его цель — предоставить пользователю простой, структурированный файл, похожий на raw data генотипирования, тем самым облегчая просмотр части генетической информации, полученной с помощью WGS.

  • TMG MyVariants Ultra: содержит всю информацию, включённую в TMG MyVariants, а также включает те варианты, в которых ваш генотип не является референс/референс. Это означает, что он позволяет более широко просматривать позиции, в которых ваша ДНК отличается от референсного генома. Этот файл разработан для того, чтобы пользователь мог проще изучать свою генетическую вариабельность без необходимости напрямую работать с более сложными биоинформатическими файлами.

Во-вторых, раздел «Технические загрузки» предоставляет пользователю файлы в форматах, обычно используемых в рабочих процессах геномного анализа. Эти файлы предназначены для продвинутых пользователей, биоинформатиков, исследователей или специалистов, которые хотят выполнять более специфические технические анализы.

  • Файл FASTQ: это исходный сырой файл, получаемый с секвенатора. Он содержит необработанные ДНК-риды вместе с показателями качества, которые указывают надёжность каждого рида. Это один из наиболее полных форматов, поскольку он сохраняет исходную информацию, сгенерированную во время секвенирования. Однако это также файл большого размера, и его использование требует биоинформатических знаний, а также специальных инструментов для обработки.

  • Файл VCF (Variant Call Format): это результат биоинформатической обработки данных секвенирования после их выравнивания и сравнения с референсным геномом (GRCh37). Он содержит информацию о вариантах, выявленных в ДНК пользователя, то есть о позициях, где было обнаружено отличие от референсного генома. Этот формат широко используется в генетике и биоинформатике для анализа, фильтрации и интерпретации геномных вариантов.

  • Файл CRAM: это сжатый бинарный формат, используемый для хранения данных геномного секвенирования, выровненных относительно референсного генома (GRCh37). Он содержит информацию о ДНК-ридах, полученных после секвенирования, указывая, в какой позиции референсного генома они выравниваются, а также данные качества и другие технические метаданные. Для его правильной интерпретации требуются специальные биоинформатические инструменты и во многих случаях референсный геном, использованный при выравнивании. Как и FASTQ, это технический файл большого размера, поэтому он ориентирован главным образом на продвинутых пользователей, биоинформатиков или исследователей.