Fichiers disponibles dans la section téléchargement du test ULTRA

Mis à jour le

Dans la section de téléchargement du test ULTRA, vous pouvez trouver différents types de fichiers générés à partir de vos données de Séquençage du Génome Complet, WGS. Ces fichiers sont organisés en deux sections principales : « Téléchargements » et « Téléchargements techniques ».

Tout d’abord, la section « Téléchargements » comprend deux fichiers au format CSV, conçus pour offrir à l’utilisateur une expérience plus simple et plus accessible. Ces fichiers ont une structure similaire aux raw data générées par les plateformes de génotypage et sont pensés pour permettre aux utilisateurs non experts d’explorer leurs données génétiques plus facilement. De plus, ils ont été préparés pour faciliter leur utilisation éventuelle sur des plateformes tierces d’analyse génétique.

  • TMG MyVariants : est un fichier dont le format et le contenu ont été adaptés afin de maximiser la compatibilité avec les plateformes externes d’analyse génétique. Son objectif est d’offrir à l’utilisateur un fichier simple, structuré et similaire aux raw data de génotypage, facilitant ainsi la consultation d’une partie des informations génétiques obtenues par WGS.

  • TMG MyVariants Ultra : contient toutes les informations incluses dans TMG MyVariants et intègre également les variants pour lesquels votre génotype n’est pas référence/référence. Cela signifie qu’il permet de consulter de manière plus étendue les positions où votre ADN présente une différence par rapport au génome de référence. Ce fichier est conçu pour que l’utilisateur puisse explorer sa variabilité génétique plus simplement, sans avoir à travailler directement avec des fichiers bioinformatiques plus complexes.

Ensuite, la section « Téléchargements techniques » met à disposition de l’utilisateur des fichiers dans des formats habituels des flux d’analyse génomique. Ces fichiers s’adressent aux utilisateurs avancés, bioinformaticiens, chercheurs ou professionnels qui souhaitent réaliser des analyses techniques plus spécifiques.

  • Fichier FASTQ : il s’agit du fichier de sortie brut de la machine de séquençage. Il contient les lectures d’ADN non traitées, ainsi que les scores de qualité indiquant la fiabilité de chaque lecture. C’est l’un des formats les plus complets, car il conserve les informations initiales générées pendant le séquençage. Cependant, il s’agit également d’un fichier volumineux, et son utilisation nécessite des connaissances en bioinformatique ainsi que des outils spécifiques pour son traitement.

  • Fichier VCF (Variant Call Format) : il s’agit du résultat du traitement bioinformatique des données de séquençage après leur alignement et leur comparaison avec un génome de référence (GRCh37). Il contient des informations sur les variants identifiés dans l’ADN de l’utilisateur, c’est-à-dire les positions où une différence par rapport au génome de référence a été détectée. Ce format est largement utilisé en génétique et en bioinformatique pour l’analyse, le filtrage et l’interprétation des variants génomiques.

  • Fichier CRAM : il s’agit d’un format binaire compressé utilisé pour stocker des données de séquençage génomique alignées sur un génome de référence (GRCh37). Il contient les informations des lectures d’ADN obtenues après le séquençage, en indiquant à quelle position du génome de référence elles s’alignent, ainsi que des données de qualité et d’autres métadonnées techniques. Il nécessite des outils bioinformatiques spécifiques et, dans de nombreux cas, le génome de référence utilisé lors de l’alignement afin de pouvoir être interprété correctement. Comme le FASTQ, il s’agit d’un fichier technique et volumineux, destiné principalement aux utilisateurs avancés, bioinformaticiens ou chercheurs.