En la sección de descargas del test ULTRA puedes encontrar diferentes tipos de archivos generados a partir de tus datos de Secuenciación del Genoma Completo, WGS. Estos archivos se organizan en dos apartados principales: “Descargas” y “Descargas técnicas”.
En primer lugar, el apartado de “Descargas” incluye dos archivos en formato CSV, diseñados para ofrecer una experiencia más sencilla y accesible al usuario. Estos archivos tienen una estructura similar a los raw data generados por plataformas de genotipado y están pensados para que usuarios no expertos puedan explorar sus datos genéticos de forma más cómoda. Además, han sido preparados para facilitar su posible uso en plataformas de análisis genético de terceros.
-
TMG MyVariants: es un archivo cuyo formato y contenido han sido adaptados para maximizar la compatibilidad con plataformas externas de análisis genético. Su objetivo es ofrecer al usuario un archivo sencillo, estructurado y similar a los raw data de genotipado, facilitando así la consulta de parte de la información genética obtenida mediante WGS.
-
TMG MyVariants Ultra: contiene toda la información incluida en TMG MyVariants y, además, incorpora aquellas variantes en las que tu genotipo no es referencia/referencia. Esto significa que permite consultar de forma más amplia las posiciones en las que tu ADN presenta alguna diferencia respecto al genoma de referencia. Este archivo está diseñado para que el usuario pueda explorar de una forma más sencilla su variabilidad genética, sin necesidad de trabajar directamente con archivos bioinformáticos más complejos.
En segundo lugar, el apartado de “Descargas técnicas” pone a disposición del usuario archivos en formatos habituales dentro de los flujos de análisis genómico. Estos archivos están enfocados a usuarios avanzados, bioinformáticos, investigadores o profesionales que desean realizar análisis técnicos más específicos.
-
Archivo FASTQ: es el archivo de salida crudo de la máquina de secuenciación. Contiene las lecturas de ADN no procesadas, junto con las puntuaciones de calidad que indican la fiabilidad de cada lectura. Es uno de los formatos más completos, ya que conserva la información inicial generada durante la secuenciación. Sin embargo, también es un archivo de gran tamaño y su uso requiere conocimientos bioinformáticos, así como herramientas específicas para su procesamiento.
-
Archivo VCF (Variant Call Format): es el resultado del procesamiento bioinformático de los datos de secuenciación tras su alineamiento y comparación con un genoma de referencia (GRCh37). Contiene información sobre las variantes identificadas en el ADN del usuario, es decir, aquellas posiciones donde se ha detectado una diferencia respecto al genoma de referencia. Este formato es ampliamente utilizado en genética y bioinformática para el análisis, filtrado e interpretación de variantes genómicas.
-
Archivo CRAM: es un formato binario comprimido utilizado para almacenar datos de secuenciación genómica alineados contra un genoma de referencia (GRCh37). Contiene la información de las lecturas de ADN obtenidas tras la secuenciación, indicando en qué posición del genoma de referencia se alinean, junto con datos de calidad y otros metadatos técnicos. Requiere herramientas bioinformáticas específicas y, en muchos casos, el genoma de referencia utilizado durante el alineamiento para poder interpretarlo correctamente. Al igual que FASTQ, es un archivo técnico y de gran tamaño, por lo que está orientado principalmente a usuarios avanzados, bioinformáticos o investigadores.
