Arquivos disponíveis na seção de downloads do teste ULTRA

Atualizado em

Na secção de transferências do teste ULTRA, pode encontrar diferentes tipos de ficheiros gerados a partir dos seus dados de Sequenciação do Genoma Completo, WGS. Estes ficheiros estão organizados em duas secções principais: “Transferências” e “Transferências técnicas”.

Em primeiro lugar, a secção de “Transferências” inclui dois ficheiros em formato CSV, concebidos para oferecer ao utilizador uma experiência mais simples e acessível. Estes ficheiros têm uma estrutura semelhante aos raw data gerados por plataformas de genotipagem e foram pensados para que utilizadores não especialistas possam explorar os seus dados genéticos de forma mais cómoda. Além disso, foram preparados para facilitar a sua possível utilização em plataformas de análise genética de terceiros.

  • TMG MyVariants: é um ficheiro cujo formato e conteúdo foram adaptados para maximizar a compatibilidade com plataformas externas de análise genética. O seu objetivo é oferecer ao utilizador um ficheiro simples, estruturado e semelhante aos raw data de genotipagem, facilitando assim a consulta de parte da informação genética obtida através de WGS.

  • TMG MyVariants Ultra: contém toda a informação incluída no TMG MyVariants e, além disso, incorpora as variantes em que o seu genótipo não é referência/referência. Isto significa que permite consultar de forma mais ampla as posições em que o seu ADN apresenta alguma diferença relativamente ao genoma de referência. Este ficheiro foi concebido para que o utilizador possa explorar a sua variabilidade genética de forma mais simples, sem necessidade de trabalhar diretamente com ficheiros bioinformáticos mais complexos.

Em segundo lugar, a secção de “Transferências técnicas” disponibiliza ao utilizador ficheiros em formatos habituais nos fluxos de análise genómica. Estes ficheiros são dirigidos a utilizadores avançados, bioinformáticos, investigadores ou profissionais que desejam realizar análises técnicas mais específicas.

  • Ficheiro FASTQ: é o ficheiro de saída bruto da máquina de sequenciação. Contém as leituras de ADN não processadas, juntamente com as pontuações de qualidade que indicam a fiabilidade de cada leitura. É um dos formatos mais completos, pois conserva a informação inicial gerada durante a sequenciação. No entanto, também é um ficheiro de grande dimensão e a sua utilização requer conhecimentos bioinformáticos, bem como ferramentas específicas para o seu processamento.

  • Ficheiro VCF (Variant Call Format): é o resultado do processamento bioinformático dos dados de sequenciação após o seu alinhamento e comparação com um genoma de referência (GRCh37). Contém informação sobre as variantes identificadas no ADN do utilizador, ou seja, aquelas posições em que foi detetada uma diferença relativamente ao genoma de referência. Este formato é amplamente utilizado em genética e bioinformática para a análise, filtragem e interpretação de variantes genómicas.

  • Ficheiro CRAM: é um formato binário comprimido utilizado para armazenar dados de sequenciação genómica alinhados contra um genoma de referência (GRCh37). Contém a informação das leituras de ADN obtidas após a sequenciação, indicando em que posição do genoma de referência se alinham, juntamente com dados de qualidade e outros metadados técnicos. Requer ferramentas bioinformáticas específicas e, em muitos casos, o genoma de referência utilizado durante o alinhamento para poder ser interpretado corretamente. Tal como o FASTQ, é um ficheiro técnico e de grande dimensão, pelo que é orientado principalmente para utilizadores avançados, bioinformáticos ou investigadores.