Trabalho de Conclusão de Curso - Graduação

Um estudo comparativo de ferramentas de binning de metagenomas utilizando dados simulados microbianos

Metagenomics is a derivation of the traditional branch of Genomics that studies the genome of communities of microorganisms extracted directly from their habitat, eliminating the need for laboratory cultivation. The reconstruction of the DNA strand of a genome is done through the sequencing process...

ver descrição completa

Autor principal: PARÁ, Rodrigo de Britto Pontes Rodrigues
Grau: Trabalho de Conclusão de Curso - Graduação
Publicado em: 2019
Assuntos:
Acesso em linha: https://bdm.ufpa.br/jspui/handle/prefix/2366
id oai:https:--bdm.ufpa.br:8443:prefix-2366
recordtype dspace
spelling oai:https:--bdm.ufpa.br:8443:prefix-23662019-11-06T03:06:46Z Um estudo comparativo de ferramentas de binning de metagenomas utilizando dados simulados microbianos PARÁ, Rodrigo de Britto Pontes Rodrigues FRANCÊS, Regiane Silva Kawasaki http://lattes.cnpq.br/1572121571522063 OLIVEIRA, Renato Renison Moreira http://lattes.cnpq.br/4392006636286456 Bioinformática Metagenômica Montagem de metagenomas Binning de metagenomas Dados simulados CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Metagenomics is a derivation of the traditional branch of Genomics that studies the genome of communities of microorganisms extracted directly from their habitat, eliminating the need for laboratory cultivation. The reconstruction of the DNA strand of a genome is done through the sequencing process where smaller fragments of DNA are created, which will later be assembled into larger sequences in order to reach the original genome. For metagenomic data, this assembly process is more laborious, since several genomes of different organisms are present in the sample. Separating the sequences obtained in the assembly process into distinct categories according to the taxonomic level of organisms is a process called binning and is important to facilitate the subsequent analysis of the composition of the sample, for the discovery of phylogenetic relationships and new genes. This work seeks to compare the results of binning tools by defining a pipeline of metagenomic data analysis using two simulated datasets of 10 and 100 species of bacteria. Metaquast software was used to compare three assembly softwares (IDBA_UD, Megahit and MetasSPAdes) and two binning softwares (MetaBAT-2.12.1 and MaxBin-2.2.4). The quality of the bins generated by each tool was compared by constructing a Confusion Matrix and comparing the Accuracy, Sensitivity, Specificity and Accuracy metrics. As a result, MetaBAT excels at MaxBin in the quality of the bins generated in both sets of data, proving to be a good choice in performing binning of metagenomes. A Metagenômica é uma derivação do ramo tradicional da Genômica que estuda o genoma de comunidades de microrganismos retirados diretamente do seu habitat, eliminando a necessidade do cultivo laboratorial. A reconstrução da cadeia de DNA de um genoma é feita através do processo de sequenciamento onde são criados fragmentos menores de DNA, que serão posteriormente montados em sequências maiores a fim de se chegar no genoma original. Para dados metagenômicos, esse processo de montagem é mais trabalhoso, dado que vários genomas de organismos diferentes estão presentes na amostra. Separar as sequências obtidas no processo de montagem em categorias distintas de acordo com o nível taxonômico dos organismos é um processo denominado binning, e é importante para facilitar a posterior análise da composição da amostra, para a descoberta de relações filogenéticas e de novos genes. Este trabalho busca comparar os resultados de ferramentas de binning através da definição de um pipeline de análise de dados metagenômicos, utilizando dois conjuntos de dados simulados de 10 e 100 espécies de bactérias. Utilizou-se o software Metaquast para a comparação de três softwares de montagem (IDBA_UD, Megahit e MetasSPAdes) e dois softwares de binning (MetaBAT-2.12.1 e MaxBin-2.2.4). A qualidade dos bins gerados por cada ferramenta foi comparada através da construção de uma Matriz de Confusão e da comparação das métricas de Acurácia, Sensibilidade, Especificidade e Precisão. Como resultado, o MetaBAT se sobressai ao MaxBin na qualidade dos bins gerados em ambos os conjuntos de dados, provando ser uma boa opção na realização do binning de metagenomas. 2019-11-05T13:11:49Z 2019-11-05T13:11:49Z 2019 Trabalho de Conclusão de Curso - Graduação PARÁ, Rodrigo de Britto Pontes Rodrigues. Um estudo comparativo de ferramentas de binning de metagenomas utilizando dados simulados microbianos. Orientadora: Regiane Silva Kawasaki Francês. 2019. 63 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Faculdade de Computação, Instituto de Ciências Exatas e Naturais, Universidade Federal do Pará, Belém, 2019. Disponível em: http://bdm.ufpa.br/jspui/handle/prefix/2366. Acesso em:. https://bdm.ufpa.br/jspui/handle/prefix/2366 Acesso Aberto 1 CD-ROM
institution Biblioteca Digital de Monografias - UFPA
collection MonografiaUFPA
topic Bioinformática
Metagenômica
Montagem de metagenomas
Binning de metagenomas
Dados simulados
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
spellingShingle Bioinformática
Metagenômica
Montagem de metagenomas
Binning de metagenomas
Dados simulados
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
PARÁ, Rodrigo de Britto Pontes Rodrigues
Um estudo comparativo de ferramentas de binning de metagenomas utilizando dados simulados microbianos
topic_facet Bioinformática
Metagenômica
Montagem de metagenomas
Binning de metagenomas
Dados simulados
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Metagenomics is a derivation of the traditional branch of Genomics that studies the genome of communities of microorganisms extracted directly from their habitat, eliminating the need for laboratory cultivation. The reconstruction of the DNA strand of a genome is done through the sequencing process where smaller fragments of DNA are created, which will later be assembled into larger sequences in order to reach the original genome. For metagenomic data, this assembly process is more laborious, since several genomes of different organisms are present in the sample. Separating the sequences obtained in the assembly process into distinct categories according to the taxonomic level of organisms is a process called binning and is important to facilitate the subsequent analysis of the composition of the sample, for the discovery of phylogenetic relationships and new genes. This work seeks to compare the results of binning tools by defining a pipeline of metagenomic data analysis using two simulated datasets of 10 and 100 species of bacteria. Metaquast software was used to compare three assembly softwares (IDBA_UD, Megahit and MetasSPAdes) and two binning softwares (MetaBAT-2.12.1 and MaxBin-2.2.4). The quality of the bins generated by each tool was compared by constructing a Confusion Matrix and comparing the Accuracy, Sensitivity, Specificity and Accuracy metrics. As a result, MetaBAT excels at MaxBin in the quality of the bins generated in both sets of data, proving to be a good choice in performing binning of metagenomes.
author_additional FRANCÊS, Regiane Silva Kawasaki
author_additionalStr FRANCÊS, Regiane Silva Kawasaki
format Trabalho de Conclusão de Curso - Graduação
author PARÁ, Rodrigo de Britto Pontes Rodrigues
title Um estudo comparativo de ferramentas de binning de metagenomas utilizando dados simulados microbianos
title_short Um estudo comparativo de ferramentas de binning de metagenomas utilizando dados simulados microbianos
title_full Um estudo comparativo de ferramentas de binning de metagenomas utilizando dados simulados microbianos
title_fullStr Um estudo comparativo de ferramentas de binning de metagenomas utilizando dados simulados microbianos
title_full_unstemmed Um estudo comparativo de ferramentas de binning de metagenomas utilizando dados simulados microbianos
title_sort um estudo comparativo de ferramentas de binning de metagenomas utilizando dados simulados microbianos
publishDate 2019
url https://bdm.ufpa.br/jspui/handle/prefix/2366
_version_ 1787154874760167424
score 11.753896