Trabalho de Conclusão de Curso

Implementação do método de regressão logística na classificação de exames por espectrometria de massa quanto à presença de câncer do ovário

This work aims to implement the logistic regression method, a simple 01 single-layer Artificial Neural Network, to classify the results of mass spectrometry exams in 02 diagnosis classes: with or without ovarian cancer. An “OvarianInputs” database was used with data from 216 patients examined with i...

ver descrição completa

Autor principal: Neves, João Paulo Santa Rita
Grau: Trabalho de Conclusão de Curso
Idioma: por
Publicado em: Brasil 2022
Assuntos:
Acesso em linha: http://repositorio.ifam.edu.br/jspui/handle/4321/1035
id oai:localhost:4321-1035
recordtype dspace
spelling oai:localhost:4321-10352022-10-19T14:41:35Z Implementação do método de regressão logística na classificação de exames por espectrometria de massa quanto à presença de câncer do ovário Neves, João Paulo Santa Rita Santos, Alyson de Jesus dos Santos, Alyson de Jesus dos Regressão logística Câncer de ovário Rede neural CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::SISTEMAS ELETRICOS DE POTENCIA This work aims to implement the logistic regression method, a simple 01 single-layer Artificial Neural Network, to classify the results of mass spectrometry exams in 02 diagnosis classes: with or without ovarian cancer. An “OvarianInputs” database was used with data from 216 patients examined with ion intensities corresponding to 100 specific load-mass values and the “OvarianTargets” database with diagnostic results for network training purposes neural. The k-fold cross validation was used in 5 randomized folders to assess the average accuracy of the model. The confusion matrix obtained from the classification of the elements of the test set of each folder was used. The algorithm responsible for this implementation was developed using Python language libraries and compared with the results obtained from the mathematical formulation of the model in MATLAB software, reaching an average accuracy of 93.03% in both implementations. Este trabalho tem como objetivo implementar o método de regressão logística, uma rede neural simples de 01 única camada, para classificar os resultados dos exames de espectrometria de massa em 02 classes de diagnostico: com ou sem câncer de ovário. Foi utilizada uma base de dados “ovarianInputs” com os dados de 216 pacientes examinados com intensidades de íons correspondentes a 100 valores específicos de carga-massa, assim como a base de dados “ovarianTargets” com os resultados do diagnostico para fins de treinamento da rede neural (aprendizado supervisionado). Foi utilizado o método k-fold em 5 pastas randomizadas para a avaliação da acurácia média do modelo. Utilizou-se a matriz de confusão obtida a partir da classificação dos elementos do conjunto de teste de cada pasta. O algoritmo responsável por essa implementação foi desenvolvido utilizando as bibliotecas da linguagem Python e os resultados foram comparados com os resultados obtidos a partir da formulação matemática do modelo no software MATLAB, alcançando uma acurácia média de 93,03% em ambas as implementações. 2022-10-19T14:41:35Z 2022-10-19 2022-10-19T14:41:35Z 2022-04-07 Trabalho de Conclusão de Curso Neves, João Paulo Santa Rita. Implementação do método de regressão logística na classificação de exames por espectrometria de massa quanto à presença de câncer do ovário. Manaus. 2021. 76 f. Monografia. (Graduação em Engenharia de Controle e Automação) - Instituto Federal de Educação, Ciência e Tecnologia do Amazonas, Campus Manaus Distrito Industrial, Manaus, 2021. http://repositorio.ifam.edu.br/jspui/handle/4321/1035 por A, Agresti. Categorical Data Analysis. 2a ed. New York: John Wiley Sons, 2002. BARRETO, J. Introdução às Redes Neurais Artificiais. Laboratório de Conexionismo e Ciências Cognitivas -Universidade Federal de Santa Catarina, 2002. 17, 18. BORRA; CIACCIO. Measuring the prediction error. A comparison of cross-validation, bootstrap and covariance penalty methods. Computacional Statistics and Data Analysis, 54:2976-2989. BRAGA A.; CARVALHO, A. Redes Neurais Artificiais: Teoria e Aplicações. Rio de Janeiro: LTC, 2000. 237 p. 17, 24, 25“Câncer de Ovário,” 2021. Acessado em 06 de junho de 2021. [Online]. Disponível em: . “Câncer de ovário é o mais agressivo dentre os tumores ginecológicos e requer atenção” 2021. Acessado em: 05 de junho de 2021. [Online]. Disponível em: http://www.fcecon.am.gov.br/cancer-de-ovario-e-o-mais-agressivo-dentre-os-tumores-ginecologicos-e-requer-atencao-alerta-fcecon/. CARVALHO, P. C. et al. Serum markers and mass spectrometry in the diagnosis of cancer, Jornal Brasileiro de Patologia e Medicina Laboratorial, 2006, https://doi.org/10.1590/S1676-24442006000600005. CARVALHO, P. C. et al. Detection of potential serum molecular markers for Hodgkin's disease. J Bras Patol Med Lab, v. 41, n. 3, p. 99-103, 2005. CARVALHO, P. C. Reconhecimento de padrões proteômicos e genômicos por aprendizagem de máquinas para o diagnóstico médico, 2006. Tese (Mestrado) Departamento de Biologia Celular e Molecular do Instituto Oswaldo Cruz, Rio de Janeiro. CHAND, H. S.; NESS, S. A.; KISIEL, W. Identification of a novel human tissue factor splice variant that is upregulated in tumor cells. Int J Cancer, v. 118, n. 7, p. 1713-20, 2005. 65 CONRADS, T. P. et al. Cancer diagnosis using proteomic patterns. Expert Rev Mol Diagn, v. 3, n. 4, p. 411-20, 2003. D. Hosmer e S. Lemeshow. Applied Logistic Regression. 2a ed. New York: John Wiley Sons, 2000. DIAMANDIS, E. P.; VAN DER MERWE, D. E. Plasma protein profiling by mass spectrometry for cancer diagnosis: opportunities and limitations. Clin Cancer Res, v. 11, n. 3, p. 963-5, 2005. DOUGLAS, 2019. ML – Métricas de Avaliação. Acessado em: agosto de 2021. [Online]. Disponível em: https://medium.com/@douglasheberteempty/ml-m%C3%A9tricas-de-classifica%C3%A7%C3%A3o-97f57b27f61c. ECHAN, L. A. et al. Depletion of multiple high-abundance proteins improves protein profiling capacities of human serum and plasma. Proteomics, v. 5, n. 13, p. 3292-303, 2005.“Estatística para câncer de ovário,” 2020. Acessado em: 09 de junho de 2021. [Online]. Disponível em: http://www.oncoguia.org.br/conteudo/estatistica-para-cancer-de-ovario/6045/228/. FENN, J. B. et al. Electrospray ionization for mass spectrometry of large biomolecules. Science, v. 246, n. 4926, p. 64-71, 1989. FLECK, L. Redes Neurais Artificiais: Princípios Básicos. Revista Eletrônica Científica Inovação e Tecnologia -Universidade Tecnológica Federal do Paraná, 2016. 16 FREITAS, G. A. L. Aprendizagem Profunda Aplicada ao Futebol de Robôs: Uso de Rede Neurais Convolucionais para Detecção de Objetos, Dissertação. Londrina, 2019. FILIPOWICZ, W. et al. Post-transcriptional gene silencing by siRNAs and miRNAs. Curr Opin Struct Biol, v. 15, n. 3, p. 331-41, 2005. 66 Godbole S., Sarawagi S. (2004). Discriminative Methods for Multi-labeled Classification. In: Dai H., Srikant R., Zhang C. (eds) Advances in Knowledge Discovery and Data Mining. PAKDD 2004. Lecture Notes in Computer Science, vol 3056. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-540-24775-3_5. GRONBORG, M. et al. Biomarker discovery from pancreatic cancer secretome using a differential proteomics approach. Mol Cell Proteomics, v. 5, p. 157-71, 2005. GURNEY, K. An Introduction to Neural Networks. London: UCL Press, 1997. 316 p.17. HAYKIN, S. Neural Networks: A Comprehensive Foundation. Ontario: Pearson Education, 1998. 818 p. 17, 19, 20, 21, 22, 23, 24, 25. KAUFMANN, R. Matrix-assisted laser desorption ionization (MALDI) mass spectrometry: a novel analytical tool in molecular biology and biotechnology, Journal of Biotechnology, Volume 41, Issues 2–3, 1995, Pages 155-175, ISSN 0168-1656, https://doi.org/10.1016/0168-1656(95)00009-F. KARAS M. et al. Matrix-assisted ultraviolet laser desorption of non-volatile compounds. International Journal of Mass Spectrometry and Ion Processes, v. 78, p. 53-68, 1987. KHAN, S. A Guide to Convolutional Neural Networks for Computer Vision. Crawley: Morgan Claypool, 2018. 184 p. 16, 24, 28, 29, 30, 31, 32, 33. KRUEGER-BECK, E. Potencial de ação: do estímulo à adaptação neural. Fisioter. Mov., Curitiba, v. 24, n. 3, p. 535-547, 2011. 18. M. Douglas C. Applied statistics and probability for engineers. John Wiley Sons, Inc, 2002. M. Hajmeera and I. Basheerb, Comparison of logistic regression and neural network-based classifiers for bacterial growth in Food Microbiology, Elsevier, 2003. 67 “Matplotlib: Visualization with Python,” 2021. Accessed on: May. 05, 2021. [Online]. Available: https://matplotlib.org/stable/index.html. “Numpy: About Us,” 2020. Accessed on: May. 05, 2021. [Online]. Available: https://numpy.org/about/. Oncoguia, 2020. Maioria das brasileiras é diagnosticada com câncer de ovário já avançado. Acessado em: julho de 2021. [Online]. Disponível em: .Oncomed, 2020. Câncer de Ovário. Acessado em: julho de 2021.[Online]. Disponível em: https://www.oncomed.com.br/artigo-cancer-ovario. P. Mesquita. UM MODELO DE REGRESSAO LOGISTICA PARA AVALIACAO DOS PROGRAMAS DE POS-GRADUACAO ̃NO BRASIL. Dissertacao. JCAMPOS DOS GOYTACAZES, 2014. S. Godbole and S. Sarawagi, Discriminative methods for multi-labeled classification, in Pacific-Asia conference on knowledge discovery and data mining. Springer, 2004. S. Borra e A. Di Ciaccio. “Measuring the prediction error. A comparison of cross-validation, bootstrap and co-variance penalty methods”. Em: Computational Statistics Data Analysis 154 (2010), pp. 2976–2989. URL: https: www.sciencedirect.com / science / article / abs / pii / S0167947310001064. “Scikit-learn”. Shufflesplit. Acessado em: julho de 2021. [Online]. Disponível em: https://scikit-learn.org/. ”Tensorflow: An end-to-end open source machine learning platform,”2021. Accessed on: May. 07, 2021. [Online]. Available: https://www.tensorflow.org/. ”Tensorflow: tf.keras.losses.binary crossentropy,”2021. Accessed on: May. 07, 2021. [Online]. Available: https://www.tensorflow.org/api. Adriana M. Tonini e Bráulio R.G.M. Couto, "Ensinando Geometria Analítica com uso do MATLAB," Departamento de Ciências Exatas e Tecnologia do Centro Universitário de Belo Horizonte / DECET - UniBH. 68 V. Gevert, A. Silva, F. Gevert e V. Ales. “Modelos de Regressão Logística, Redes Neurais e Support Vector Machine (SVMs) na Análise de Crédito a Pessoas Jurídicas”. Em: Revista Ciências Exatas e Naturais 12 (2010), pp. 270–293. VESTAL, M. L. Methods of ion generation. Chem Rev, v. 101, n. 2, p. 361-75, 2001. ”Visualizing cross-validation behavior in scikitlearn”2021. Acesso Aberto Brasil Campus Manaus Distrito Instituto Federal do Amazonas IFAM Engenharia de Controle e Automação Instituto Federal do Amazonas IFAM Engenharia de Controle e Automação Instituto Federal do Amazonas IFAM Engenharia de Controle e Automação
institution Repositório Institucional - Instituto Federal do Amazonas - IFAM
collection IFAM-RI
language por
topic Regressão logística
Câncer de ovário
Rede neural
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::SISTEMAS ELETRICOS DE POTENCIA
spellingShingle Regressão logística
Câncer de ovário
Rede neural
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::SISTEMAS ELETRICOS DE POTENCIA
Neves, João Paulo Santa Rita
Implementação do método de regressão logística na classificação de exames por espectrometria de massa quanto à presença de câncer do ovário
topic_facet Regressão logística
Câncer de ovário
Rede neural
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::SISTEMAS ELETRICOS DE POTENCIA
description This work aims to implement the logistic regression method, a simple 01 single-layer Artificial Neural Network, to classify the results of mass spectrometry exams in 02 diagnosis classes: with or without ovarian cancer. An “OvarianInputs” database was used with data from 216 patients examined with ion intensities corresponding to 100 specific load-mass values and the “OvarianTargets” database with diagnostic results for network training purposes neural. The k-fold cross validation was used in 5 randomized folders to assess the average accuracy of the model. The confusion matrix obtained from the classification of the elements of the test set of each folder was used. The algorithm responsible for this implementation was developed using Python language libraries and compared with the results obtained from the mathematical formulation of the model in MATLAB software, reaching an average accuracy of 93.03% in both implementations.
author_additional Santos, Alyson de Jesus dos
author_additionalStr Santos, Alyson de Jesus dos
format Trabalho de Conclusão de Curso
author Neves, João Paulo Santa Rita
title Implementação do método de regressão logística na classificação de exames por espectrometria de massa quanto à presença de câncer do ovário
title_short Implementação do método de regressão logística na classificação de exames por espectrometria de massa quanto à presença de câncer do ovário
title_full Implementação do método de regressão logística na classificação de exames por espectrometria de massa quanto à presença de câncer do ovário
title_fullStr Implementação do método de regressão logística na classificação de exames por espectrometria de massa quanto à presença de câncer do ovário
title_full_unstemmed Implementação do método de regressão logística na classificação de exames por espectrometria de massa quanto à presença de câncer do ovário
title_sort implementação do método de regressão logística na classificação de exames por espectrometria de massa quanto à presença de câncer do ovário
publisher Brasil
publishDate 2022
url http://repositorio.ifam.edu.br/jspui/handle/4321/1035
_version_ 1787149959098793984
score 11.653393