Tese

Ciência de dados e aprendizado de máquina aplicados ao estudo de variáveis epidemiológica hanseníase na Amazônia

Leprosy is a significant public health problem that largely affects low-income populations. Although the World Health Organization (WHO) establishes guidelines for diagnosis, prevention, and treatment, disease detection faces limitations, often resulting in late or inaccurate diagnoses and leading...

ver descrição completa

Autor principal: FALCÃO, Igor Wenner Silva
Grau: Tese
Idioma: por
Publicado em: Universidade Federal do Pará 2025
Assuntos:
Acesso em linha: https://repositorio.ufpa.br/jspui/handle/2011/16790
id ir-2011-16790
recordtype dspace
spelling ir-2011-167902025-01-30T18:12:40Z Ciência de dados e aprendizado de máquina aplicados ao estudo de variáveis epidemiológica hanseníase na Amazônia FALCÃO, Igor Wenner Silva SERUFFO, Marcos César da Rocha http://lattes.cnpq.br/3794198610723464 CARDOSO, Diego Lisboa http://lattes.cnpq.br/0507944343674734 Hanseníase Ciência de dados Floresta aleatória Data Science Clustering Leprosy CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES COMPUTAÇÃO APLICADA Leprosy is a significant public health problem that largely affects low-income populations. Although the World Health Organization (WHO) establishes guidelines for diagnosis, prevention, and treatment, disease detection faces limitations, often resulting in late or inaccurate diagnoses and leading to serious neurological complications and multidrug-resistant cases. Therefore, early diagnosis is essential to reduce the burden of this disease. Machine learning has been widely used in several areas of science and industry, but especially in health, where it plays an essential role in the analysis and treatment of large volumes of data. In this sense, this thesis investigates the application of a model based on Data Science and Machine Learning to act in the specification of the clinical profile of possible leprosy cases in the Amazon Region and, thus, to be able to act preventively in the early diagnosis and treatment of patients under medical followup. The work takes into account clinical data of patients from a non-public dataset, collected between 2015 and 2020 in the North region of Brazil. Therefore, this thesis proposes a learning model to identify groups clinically affected by the disease using Clustering and Random Forest techniques. In the results obtained, the proposed model demonstrated efficiency in evaluating the probability of individuals being ill, achieving an accuracy of 90.39% in the performance evaluation and identifying a probability of 83.46% of an individual being ill, considering a set of epidemiological and non-generic variables. This approach offers a promising vision for the future of health, allowing the formulation of effective strategies for the early identification of possible cases. A hanseníase é um problema de saúde pública significativo que afeta, em grande parte, populações de baixo nível sócioeconômico. Embora a Organização Mundial da Saúde (OMS) estabeleça diretrizes para diagnóstico, prevenção e tratamento, a detecção da doença enfrenta limitacões, frequentemente resultando em diagnósticos tardios ou imprecisos e levando a complicações neurológicas graves e casos multirresistentes. Portanto, o diagnóstico precoce é essencial para reduzir a carga dessa doença. O aprendizado de máquina vem sendo largamente utilizado em diversas áreas da ciência e da indústria, mas especialmente na saúde, área em que desempenha um papel essencial na análise e tratamento de grandes volumes de dados. Neste sentido, esta tese investiga a aplicação de um modelo baseado em Ciência de Dados e Aprendizado de Máquina para atuar na especificação do perfil clínico de possíveis casos da hanseníase na Região Amazônica e, com isso, poder-se agir preventivamente no diagnóstico precoce e tratamento de pacientes em acompanhamento médico. O trabalho leva em consideracão dados clínicos de pacientes provenientes de um conjunto de dados não públicos, coletados entre 2015 e 2020 na região Norte do Brasil. Logo, esta tese propõe um modelo de aprendizado para identificar grupos clinicamente afetados pela doença usando técnicas de Agrupamento e Random Forest. Nos resultados obtidos, o modelo proposto demonstrou eficiência ao avaliar a probabilidade de indivíduos estarem doentes, alcançando uma precisão de 90,39% na avaliação de performance e identificando uma probabilidade de 83,46% de um indivíduo estar doente, considerando um conjunto de variáveis epidemiológicas e não genéricas. Essa abordagem oferece uma visão promissora para o futuro da saúde, permitindo a formulação de estratégias eficazes para a identificação precoce de possíveis casos. 2025-01-30T18:05:17Z 2025-01-30T18:05:17Z 2024-12-18 Tese FALCÃO, Igor Wenner Silva. Ciência de dados e aprendizado de máquina aplicados ao estudo de variáveis epidemiologicas da hanseniase na Amazônia. Orientador: Marcos César da Rocha Seruffo.; Coorientador: Diego Lisboa Cardoso. 2024, 86 f. Tese (Doutorado em Engenharia Elétrica) - Instituto de Tecnologia, , Universidade Federal do Pará, Belém, 2024. Disponível em: . Acesso em:. https://repositorio.ufpa.br/jspui/handle/2011/16790 por Acesso Aberto Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ application/pdf Universidade Federal do Pará Brasil Instituto de Tecnologia UFPA Programa de Pós-Graduação em Engenharia Elétrica Disponível na internet via correio eletrônico: bibliotecaitec@ufpa.br
institution Repositório Institucional - Universidade Federal do Pará
collection RI-UFPA
language por
topic Hanseníase
Ciência de dados
Floresta aleatória
Data Science
Clustering
Leprosy
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES
COMPUTAÇÃO APLICADA
spellingShingle Hanseníase
Ciência de dados
Floresta aleatória
Data Science
Clustering
Leprosy
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES
COMPUTAÇÃO APLICADA
FALCÃO, Igor Wenner Silva
Ciência de dados e aprendizado de máquina aplicados ao estudo de variáveis epidemiológica hanseníase na Amazônia
topic_facet Hanseníase
Ciência de dados
Floresta aleatória
Data Science
Clustering
Leprosy
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES
COMPUTAÇÃO APLICADA
description Leprosy is a significant public health problem that largely affects low-income populations. Although the World Health Organization (WHO) establishes guidelines for diagnosis, prevention, and treatment, disease detection faces limitations, often resulting in late or inaccurate diagnoses and leading to serious neurological complications and multidrug-resistant cases. Therefore, early diagnosis is essential to reduce the burden of this disease. Machine learning has been widely used in several areas of science and industry, but especially in health, where it plays an essential role in the analysis and treatment of large volumes of data. In this sense, this thesis investigates the application of a model based on Data Science and Machine Learning to act in the specification of the clinical profile of possible leprosy cases in the Amazon Region and, thus, to be able to act preventively in the early diagnosis and treatment of patients under medical followup. The work takes into account clinical data of patients from a non-public dataset, collected between 2015 and 2020 in the North region of Brazil. Therefore, this thesis proposes a learning model to identify groups clinically affected by the disease using Clustering and Random Forest techniques. In the results obtained, the proposed model demonstrated efficiency in evaluating the probability of individuals being ill, achieving an accuracy of 90.39% in the performance evaluation and identifying a probability of 83.46% of an individual being ill, considering a set of epidemiological and non-generic variables. This approach offers a promising vision for the future of health, allowing the formulation of effective strategies for the early identification of possible cases.
author_additional SERUFFO, Marcos César da Rocha
author_additionalStr SERUFFO, Marcos César da Rocha
format Tese
author FALCÃO, Igor Wenner Silva
title Ciência de dados e aprendizado de máquina aplicados ao estudo de variáveis epidemiológica hanseníase na Amazônia
title_short Ciência de dados e aprendizado de máquina aplicados ao estudo de variáveis epidemiológica hanseníase na Amazônia
title_full Ciência de dados e aprendizado de máquina aplicados ao estudo de variáveis epidemiológica hanseníase na Amazônia
title_fullStr Ciência de dados e aprendizado de máquina aplicados ao estudo de variáveis epidemiológica hanseníase na Amazônia
title_full_unstemmed Ciência de dados e aprendizado de máquina aplicados ao estudo de variáveis epidemiológica hanseníase na Amazônia
title_sort ciência de dados e aprendizado de máquina aplicados ao estudo de variáveis epidemiológica hanseníase na amazônia
publisher Universidade Federal do Pará
publishDate 2025
url https://repositorio.ufpa.br/jspui/handle/2011/16790
_version_ 1832604697120210944
score 11.755432