Dissertação

Reconhecimento de emoções baseado em Aprendizado Autossupervisionado

O reconhecimento de emoções é uma aplicação do aprendizado de máquina que envolve a análise de sinais fisiológicos, de áudio e/ou vídeo para identificar emoções expressas pelos indivíduos. A obtenção de bases de dados rotuladas para essa tarefa é desafiadora e onerosa, muitas vezes apresentand...

ver descrição completa

Autor principal: Utyiama, Daniel Mitsuaki da Silva
Outros Autores: http://lattes.cnpq.br/7029717519311438
Grau: Dissertação
Idioma: por
Publicado em: Universidade Federal do Amazonas 2024
Assuntos:
.
.
.
Acesso em linha: https://tede.ufam.edu.br/handle/tede/10368
Resumo:
O reconhecimento de emoções é uma aplicação do aprendizado de máquina que envolve a análise de sinais fisiológicos, de áudio e/ou vídeo para identificar emoções expressas pelos indivíduos. A obtenção de bases de dados rotuladas para essa tarefa é desafiadora e onerosa, muitas vezes apresentando problemas estruturais como desequilíbrio de classes, dados faltantes e vieses de rotulagem. Uma abordagem promissora para contornar esses problemas é desenvolver soluções de reconhecimento de padrões baseadas no aprendizado autossupervisionado. Essa abordagem permite treinar modelos utilizando dados não rotulados, transferindo o conhecimento adquirido para um modelo especializado no reconhecimento de emoções. Dessa forma, é possível superar a dependência de bases de dados rotuladas, tornando o processo mais eficiente e menos custoso. A escolha de tarefas auxiliares no aprendizado autossupervisionado é crucial, pois possibilita o treinamento eficiente de modelos em grandes bases de dados não rotulados e contribui para a aprendizagem de representações robustas e generalizáveis. Isso permite que o modelo se adapte melhor a diferentes tarefas e cenários. Nesse contexto, este trabalho apresenta uma arquitetura de rede neural que utiliza uma abordagem auto-supervisionada para o reconhecimento de emoções a partir de sinais de eletrocardiograma. Para avaliar o desempenho da arquitetura neural proposta, implementamos e avaliamos diferentes combinações de tarefas auxiliares, analisando como cada uma contribui para a eficácia e precisão do modelo. Identificamos as tarefas auxiliares mais significativas para a classificação de emoções e realizamos análises detalhadas dos parâmetros associados a essas tarefas. Experimentos conduzidos em quatro bases de dados públicas demonstraram consistentemente o desempenho superior do método proposto em comparação com a mesma arquitetura treinada de forma supervisionada. Na base de dados SWELL, o método alcançou uma acurácia de 93,64% na classificação de excitação, que é uma dimensão da emoção, utilizando apenas 25% dos dados rotulados, comparado a 78,20% do método supervisionado.