/img alt="Imagem da capa" class="recordcover" src="""/>
Dissertação
Reconhecimento de emoções baseado em Aprendizado Autossupervisionado
O reconhecimento de emoções é uma aplicação do aprendizado de máquina que envolve a análise de sinais fisiológicos, de áudio e/ou vídeo para identificar emoções expressas pelos indivíduos. A obtenção de bases de dados rotuladas para essa tarefa é desafiadora e onerosa, muitas vezes apresentand...
Autor principal: | Utyiama, Daniel Mitsuaki da Silva |
---|---|
Outros Autores: | http://lattes.cnpq.br/7029717519311438 |
Grau: | Dissertação |
Idioma: | por |
Publicado em: |
Universidade Federal do Amazonas
2024
|
Assuntos: | |
Acesso em linha: |
https://tede.ufam.edu.br/handle/tede/10368 |
Resumo: |
---|
O reconhecimento de emoções é uma aplicação do aprendizado de máquina que
envolve a análise de sinais fisiológicos, de áudio e/ou vídeo para identificar emoções
expressas pelos indivíduos. A obtenção de bases de dados rotuladas para essa tarefa é
desafiadora e onerosa, muitas vezes apresentando problemas estruturais como
desequilíbrio de classes, dados faltantes e vieses de rotulagem.
Uma abordagem promissora para contornar esses problemas é desenvolver
soluções de reconhecimento de padrões baseadas no aprendizado autossupervisionado.
Essa abordagem permite treinar modelos utilizando dados não rotulados, transferindo o
conhecimento adquirido para um modelo especializado no reconhecimento de emoções.
Dessa forma, é possível superar a dependência de bases de dados rotuladas, tornando o
processo mais eficiente e menos custoso.
A escolha de tarefas auxiliares no aprendizado autossupervisionado é crucial, pois
possibilita o treinamento eficiente de modelos em grandes bases de dados não rotulados
e contribui para a aprendizagem de representações robustas e generalizáveis. Isso permite
que o modelo se adapte melhor a diferentes tarefas e cenários.
Nesse contexto, este trabalho apresenta uma arquitetura de rede neural que utiliza
uma abordagem auto-supervisionada para o reconhecimento de emoções a partir de sinais
de eletrocardiograma. Para avaliar o desempenho da arquitetura neural proposta,
implementamos e avaliamos diferentes combinações de tarefas auxiliares, analisando
como cada uma contribui para a eficácia e precisão do modelo. Identificamos as tarefas
auxiliares mais significativas para a classificação de emoções e realizamos análises
detalhadas dos parâmetros associados a essas tarefas.
Experimentos conduzidos em quatro bases de dados públicas demonstraram
consistentemente o desempenho superior do método proposto em comparação com a
mesma arquitetura treinada de forma supervisionada. Na base de dados SWELL, o
método alcançou uma acurácia de 93,64% na classificação de excitação, que é uma
dimensão da emoção, utilizando apenas 25% dos dados rotulados, comparado a 78,20%
do método supervisionado. |