Dissertação

Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais

Este trabalho apresenta a utilização de redes neurais convolucionais na classificação das configurações de mão da língua brasileira de sinais. Para elaborar modelos com capacidade de aprendizagem relacionada a essa língua, foi utilizado o conjunto de dados LibrasImage. As arquiteturas de redes utili...

ver descrição completa

Autor principal: Oliveira, Anne de Souza
Outros Autores: http://lattes.cnpq.br/0700648537595120
Grau: Dissertação
Idioma: por
Publicado em: Universidade Federal do Amazonas 2019
Assuntos:
L2
Acesso em linha: https://tede.ufam.edu.br/handle/tede/6956
id oai:https:--tede.ufam.edu.br-handle-:tede-6956
recordtype dspace
spelling oai:https:--tede.ufam.edu.br-handle-:tede-69562019-02-19T05:03:52Z Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais Oliveira, Anne de Souza Costa, Marly Guimarães Fernandes http://lattes.cnpq.br/0700648537595120 http://lattes.cnpq.br/7169358412541736 Pereira, José Raimundo Gomes http://lattes.cnpq.br/3697983438100904 Oliveira, Jozias Parente de http://lattes.cnpq.br/1169202481169729 Língua Brasileira de Sinais Redes neurais convolucionais Reconhecimento de sinais Aprendizagem profunda Técnicas de regularização Dropout L2 Classificação das configurações de mão ENGENHARIAS: ENGENHARIA ELÉTRICA Este trabalho apresenta a utilização de redes neurais convolucionais na classificação das configurações de mão da língua brasileira de sinais. Para elaborar modelos com capacidade de aprendizagem relacionada a essa língua, foi utilizado o conjunto de dados LibrasImage. As arquiteturas de redes utilizadas foram selecionadas com base na pesquisa bibliográfica sistemática realizada. Diferentes valores de hiperparâmetros foram testados para verificação e escolha daqueles que melhor se adequassem a tarefa de classificação. Os treinamentos dos modelos foram realizados por 500 épocas com três arquiteturas diferentes e duas técnicas de regularização (dropout e L2). Para testar o desempenho dos doze modelos com relação a classificação das configurações de mão, a acurácia foi a medida de desempenho escolhida para comparação. Para cada uma das arquiteturas, o modelo com maior acurácia foi selecionado para ser analisado com relação a sensibilidade, área sob a curva ROC e taxa de erro para cada uma das configurações de mão presentes no conjunto de dados LibrasImage. O modelo com melhor desempenho com relação as medidas citadas, foi comparado ao modelo treinado com o classificador k-vizinhos mais próximos, apresentado no trabalho de Costa Filho et al. (2017), para diferentes medidas de avaliação: acurácia, sensibilidade, precisão e F1 score. Os resultados mostraram que a utilização de redes neurais convolucionais é uma técnica que melhora a aprendizagem das configurações de mão da língua brasileira de sinais em relação ao outro método de classificação disponível na literatura que foi testado com o mesmo conjunto de dados, apresentando uma acurácia de 97,98%. A diferença de desempenho entre os dois métodos, em termos de acurácia, foi avaliada com o teste qui-quadrado de Pearson, cujo resultado mostrou ser estatisticamente significativo. This work presents a method to classify Brazilian sign language hand configurations using convolutional neural networks. The network architectures used were selected based on a systematic bibliographic research. Several experiments were done using different values of hyperparameters aiming to obtain the best fit the classification task. The models training was carried out for 500 epochs using three different architectures and two regularization techniques (dropout and L2). LibrasImage, a data set of hand configurations depth images was used in the training and testing steps of the models. The models were analyzed with respect to the accuracy, sensitivity, area under the ROC curve and error rate for each hand configuration. The best result obtained was an accuracy of 97.98%. This result shows that the use of convolutional neural network improves the classification of Brazilian sign language hand configurations in relation to the method that uses the k-nearest neighbor classifier, that was tested with the same dataset. The difference in performance between the two methods was statistically significant by Pearson chi-square test. 2019-02-18T14:49:04Z 2019-01-03 Dissertação OLIVEIRA, Anne de Souza. Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais. 2019. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Faculdade de Tecnologia, Universidade Federal do Amazonas, Manaus, 2019. https://tede.ufam.edu.br/handle/tede/6956 por Acesso Aberto http://creativecommons.org/licenses/by/4.0/ image/png application/pdf Universidade Federal do Amazonas Faculdade de Tecnologia Brasil UFAM Programa de Pós-graduação em Engenharia Elétrica
institution TEDE - Universidade Federal do Amazonas
collection TEDE-UFAM
language por
topic Língua Brasileira de Sinais
Redes neurais convolucionais
Reconhecimento de sinais
Aprendizagem profunda
Técnicas de regularização
Dropout
L2
Classificação das configurações de mão
ENGENHARIAS: ENGENHARIA ELÉTRICA
spellingShingle Língua Brasileira de Sinais
Redes neurais convolucionais
Reconhecimento de sinais
Aprendizagem profunda
Técnicas de regularização
Dropout
L2
Classificação das configurações de mão
ENGENHARIAS: ENGENHARIA ELÉTRICA
Oliveira, Anne de Souza
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
topic_facet Língua Brasileira de Sinais
Redes neurais convolucionais
Reconhecimento de sinais
Aprendizagem profunda
Técnicas de regularização
Dropout
L2
Classificação das configurações de mão
ENGENHARIAS: ENGENHARIA ELÉTRICA
description Este trabalho apresenta a utilização de redes neurais convolucionais na classificação das configurações de mão da língua brasileira de sinais. Para elaborar modelos com capacidade de aprendizagem relacionada a essa língua, foi utilizado o conjunto de dados LibrasImage. As arquiteturas de redes utilizadas foram selecionadas com base na pesquisa bibliográfica sistemática realizada. Diferentes valores de hiperparâmetros foram testados para verificação e escolha daqueles que melhor se adequassem a tarefa de classificação. Os treinamentos dos modelos foram realizados por 500 épocas com três arquiteturas diferentes e duas técnicas de regularização (dropout e L2). Para testar o desempenho dos doze modelos com relação a classificação das configurações de mão, a acurácia foi a medida de desempenho escolhida para comparação. Para cada uma das arquiteturas, o modelo com maior acurácia foi selecionado para ser analisado com relação a sensibilidade, área sob a curva ROC e taxa de erro para cada uma das configurações de mão presentes no conjunto de dados LibrasImage. O modelo com melhor desempenho com relação as medidas citadas, foi comparado ao modelo treinado com o classificador k-vizinhos mais próximos, apresentado no trabalho de Costa Filho et al. (2017), para diferentes medidas de avaliação: acurácia, sensibilidade, precisão e F1 score. Os resultados mostraram que a utilização de redes neurais convolucionais é uma técnica que melhora a aprendizagem das configurações de mão da língua brasileira de sinais em relação ao outro método de classificação disponível na literatura que foi testado com o mesmo conjunto de dados, apresentando uma acurácia de 97,98%. A diferença de desempenho entre os dois métodos, em termos de acurácia, foi avaliada com o teste qui-quadrado de Pearson, cujo resultado mostrou ser estatisticamente significativo.
author_additional Costa, Marly Guimarães Fernandes
author_additionalStr Costa, Marly Guimarães Fernandes
format Dissertação
author Oliveira, Anne de Souza
author2 http://lattes.cnpq.br/0700648537595120
author2Str http://lattes.cnpq.br/0700648537595120
title Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
title_short Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
title_full Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
title_fullStr Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
title_full_unstemmed Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
title_sort uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
publisher Universidade Federal do Amazonas
publishDate 2019
url https://tede.ufam.edu.br/handle/tede/6956
_version_ 1831969717923872768
score 11.753735