/img alt="Imagem da capa" class="recordcover" src="""/>
Dissertação
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
Este trabalho apresenta a utilização de redes neurais convolucionais na classificação das configurações de mão da língua brasileira de sinais. Para elaborar modelos com capacidade de aprendizagem relacionada a essa língua, foi utilizado o conjunto de dados LibrasImage. As arquiteturas de redes utili...
Autor principal: | Oliveira, Anne de Souza |
---|---|
Outros Autores: | http://lattes.cnpq.br/0700648537595120 |
Grau: | Dissertação |
Idioma: | por |
Publicado em: |
Universidade Federal do Amazonas
2019
|
Assuntos: | |
Acesso em linha: |
https://tede.ufam.edu.br/handle/tede/6956 |
id |
oai:https:--tede.ufam.edu.br-handle-:tede-6956 |
---|---|
recordtype |
dspace |
spelling |
oai:https:--tede.ufam.edu.br-handle-:tede-69562019-02-19T05:03:52Z Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais Oliveira, Anne de Souza Costa, Marly Guimarães Fernandes http://lattes.cnpq.br/0700648537595120 http://lattes.cnpq.br/7169358412541736 Pereira, José Raimundo Gomes http://lattes.cnpq.br/3697983438100904 Oliveira, Jozias Parente de http://lattes.cnpq.br/1169202481169729 Língua Brasileira de Sinais Redes neurais convolucionais Reconhecimento de sinais Aprendizagem profunda Técnicas de regularização Dropout L2 Classificação das configurações de mão ENGENHARIAS: ENGENHARIA ELÉTRICA Este trabalho apresenta a utilização de redes neurais convolucionais na classificação das configurações de mão da língua brasileira de sinais. Para elaborar modelos com capacidade de aprendizagem relacionada a essa língua, foi utilizado o conjunto de dados LibrasImage. As arquiteturas de redes utilizadas foram selecionadas com base na pesquisa bibliográfica sistemática realizada. Diferentes valores de hiperparâmetros foram testados para verificação e escolha daqueles que melhor se adequassem a tarefa de classificação. Os treinamentos dos modelos foram realizados por 500 épocas com três arquiteturas diferentes e duas técnicas de regularização (dropout e L2). Para testar o desempenho dos doze modelos com relação a classificação das configurações de mão, a acurácia foi a medida de desempenho escolhida para comparação. Para cada uma das arquiteturas, o modelo com maior acurácia foi selecionado para ser analisado com relação a sensibilidade, área sob a curva ROC e taxa de erro para cada uma das configurações de mão presentes no conjunto de dados LibrasImage. O modelo com melhor desempenho com relação as medidas citadas, foi comparado ao modelo treinado com o classificador k-vizinhos mais próximos, apresentado no trabalho de Costa Filho et al. (2017), para diferentes medidas de avaliação: acurácia, sensibilidade, precisão e F1 score. Os resultados mostraram que a utilização de redes neurais convolucionais é uma técnica que melhora a aprendizagem das configurações de mão da língua brasileira de sinais em relação ao outro método de classificação disponível na literatura que foi testado com o mesmo conjunto de dados, apresentando uma acurácia de 97,98%. A diferença de desempenho entre os dois métodos, em termos de acurácia, foi avaliada com o teste qui-quadrado de Pearson, cujo resultado mostrou ser estatisticamente significativo. This work presents a method to classify Brazilian sign language hand configurations using convolutional neural networks. The network architectures used were selected based on a systematic bibliographic research. Several experiments were done using different values of hyperparameters aiming to obtain the best fit the classification task. The models training was carried out for 500 epochs using three different architectures and two regularization techniques (dropout and L2). LibrasImage, a data set of hand configurations depth images was used in the training and testing steps of the models. The models were analyzed with respect to the accuracy, sensitivity, area under the ROC curve and error rate for each hand configuration. The best result obtained was an accuracy of 97.98%. This result shows that the use of convolutional neural network improves the classification of Brazilian sign language hand configurations in relation to the method that uses the k-nearest neighbor classifier, that was tested with the same dataset. The difference in performance between the two methods was statistically significant by Pearson chi-square test. 2019-02-18T14:49:04Z 2019-01-03 Dissertação OLIVEIRA, Anne de Souza. Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais. 2019. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Faculdade de Tecnologia, Universidade Federal do Amazonas, Manaus, 2019. https://tede.ufam.edu.br/handle/tede/6956 por Acesso Aberto http://creativecommons.org/licenses/by/4.0/ image/png application/pdf Universidade Federal do Amazonas Faculdade de Tecnologia Brasil UFAM Programa de Pós-graduação em Engenharia Elétrica |
institution |
TEDE - Universidade Federal do Amazonas |
collection |
TEDE-UFAM |
language |
por |
topic |
Língua Brasileira de Sinais Redes neurais convolucionais Reconhecimento de sinais Aprendizagem profunda Técnicas de regularização Dropout L2 Classificação das configurações de mão ENGENHARIAS: ENGENHARIA ELÉTRICA |
spellingShingle |
Língua Brasileira de Sinais Redes neurais convolucionais Reconhecimento de sinais Aprendizagem profunda Técnicas de regularização Dropout L2 Classificação das configurações de mão ENGENHARIAS: ENGENHARIA ELÉTRICA Oliveira, Anne de Souza Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais |
topic_facet |
Língua Brasileira de Sinais Redes neurais convolucionais Reconhecimento de sinais Aprendizagem profunda Técnicas de regularização Dropout L2 Classificação das configurações de mão ENGENHARIAS: ENGENHARIA ELÉTRICA |
description |
Este trabalho apresenta a utilização de redes neurais convolucionais na classificação das configurações de mão da língua brasileira de sinais. Para elaborar modelos com capacidade de aprendizagem relacionada a essa língua, foi utilizado o conjunto de dados LibrasImage. As arquiteturas de redes utilizadas foram selecionadas com base na pesquisa bibliográfica sistemática realizada. Diferentes valores de hiperparâmetros foram testados para verificação e escolha daqueles que melhor se adequassem a tarefa de classificação. Os treinamentos dos modelos foram realizados por 500 épocas com três arquiteturas diferentes e duas técnicas de regularização (dropout e L2). Para testar o desempenho dos doze modelos com relação a classificação das
configurações de mão, a acurácia foi a medida de desempenho escolhida para comparação. Para cada uma das arquiteturas, o modelo com maior acurácia foi selecionado para ser analisado com relação a sensibilidade, área sob a curva ROC e taxa de erro para cada uma das configurações de mão presentes no conjunto de dados LibrasImage. O modelo com melhor desempenho com relação as medidas citadas, foi comparado ao modelo treinado com o classificador k-vizinhos mais próximos, apresentado no trabalho de Costa Filho et al. (2017), para diferentes medidas de avaliação: acurácia, sensibilidade, precisão e F1 score. Os resultados mostraram que a utilização de redes neurais convolucionais é uma técnica que melhora a aprendizagem das configurações de mão da língua brasileira de sinais em relação ao outro método de classificação disponível
na literatura que foi testado com o mesmo conjunto de dados, apresentando uma acurácia de 97,98%. A diferença de desempenho entre os dois métodos, em termos de acurácia, foi avaliada com o teste qui-quadrado de Pearson, cujo resultado mostrou ser estatisticamente significativo. |
author_additional |
Costa, Marly Guimarães Fernandes |
author_additionalStr |
Costa, Marly Guimarães Fernandes |
format |
Dissertação |
author |
Oliveira, Anne de Souza |
author2 |
http://lattes.cnpq.br/0700648537595120 |
author2Str |
http://lattes.cnpq.br/0700648537595120 |
title |
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais |
title_short |
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais |
title_full |
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais |
title_fullStr |
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais |
title_full_unstemmed |
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais |
title_sort |
uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais |
publisher |
Universidade Federal do Amazonas |
publishDate |
2019 |
url |
https://tede.ufam.edu.br/handle/tede/6956 |
_version_ |
1831969717923872768 |
score |
11.753735 |