Dissertação

Reconhecimento das configurações de mão da língua brasileira de sinais - LIBRAS em imagens de profundidade através da análise de componentes principais e do classificador k-vizinhos mais próximos

De acordo com o IBGE (Censo 2010), o Brasil possui 9,7 milhões de brasileiros com algum grau de deficiência auditiva, mais de cinco por cento da população. Para a maior parte destas pessoas a língua natural principal utilizada para sua comunicação é a LIBRAS (Língua Brasileira de Sinais) e não o por...

ver descrição completa

Autor principal: Souza, Robson Silva de
Outros Autores: http://lattes.cnpq.br/6520605275818926
Grau: Dissertação
Idioma: por
Publicado em: Universidade Federal do Amazonas 2016
Assuntos:
Acesso em linha: http://tede.ufam.edu.br/handle/tede/5012
Resumo:
De acordo com o IBGE (Censo 2010), o Brasil possui 9,7 milhões de brasileiros com algum grau de deficiência auditiva, mais de cinco por cento da população. Para a maior parte destas pessoas a língua natural principal utilizada para sua comunicação é a LIBRAS (Língua Brasileira de Sinais) e não o português. O reconhecimento de sinais visa permitir uma maior inserção sócio digital da comunidade surda através da interpretação da língua de sinais pelo computador em formato de áudio ou texto. Esta dissertação apresenta o reconhecimento de um dos parâmetros globais da LIBRAS, as configurações de mão, utilizando o classificador k-vizinhos mais próximos e a técnica de redução de dimensionalidade 2D²PCA. Um conjunto de dados, robusto e representativo das condições do cotidiano, constituído de 12.200 imagens de profundidade das 61 configurações de mão, capturadas pelo sensor Kinect® foi construído. Todas as imagens foram submetidas inicialmente a uma etapa de segmentação que buscou isolar a região da mão direita do resto do corpo. Buscando a eliminação de redundância no conjunto de dados foi implementado uma etapa de extração de características, através da técnica 2D2PCA que determina as formas mais representativas de dados a partir de combinações lineares dos pixels originais. O classificador “k-vizinhos mais próximos” foi a técnica utilizada para a etapa final de reconhecimento automático das configurações de mão. O referido classificador, implementado com k=1 e matriz de característica de 10x10, conseguiu o melhor desempenho, classificando corretamente 96,31% das amostras de testes. Foram obtidas taxas de acerto de 100% para seis configurações de mão.