Dissertação

Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos

Um problema bastante relevante para a análise de comentários postados por usuários em redes sociais é a identificação das entidades que são o alvo destes comentários. No entanto, identificar corretamente as entidades mencionadas em textos produzidos pelos usuários é uma tarefa desafiadora, visto...

ver descrição completa

Autor principal: Barros, Diego de Azevedo
Outros Autores: http://lattes.cnpq.br/1518552520629014
Grau: Dissertação
Idioma: por
Publicado em: Universidade Federal do Amazonas 2016
Assuntos:
Acesso em linha: http://tede.ufam.edu.br/handle/tede/5291
id oai:https:--tede.ufam.edu.br-handle-:tede-5291
recordtype dspace
spelling oai:https:--tede.ufam.edu.br-handle-:tede-52912016-11-30T05:03:45Z Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos Barros, Diego de Azevedo Silva, Altigran Soares da http://lattes.cnpq.br/1518552520629014 http://lattes.cnpq.br/3405503472010994 Ferramenta GameSpotter Domínio de Jogo Regras de Desambiguação Método de Desambiguação CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Um problema bastante relevante para a análise de comentários postados por usuários em redes sociais é a identificação das entidades que são o alvo destes comentários. No entanto, identificar corretamente as entidades mencionadas em textos produzidos pelos usuários é uma tarefa desafiadora, visto que uma mesma entidade pode ser mencionada de várias maneiras diferentes, dependendo do usuário e de como a menção está sendo feita. Além disso, esses comentários são caracterizados por texto com baixa qualidade de escrita, erros ortográficos, gramaticais, etc. Neste trabalho, apresentamos um estudo de caso sobre o problema de identificação e desambiguação de menções a entidades em conteúdo gerado por usuários, voltado para o domínio de jogos. A escolha deste domínio deve-se à importância econômica e cultural deste tipo de conteúdo e também ao fato de a maioria dos trabalhos na literatura relacionada recente abordar este problema no contexto de produtos eletrônicos (televisores, smartphones, etc.). Como estratégia para a realização deste estudo de caso, desenvolvemos uma ferramenta chamada GameSpotter, que utiliza métodos de reconhecimento de entidades nomeadas (named entity recognition - NER) e de desambiguação de entidades nomeadas (named entity disambiguation - NED) para identificar e desambiguar as menções a jogos nos comentários postados em um fórum real daWeb. Para tanto, desenvolvemos dois métodos alternativos NER e um método de NED voltados ao domínio de jogos. Nossos resultados experimentais mostraram que nossos métodos de NER e NED são efetivos, tendo alcançado em média uma precisão de 0,93 e 0,83 em relação ao reconhecimento e desambiguação de menções a jogos, respectivamente. A very important issue for the analysis of comments posted by users in social networks is the identification of the entities that are the target of these comments. However, correctly identifying the entities mentioned in texts produced by users is a challenging task, since the same entity can be mentioned in several different ways, depending on the user and on how the mention is being made. In addition, these comments are characterized by text with low-quality writing, misspellings, grammatical errors, etc. In this work, we present a case study on the problem of identification and disambiguation of mentions to entities in user-generated content, focused on the domain of games. The choice of this domain is due to the economic and cultural importance of this type of content and also because most of the work in recent literature related to this problems focuses on the context of electronics (televisions, smartphones, etc.). As a strategy for carrying out this case study, we have developed a tool called GameSpotter, which uses methods of named entity recognition - NER and named entity disambiguation - NED to identify and disambiguate mentions to games in comments posted on a real Web forum. Therefore, we have developed two alternative NER methods and one NED method focused on the domain of games. Our experimental results showed that our NER and NED methods are effective, achieving an average precision of 0.93 and 0.83 in the recognition and disambiguation mentions of games, respectively. CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior 2016-11-29T15:11:33Z 2016-07-12 Dissertação BARROS, Diego de Azevedo. Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos. 2016. 81 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2016. http://tede.ufam.edu.br/handle/tede/5291 por Acesso Aberto application/pdf Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática
institution TEDE - Universidade Federal do Amazonas
collection TEDE-UFAM
language por
topic Ferramenta GameSpotter
Domínio de Jogo
Regras de Desambiguação
Método de Desambiguação
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
spellingShingle Ferramenta GameSpotter
Domínio de Jogo
Regras de Desambiguação
Método de Desambiguação
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Barros, Diego de Azevedo
Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos
topic_facet Ferramenta GameSpotter
Domínio de Jogo
Regras de Desambiguação
Método de Desambiguação
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
description Um problema bastante relevante para a análise de comentários postados por usuários em redes sociais é a identificação das entidades que são o alvo destes comentários. No entanto, identificar corretamente as entidades mencionadas em textos produzidos pelos usuários é uma tarefa desafiadora, visto que uma mesma entidade pode ser mencionada de várias maneiras diferentes, dependendo do usuário e de como a menção está sendo feita. Além disso, esses comentários são caracterizados por texto com baixa qualidade de escrita, erros ortográficos, gramaticais, etc. Neste trabalho, apresentamos um estudo de caso sobre o problema de identificação e desambiguação de menções a entidades em conteúdo gerado por usuários, voltado para o domínio de jogos. A escolha deste domínio deve-se à importância econômica e cultural deste tipo de conteúdo e também ao fato de a maioria dos trabalhos na literatura relacionada recente abordar este problema no contexto de produtos eletrônicos (televisores, smartphones, etc.). Como estratégia para a realização deste estudo de caso, desenvolvemos uma ferramenta chamada GameSpotter, que utiliza métodos de reconhecimento de entidades nomeadas (named entity recognition - NER) e de desambiguação de entidades nomeadas (named entity disambiguation - NED) para identificar e desambiguar as menções a jogos nos comentários postados em um fórum real daWeb. Para tanto, desenvolvemos dois métodos alternativos NER e um método de NED voltados ao domínio de jogos. Nossos resultados experimentais mostraram que nossos métodos de NER e NED são efetivos, tendo alcançado em média uma precisão de 0,93 e 0,83 em relação ao reconhecimento e desambiguação de menções a jogos, respectivamente.
author_additional Silva, Altigran Soares da
author_additionalStr Silva, Altigran Soares da
format Dissertação
author Barros, Diego de Azevedo
author2 http://lattes.cnpq.br/1518552520629014
author2Str http://lattes.cnpq.br/1518552520629014
title Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos
title_short Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos
title_full Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos
title_fullStr Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos
title_full_unstemmed Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos
title_sort identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos
publisher Universidade Federal do Amazonas
publishDate 2016
url http://tede.ufam.edu.br/handle/tede/5291
_version_ 1831969428080689152
score 11.755432