/img alt="Imagem da capa" class="recordcover" src="""/>
Dissertação
Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos
Um problema bastante relevante para a análise de comentários postados por usuários em redes sociais é a identificação das entidades que são o alvo destes comentários. No entanto, identificar corretamente as entidades mencionadas em textos produzidos pelos usuários é uma tarefa desafiadora, visto...
Autor principal: | Barros, Diego de Azevedo |
---|---|
Outros Autores: | http://lattes.cnpq.br/1518552520629014 |
Grau: | Dissertação |
Idioma: | por |
Publicado em: |
Universidade Federal do Amazonas
2016
|
Assuntos: | |
Acesso em linha: |
http://tede.ufam.edu.br/handle/tede/5291 |
id |
oai:https:--tede.ufam.edu.br-handle-:tede-5291 |
---|---|
recordtype |
dspace |
spelling |
oai:https:--tede.ufam.edu.br-handle-:tede-52912016-11-30T05:03:45Z Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos Barros, Diego de Azevedo Silva, Altigran Soares da http://lattes.cnpq.br/1518552520629014 http://lattes.cnpq.br/3405503472010994 Ferramenta GameSpotter Domínio de Jogo Regras de Desambiguação Método de Desambiguação CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Um problema bastante relevante para a análise de comentários postados por usuários em redes sociais é a identificação das entidades que são o alvo destes comentários. No entanto, identificar corretamente as entidades mencionadas em textos produzidos pelos usuários é uma tarefa desafiadora, visto que uma mesma entidade pode ser mencionada de várias maneiras diferentes, dependendo do usuário e de como a menção está sendo feita. Além disso, esses comentários são caracterizados por texto com baixa qualidade de escrita, erros ortográficos, gramaticais, etc. Neste trabalho, apresentamos um estudo de caso sobre o problema de identificação e desambiguação de menções a entidades em conteúdo gerado por usuários, voltado para o domínio de jogos. A escolha deste domínio deve-se à importância econômica e cultural deste tipo de conteúdo e também ao fato de a maioria dos trabalhos na literatura relacionada recente abordar este problema no contexto de produtos eletrônicos (televisores, smartphones, etc.). Como estratégia para a realização deste estudo de caso, desenvolvemos uma ferramenta chamada GameSpotter, que utiliza métodos de reconhecimento de entidades nomeadas (named entity recognition - NER) e de desambiguação de entidades nomeadas (named entity disambiguation - NED) para identificar e desambiguar as menções a jogos nos comentários postados em um fórum real daWeb. Para tanto, desenvolvemos dois métodos alternativos NER e um método de NED voltados ao domínio de jogos. Nossos resultados experimentais mostraram que nossos métodos de NER e NED são efetivos, tendo alcançado em média uma precisão de 0,93 e 0,83 em relação ao reconhecimento e desambiguação de menções a jogos, respectivamente. A very important issue for the analysis of comments posted by users in social networks is the identification of the entities that are the target of these comments. However, correctly identifying the entities mentioned in texts produced by users is a challenging task, since the same entity can be mentioned in several different ways, depending on the user and on how the mention is being made. In addition, these comments are characterized by text with low-quality writing, misspellings, grammatical errors, etc. In this work, we present a case study on the problem of identification and disambiguation of mentions to entities in user-generated content, focused on the domain of games. The choice of this domain is due to the economic and cultural importance of this type of content and also because most of the work in recent literature related to this problems focuses on the context of electronics (televisions, smartphones, etc.). As a strategy for carrying out this case study, we have developed a tool called GameSpotter, which uses methods of named entity recognition - NER and named entity disambiguation - NED to identify and disambiguate mentions to games in comments posted on a real Web forum. Therefore, we have developed two alternative NER methods and one NED method focused on the domain of games. Our experimental results showed that our NER and NED methods are effective, achieving an average precision of 0.93 and 0.83 in the recognition and disambiguation mentions of games, respectively. CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior 2016-11-29T15:11:33Z 2016-07-12 Dissertação BARROS, Diego de Azevedo. Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos. 2016. 81 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2016. http://tede.ufam.edu.br/handle/tede/5291 por Acesso Aberto application/pdf Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática |
institution |
TEDE - Universidade Federal do Amazonas |
collection |
TEDE-UFAM |
language |
por |
topic |
Ferramenta GameSpotter Domínio de Jogo Regras de Desambiguação Método de Desambiguação CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
spellingShingle |
Ferramenta GameSpotter Domínio de Jogo Regras de Desambiguação Método de Desambiguação CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Barros, Diego de Azevedo Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos |
topic_facet |
Ferramenta GameSpotter Domínio de Jogo Regras de Desambiguação Método de Desambiguação CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
description |
Um problema bastante relevante para a análise de comentários postados por usuários em
redes sociais é a identificação das entidades que são o alvo destes comentários. No
entanto, identificar corretamente as entidades mencionadas em textos produzidos pelos
usuários é uma tarefa desafiadora, visto que uma mesma entidade pode ser mencionada
de várias maneiras diferentes, dependendo do usuário e de como a menção está sendo
feita. Além disso, esses comentários são caracterizados por texto com baixa qualidade
de escrita, erros ortográficos, gramaticais, etc. Neste trabalho, apresentamos um estudo
de caso sobre o problema de identificação e desambiguação de menções a entidades em
conteúdo gerado por usuários, voltado para o domínio de jogos. A escolha deste domínio
deve-se à importância econômica e cultural deste tipo de conteúdo e também ao fato de a
maioria dos trabalhos na literatura relacionada recente abordar este problema no contexto
de produtos eletrônicos (televisores, smartphones, etc.). Como estratégia para a realização
deste estudo de caso, desenvolvemos uma ferramenta chamada GameSpotter, que
utiliza métodos de reconhecimento de entidades nomeadas (named entity recognition -
NER) e de desambiguação de entidades nomeadas (named entity disambiguation - NED)
para identificar e desambiguar as menções a jogos nos comentários postados em um fórum
real daWeb. Para tanto, desenvolvemos dois métodos alternativos NER e um método
de NED voltados ao domínio de jogos. Nossos resultados experimentais mostraram que
nossos métodos de NER e NED são efetivos, tendo alcançado em média uma precisão de
0,93 e 0,83 em relação ao reconhecimento e desambiguação de menções a jogos, respectivamente. |
author_additional |
Silva, Altigran Soares da |
author_additionalStr |
Silva, Altigran Soares da |
format |
Dissertação |
author |
Barros, Diego de Azevedo |
author2 |
http://lattes.cnpq.br/1518552520629014 |
author2Str |
http://lattes.cnpq.br/1518552520629014 |
title |
Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos |
title_short |
Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos |
title_full |
Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos |
title_fullStr |
Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos |
title_full_unstemmed |
Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos |
title_sort |
identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos |
publisher |
Universidade Federal do Amazonas |
publishDate |
2016 |
url |
http://tede.ufam.edu.br/handle/tede/5291 |
_version_ |
1831969428080689152 |
score |
11.755432 |