/img alt="Imagem da capa" class="recordcover" src="""/>
Dissertação
Uma abordagem para seleção de tópicos relevantes em redes sociais online
O crescente uso das redes sociais fez com que a quantidade de informações que são compartilhadas diariamente (opiniões pessoais, notícias e eventos do tipo natural ou social) aumentasse, tornando estas redes uma fonte de informaç cãoo sobre eventos. No Brasil, acontecimentos recentes, como a Operaçã...
Autor principal: | Souza, Bruno Ábia |
---|---|
Outros Autores: | http://lattes.cnpq.br/8539800386696490 |
Grau: | Dissertação |
Idioma: | por |
Publicado em: |
Universidade Federal do Amazonas
2019
|
Assuntos: | |
Acesso em linha: |
https://tede.ufam.edu.br/handle/tede/7232 |
id |
oai:https:--tede.ufam.edu.br-handle-:tede-7232 |
---|---|
recordtype |
dspace |
spelling |
oai:https:--tede.ufam.edu.br-handle-:tede-72322019-07-02T05:03:37Z Uma abordagem para seleção de tópicos relevantes em redes sociais online Souza, Bruno Ábia Nakamura, Eduardo Freire http://lattes.cnpq.br/8539800386696490 http://lattes.cnpq.br/1448696292042915 Figueiredo, Carlos Maurício Seródio http://lattes.cnpq.br/9060002746939878 Costa, Elloá Barreto Guedes da http://lattes.cnpq.br/6466781778573760 Aprendizado do computador Redes sociais on-line Twitter (Rede social on-line) CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO O crescente uso das redes sociais fez com que a quantidade de informações que são compartilhadas diariamente (opiniões pessoais, notícias e eventos do tipo natural ou social) aumentasse, tornando estas redes uma fonte de informaç cãoo sobre eventos. No Brasil, acontecimentos recentes, como a Operação Lava Jato conduzida pela polícia Federal e o processo de impeachment da Presidente são exemplos de eventos que geraram repercussões nos meios de comunicação. Esses fatos marcantes, podem ser utilizados para caracterizar quais são os acontecimentos relevantes de um determinado evento. Nas redes sociais, esses acontecimentos geram discussões, compartilhamentos e novas notícias, onde informações relevantes acabam tendo mais repercussões. Contudo, processar uma elevada massa de dados a fim de eliminar ruídos e reconhecer informações torna-se muito custoso. Neste contexto, este trabalho tem como objetivo demonstrar uma abordagem para caracterização de informações relevantes de eventos, através da extração de tópicos em dados compartilhados no Twitter, onde avaliamos o desempenho de três métodos de aprendizagem de máquina (K-means, Latent Dirichlet Allocation - LDA e Non-Negative Matrix Factorization - NMF) usados para extrair tópicos sobre as bases de dados da Operação Lava Jato e do processo de impeachment da presidente do Brasil em duas arquiteturas de pré-processamento diferentes (tradicional e com reconhecimento de entidade), demonstrando que é possível utilizar uma rede social como fonte de dados para descobrir os tópicos relevantes através do sensoriamento de usuários que observam um evento. Em nossos experimentos, observamos que as técnicas de pré-processamento têm influência direta sobre o resultado da extração de tópicos. Além disso, observamos que a técnica Silhouette nos ajudou a encontrar o melhor valor de clusters para uma determinada amostra de dados. Nos resultados o NMF apresentou o melhor desempenho nas duas bases de dados, tanto na tarefa de extração de tópicos quanto no tempo de execução. The increasing use of social networks has made the amount of information that is shared daily (personal opinions, news and events of the natural or social type) increasing significantly, making social networks a source of information about events. In Brazil, recent events such as Lava Jato Operation conducted by the Federal Police and the impeachment process of the Brazil President are examples of events that have had repercussions in the traditional medias. These facts can be used to characterize the relevant informations of an event. In social networks, the events generate discussions, sharings and news posts, where relevant information have more repercussions. However, processing a large mass of data to eliminate noise and recognize the information becomes costly. In this context, this work aims to show an approach to the characterization of relevant information by extracting topics in shared data on Twitter, where we evaluate the performance of three methods of machine learning (K-means, Latent Dirichlet Allocation (LDA) and Non-Negative Matrix Factorization (NMF)) used to extract topics on Lava Jato's databases and the impeachment process of the Brazilian president in two different preprocessing architectures (traditional and with entity recognition), demonstrating that it is possible to use the social networks as a data source to discover the relevant topics through the sensing of users that observe an event. In our experiments, we observed that the preprocessing techniques have a direct influence on the result of the topics extraction. In addition, we observed that the Silhouette technique helped us to find the best value of clusters for a given data sample. In the results the NMF presented the best performance in both databases, both in the topic extraction task and in the execution time CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior 2019-07-01T19:41:40Z 2017-03-24 Dissertação SOUZA, Bruno Ábia. Uma abordagem para seleção de tópicos relevantes em redes sociais online. 2017. 81 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2017. https://tede.ufam.edu.br/handle/tede/7232 por Acesso Aberto application/pdf Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática |
institution |
TEDE - Universidade Federal do Amazonas |
collection |
TEDE-UFAM |
language |
por |
topic |
Aprendizado do computador Redes sociais on-line Twitter (Rede social on-line) CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
spellingShingle |
Aprendizado do computador Redes sociais on-line Twitter (Rede social on-line) CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Souza, Bruno Ábia Uma abordagem para seleção de tópicos relevantes em redes sociais online |
topic_facet |
Aprendizado do computador Redes sociais on-line Twitter (Rede social on-line) CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
description |
O crescente uso das redes sociais fez com que a quantidade de informações que são compartilhadas diariamente (opiniões pessoais, notícias e eventos do tipo natural ou social) aumentasse, tornando estas redes uma fonte de informaç cãoo sobre eventos. No Brasil, acontecimentos recentes, como a Operação Lava Jato conduzida pela polícia Federal e o processo de impeachment da Presidente são exemplos de eventos que geraram repercussões nos meios de comunicação. Esses fatos marcantes, podem ser utilizados para caracterizar quais são os acontecimentos relevantes de um determinado evento.
Nas redes sociais, esses acontecimentos geram discussões, compartilhamentos e novas notícias, onde informações relevantes acabam tendo mais repercussões. Contudo, processar uma elevada massa de dados a fim de eliminar ruídos e reconhecer informações torna-se muito custoso.
Neste contexto, este trabalho tem como objetivo demonstrar uma abordagem para caracterização de informações relevantes de eventos, através da extração de tópicos em dados compartilhados no Twitter, onde avaliamos o desempenho de três métodos de aprendizagem de máquina (K-means, Latent Dirichlet Allocation - LDA e Non-Negative Matrix Factorization - NMF) usados para extrair tópicos sobre as bases de dados da Operação Lava Jato e do processo de impeachment da presidente do Brasil em duas arquiteturas de pré-processamento diferentes (tradicional e com reconhecimento de entidade), demonstrando que é possível utilizar uma rede social como fonte de dados para descobrir os tópicos relevantes através do sensoriamento de usuários que observam um evento. Em nossos experimentos, observamos que as técnicas de pré-processamento têm influência direta sobre o resultado da extração de tópicos. Além disso, observamos que a técnica Silhouette nos ajudou a encontrar o melhor valor de clusters para uma determinada amostra de dados. Nos resultados o NMF apresentou o melhor desempenho nas duas bases de dados, tanto na tarefa de extração de tópicos quanto no tempo de execução. |
author_additional |
Nakamura, Eduardo Freire |
author_additionalStr |
Nakamura, Eduardo Freire |
format |
Dissertação |
author |
Souza, Bruno Ábia |
author2 |
http://lattes.cnpq.br/8539800386696490 |
author2Str |
http://lattes.cnpq.br/8539800386696490 |
title |
Uma abordagem para seleção de tópicos relevantes em redes sociais online |
title_short |
Uma abordagem para seleção de tópicos relevantes em redes sociais online |
title_full |
Uma abordagem para seleção de tópicos relevantes em redes sociais online |
title_fullStr |
Uma abordagem para seleção de tópicos relevantes em redes sociais online |
title_full_unstemmed |
Uma abordagem para seleção de tópicos relevantes em redes sociais online |
title_sort |
uma abordagem para seleção de tópicos relevantes em redes sociais online |
publisher |
Universidade Federal do Amazonas |
publishDate |
2019 |
url |
https://tede.ufam.edu.br/handle/tede/7232 |
_version_ |
1831969770149249024 |
score |
11.755432 |