Dissertação

Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil

O crescimento no número de usuários fez com que as redes sociais, especialmente o Twitter, tornassem-se suscetíveis a criação e propagação de postagens automatizadas. No Twitter, a lista de tópicos de tendência representa os assuntos mais comentados em determinada região e pode ser utilizada indevid...

ver descrição completa

Autor principal: Silva, Adeilson Souza da
Outros Autores: http://lattes.cnpq.br/7277627592187255
Grau: Dissertação
Idioma: por
Publicado em: Universidade Federal do Amazonas 2019
Assuntos:
Acesso em linha: https://tede.ufam.edu.br/handle/tede/6930
id oai:https:--tede.ufam.edu.br-handle-:tede-6930
recordtype dspace
spelling oai:https:--tede.ufam.edu.br-handle-:tede-69302019-02-08T05:03:52Z Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil Detecting automated behavior in Twitter trend topics in Brazil Silva, Adeilson Souza da Feitosa, Eduardo Luzeiro http://lattes.cnpq.br/7277627592187255 http://lattes.cnpq.br/5939944067207881 Souto, Eduardo James Pereira http://lattes.cnpq.br/3875301617975895 Batista, Daniel Macêdo http://lattes.cnpq.br/2934786440085983 Tweets Tópicos de Tendência Entropia Aprendizagem de Máquina Trend Topics Entropy Machine Learning CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO O crescimento no número de usuários fez com que as redes sociais, especialmente o Twitter, tornassem-se suscetíveis a criação e propagação de postagens automatizadas. No Twitter, a lista de tópicos de tendência representa os assuntos mais comentados em determinada região e pode ser utilizada indevidamente por contas automatizadas. É necessário então entender e estudar a forma como esses usuários se comportam a fim de criar medidas para combatê-los e garantir que os dados publicados possuam credibilidade. Utilizando uma base de dados real coletada dos tópicos de tendência do Twitter no Brasil, no período de dezembro de 2013 a junho de 2014, com 2.853.822 contas e 11.294.861 tweets, uma metodologia para detectar comportamento automatizado nos tópicos de tendência do Twitter foi proposta. Para tanto, foram estudadas diversas características de texto e do comportamento dos usuários para identificar atributos capazes de dis- tiguir usuários humanos de usuários automatizados. Também foram propostas seis (6) novas características extraídas do texto dos tweets baseadas no conceito de Entropia. Utilizando esse conjunto de atributos com algoritmos de aprendizagem de máquina supervisionada para classificação, foi possível detectar 92% das contas automatizadas na base de dados utilizada e, assim, obter uma visão do comportamento desses usuários. The growth in the number of users in social networks, especially Twitter, become themselves susceptible to creation and propagation of automated posts. On Twitter, the Trend Topics list represents the most talked subjects in a particular region and can be misused by automated accounts. Then, it is necessary to understand and study how these users behave in order to create measures to combat them and ensure that published data have credibility. Using a real database collected from the Twitter Trend Topics in Brazil, from December 2013 to June 2014, with 2.853,822 accounts and 11,294,861 tweets, a methodology to detect automated behavior in Trend Topics was proposed. For this, we studied several text characteristics and user behavior to identify attributes capable of distiguish human users and automated users. Also were proposed six (6) new features based on the concept of entropy. Using this set of attributes with ma-chine learning algorithms for supervised classification, it was possible to detect 92 % of automated accounts in the database used and thus get an insight into the behavior of these users. FAPEAM - Fundação de Amparo à Pesquisa do Estado do Amazonas 2019-02-07T17:42:00Z 2015-09-25 Dissertação SILVA, Adeilson Souza da. Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil. 2015. 87 f. Dissertação (Mestrado em Informática) - Instituto de Computação, Universidade Federal do Amazonas, Manaus, 2015. https://tede.ufam.edu.br/handle/tede/6930 por Acesso Aberto application/pdf Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática
institution TEDE - Universidade Federal do Amazonas
collection TEDE-UFAM
language por
topic Tweets
Tópicos de Tendência
Entropia
Aprendizagem de Máquina
Trend Topics
Entropy
Machine Learning
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
spellingShingle Tweets
Tópicos de Tendência
Entropia
Aprendizagem de Máquina
Trend Topics
Entropy
Machine Learning
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Silva, Adeilson Souza da
Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
topic_facet Tweets
Tópicos de Tendência
Entropia
Aprendizagem de Máquina
Trend Topics
Entropy
Machine Learning
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
description O crescimento no número de usuários fez com que as redes sociais, especialmente o Twitter, tornassem-se suscetíveis a criação e propagação de postagens automatizadas. No Twitter, a lista de tópicos de tendência representa os assuntos mais comentados em determinada região e pode ser utilizada indevidamente por contas automatizadas. É necessário então entender e estudar a forma como esses usuários se comportam a fim de criar medidas para combatê-los e garantir que os dados publicados possuam credibilidade. Utilizando uma base de dados real coletada dos tópicos de tendência do Twitter no Brasil, no período de dezembro de 2013 a junho de 2014, com 2.853.822 contas e 11.294.861 tweets, uma metodologia para detectar comportamento automatizado nos tópicos de tendência do Twitter foi proposta. Para tanto, foram estudadas diversas características de texto e do comportamento dos usuários para identificar atributos capazes de dis- tiguir usuários humanos de usuários automatizados. Também foram propostas seis (6) novas características extraídas do texto dos tweets baseadas no conceito de Entropia. Utilizando esse conjunto de atributos com algoritmos de aprendizagem de máquina supervisionada para classificação, foi possível detectar 92% das contas automatizadas na base de dados utilizada e, assim, obter uma visão do comportamento desses usuários.
author_additional Feitosa, Eduardo Luzeiro
author_additionalStr Feitosa, Eduardo Luzeiro
format Dissertação
author Silva, Adeilson Souza da
author2 http://lattes.cnpq.br/7277627592187255
author2Str http://lattes.cnpq.br/7277627592187255
title Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
title_short Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
title_full Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
title_fullStr Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
title_full_unstemmed Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
title_sort detectando comportamento automatizado nos tópicos de tendência do twitter no brasil
publisher Universidade Federal do Amazonas
publishDate 2019
url https://tede.ufam.edu.br/handle/tede/6930
_version_ 1831969713532436480
score 11.753735