Liardetector: a linguistic-based approach for identifying fake news

Almeida, Thais Gomes de; http://lattes.cnpq.br/5141073637181801

Dissertação

Liardetector: a linguistic-based approach for identifying fake news

Devido à infraestrutura da Web existente e à popularidade das plataformas de mídia sociais, é fácil compartilhar informações de forma massiva. Embora esse cenário online traga benefícios para a sociedade, ele também favorece que grupos maliciosos propaguem desinformação (notícias falsas) na Web, cau...

ver descrição completa

Autor principal:	Almeida, Thais Gomes de
Outros Autores:	http://lattes.cnpq.br/5141073637181801
Grau:	Dissertação
Idioma:	eng
Publicado em:	Universidade Federal do Amazonas 2020
Assuntos:	Fake news Aprendizado de máquina CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Notícias falsas Classificação Representação de dados Aprendizagem supervisionada
Acesso em linha:	https://tede.ufam.edu.br/handle/tede/7686

id	oai:https:--tede.ufam.edu.br-handle-:tede-7686
recordtype	dspace
spelling	oai:https:--tede.ufam.edu.br-handle-:tede-76862020-02-28T05:04:27Z Liardetector: a linguistic-based approach for identifying fake news Liardetector: uma abordagem baseada em aspectos linguísticos para identificar notícias falsas Almeida, Thais Gomes de Nakamura, Eduardo Freire http://lattes.cnpq.br/5141073637181801 http://lattes.cnpq.br/1448696292042915 Silva, Altigran Soares da http://lattes.cnpq.br/3405503472010994 Freire, Juliana Fake news Aprendizado de máquina CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Notícias falsas Classificação Representação de dados Aprendizagem supervisionada Devido à infraestrutura da Web existente e à popularidade das plataformas de mídia sociais, é fácil compartilhar informações de forma massiva. Embora esse cenário online traga benefícios para a sociedade, ele também favorece que grupos maliciosos propaguem desinformação (notícias falsas) na Web, causando danos que vão desde afetar a reputação de entidades públicas (empresas, celebridades) a interferir em processos políticos. Neste trabalho, propomos uma nova abordagem de classificação baseada em padrões linguísticos para identificar notícias falsas. Tal abordagem reduz a dimensionalidade do espaço de características ao codificar distribuições de probabilidade de tokens (por exemplo, palavras) como valores de divergência e entropia. Nós descrevemos resultados experimentais, usando vários conjuntos de dados, que mostram que nossa abordagem é uma solução que melhora tanto a eficácia, quanto eficiência de modelos de aprendizagem. Em comparação com o \textit{baseline}, nossa abordagem usa quatro ordens de magnitude menos atributos e obtém um ganho de até 74,3% de eficácia (Medida-F). Due to the existing Web infrastructure and the popularity of social media platforms, it is easy to share information in large scale. Although this online scenario brings benefits to the society, it also favors malicious groups that propagate misinformation (e.g., alternative facts, fake news) on the Web, causing damages that range from affecting the reputation of public entities (companies, celebrities) to interfering on political process. In this work, we propose a novel classification approach based on linguistic patterns for identifying fake news. Our approach reduces the dimensionality of the feature space by encoding probability distributions of tokens (e.g., words) as Shannon entropy and Jensen-Shannon divergence values. We report experimental results using multiple data sets, which show that our approach is a win-win solution that improves efficacy and efficiency. Compared to the baseline, our approach uses four orders of magnitude less features, and achieve a gain up to 74.3% of F1-score. CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior Fiz mestrado sanduíche na Universidade de Nova Iorque 2020-02-27T13:16:56Z 2019-04-18 Dissertação ALMEIDA, Thais Gomes de. Liardetector: a linguistic-based approach for identifying fake news. 2019. 86 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2019. https://tede.ufam.edu.br/handle/tede/7686 eng Acesso Aberto application/pdf Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática
institution	TEDE - Universidade Federal do Amazonas
collection	TEDE-UFAM
language	eng
topic	Fake news Aprendizado de máquina CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Notícias falsas Classificação Representação de dados Aprendizagem supervisionada
spellingShingle	Fake news Aprendizado de máquina CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Notícias falsas Classificação Representação de dados Aprendizagem supervisionada Almeida, Thais Gomes de Liardetector: a linguistic-based approach for identifying fake news
topic_facet	Fake news Aprendizado de máquina CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Notícias falsas Classificação Representação de dados Aprendizagem supervisionada
description	Devido à infraestrutura da Web existente e à popularidade das plataformas de mídia sociais, é fácil compartilhar informações de forma massiva. Embora esse cenário online traga benefícios para a sociedade, ele também favorece que grupos maliciosos propaguem desinformação (notícias falsas) na Web, causando danos que vão desde afetar a reputação de entidades públicas (empresas, celebridades) a interferir em processos políticos. Neste trabalho, propomos uma nova abordagem de classificação baseada em padrões linguísticos para identificar notícias falsas. Tal abordagem reduz a dimensionalidade do espaço de características ao codificar distribuições de probabilidade de tokens (por exemplo, palavras) como valores de divergência e entropia. Nós descrevemos resultados experimentais, usando vários conjuntos de dados, que mostram que nossa abordagem é uma solução que melhora tanto a eficácia, quanto eficiência de modelos de aprendizagem. Em comparação com o \textit{baseline}, nossa abordagem usa quatro ordens de magnitude menos atributos e obtém um ganho de até 74,3% de eficácia (Medida-F).
author_additional	Nakamura, Eduardo Freire
author_additionalStr	Nakamura, Eduardo Freire
format	Dissertação
author	Almeida, Thais Gomes de
author2	http://lattes.cnpq.br/5141073637181801
author2Str	http://lattes.cnpq.br/5141073637181801
title	Liardetector: a linguistic-based approach for identifying fake news
title_short	Liardetector: a linguistic-based approach for identifying fake news
title_full	Liardetector: a linguistic-based approach for identifying fake news
title_fullStr	Liardetector: a linguistic-based approach for identifying fake news
title_full_unstemmed	Liardetector: a linguistic-based approach for identifying fake news
title_sort	liardetector: a linguistic-based approach for identifying fake news
publisher	Universidade Federal do Amazonas
publishDate	2020
url	https://tede.ufam.edu.br/handle/tede/7686
_version_	1831969852983607296
score	11.753735

Liardetector: a linguistic-based approach for identifying fake news

Registros relacionados