/img alt="Imagem da capa" class="recordcover" src="""/>
Dissertação
Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina
As informações compartilhadas na Web se propagam rapidamente, sejam elas verdadeiras ou não. O objetivo de reproduzir informações incorretas ou falsas está relacionado a diversos fatores como manipulação política, obtenção de benefícios financeiros, disseminação de difamações, entre outros. Sendo as...
Autor principal: | Costa, Elizangela Santos da |
---|---|
Outros Autores: | http://lattes.cnpq.br/3561853279775806 |
Grau: | Dissertação |
Idioma: | por |
Publicado em: |
Universidade Federal do Amazonas
2020
|
Assuntos: | |
Acesso em linha: |
https://tede.ufam.edu.br/handle/tede/7807 |
id |
oai:https:--tede.ufam.edu.br-handle-:tede-7807 |
---|---|
recordtype |
dspace |
spelling |
oai:https:--tede.ufam.edu.br-handle-:tede-78072020-06-06T05:03:58Z Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina Costa, Elizangela Santos da Feitosa, Eduardo Luzeiro http://lattes.cnpq.br/3561853279775806 http://lattes.cnpq.br/5939944067207881 Giusti, Rafael http://lattes.cnpq.br/0613781010575440 Santin, Altair Olivo http://lattes.cnpq.br/9604696592563769 Segurança da informação Select kbest Classificadores de aprendizagem de máquina Seleção RFECV Random Forest CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Credibilidade Avaliação de credibilidade Web Atributos As informações compartilhadas na Web se propagam rapidamente, sejam elas verdadeiras ou não. O objetivo de reproduzir informações incorretas ou falsas está relacionado a diversos fatores como manipulação política, obtenção de benefícios financeiros, disseminação de difamações, entre outros. Sendo assim, verificar a credibilidade das informações disponíveis na Web acaba sendo uma tarefa obrigatória. Dentre as diversas soluções desenvolvidas para detectar se uma página Web pode ser acreditada ou não, as baseadas em aprendizagem de máquina são a mais empregadas. Esta dissertação visa avaliar e definir atributos empregáveis em um futuro modelo de avaliação de credibilidade de páginas Web, por meio da extração de características do conteúdo da página e da rede, com o auxílio de classificadores de aprendizagem de máquina, possibilitando assim maior certeza sobre a credibilidade de páginas Web. Como resultado, esta dissertação concluiu que o classificador Random Forest teve o melhor resultado para avaliação de credibilidade de páginas web com 95.36% de acurácia. Além de disponibilizar um script de extração de atributos, apontou também quais são os atributos mais relevantes e de fácil extração que podem ser obtidos e qualquer URL, para isso utilizou 3 métodos de seleção de atributos: Select kbest, Seleção RFE e Seleção RFECV, no qual este último apresentou o melhor resultado com 95.33% de acurácia. Information shared on the Web propagates quickly, whether true or not. Credibility in this context refers to the level of trust a user places subjectively on a Web page. The purpose of reproducing incorrect information is related to several factors such as political manipulation, obtain financial benefits, disseminate malicious defamation, among others. Therefore, verifying the credibility of the information available on the Web ends up being a mandatory task. Among the various techniques developed to detect whether aWeb page can be accredited or not, machine learning is the most used in comparison to the assessment of credibility manually. The purpose of this work is to evaluate and define attributes that can be used in a future model for assessing the credibility of Web pages, by extracting characteristics from the content of the page and the network, with the help of machine learning classifiers, thus enabling greater certainty on the credibility of web pages. As a result, this dissertation concluded that the Random Forest classifier had the best result for assessing the credibility of web pages with 95.36% accuracy. In addition to providing an attribute extraction script, also pointing out which are the most relevant and easy extraction attributes that can be selected for any URL, for that, 3 attribute selection methods are used: Select the best, RFE Selection and Selection RFECV, the last result with 95.33% accuracy. 2020-06-05T18:41:08Z 2020-05-11 Dissertação COSTA, Elizangela Santos da. Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina. 2020. 54 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2020. https://tede.ufam.edu.br/handle/tede/7807 por Acesso Aberto http://creativecommons.org/licenses/by/4.0/ application/pdf Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática |
institution |
TEDE - Universidade Federal do Amazonas |
collection |
TEDE-UFAM |
language |
por |
topic |
Segurança da informação Select kbest Classificadores de aprendizagem de máquina Seleção RFECV Random Forest CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Credibilidade Avaliação de credibilidade Web Atributos |
spellingShingle |
Segurança da informação Select kbest Classificadores de aprendizagem de máquina Seleção RFECV Random Forest CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Credibilidade Avaliação de credibilidade Web Atributos Costa, Elizangela Santos da Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina |
topic_facet |
Segurança da informação Select kbest Classificadores de aprendizagem de máquina Seleção RFECV Random Forest CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Credibilidade Avaliação de credibilidade Web Atributos |
description |
As informações compartilhadas na Web se propagam rapidamente, sejam elas verdadeiras ou não. O objetivo de reproduzir informações incorretas ou falsas está relacionado a diversos fatores como manipulação política, obtenção de benefícios financeiros, disseminação de difamações, entre outros. Sendo assim, verificar a credibilidade das informações disponíveis na Web acaba sendo uma tarefa obrigatória. Dentre as diversas soluções desenvolvidas para detectar se uma página Web pode ser acreditada ou não, as baseadas em aprendizagem de máquina são a mais empregadas. Esta dissertação visa avaliar e definir atributos empregáveis em um futuro modelo de avaliação de credibilidade de páginas Web, por meio da extração de características do conteúdo da página e da rede, com o auxílio de classificadores de aprendizagem de máquina, possibilitando assim maior certeza sobre a credibilidade de páginas Web. Como resultado, esta dissertação concluiu que o classificador Random Forest teve o melhor resultado para avaliação de credibilidade de páginas web com 95.36% de acurácia. Além de disponibilizar um script de extração de atributos, apontou também quais são os atributos mais relevantes e de fácil extração que podem ser obtidos e qualquer URL, para isso utilizou 3 métodos de seleção de atributos: Select kbest, Seleção RFE e Seleção RFECV, no qual este último apresentou o melhor resultado com 95.33% de acurácia. |
author_additional |
Feitosa, Eduardo Luzeiro |
author_additionalStr |
Feitosa, Eduardo Luzeiro |
format |
Dissertação |
author |
Costa, Elizangela Santos da |
author2 |
http://lattes.cnpq.br/3561853279775806 |
author2Str |
http://lattes.cnpq.br/3561853279775806 |
title |
Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina |
title_short |
Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina |
title_full |
Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina |
title_fullStr |
Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina |
title_full_unstemmed |
Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina |
title_sort |
avaliando atributos de credibilidade de páginas web utilizando aprendizagem de máquina |
publisher |
Universidade Federal do Amazonas |
publishDate |
2020 |
url |
https://tede.ufam.edu.br/handle/tede/7807 |
_version_ |
1831969875712540672 |
score |
11.753735 |