Uma investigação do uso de características na tetecção de URLs

Bezerra, Maria Azevedo; http://lattes.cnpq.br/8958421325539732

Dissertação

Uma investigação do uso de características na tetecção de URLs

URLs maliciosas tornaram-se um canal para atividades criminosas na Internet, como spam e phishing. As atuais soluções para validação e verificação de URLs maliciosas se consideram ou são consideradas precisas, com resultados bem ajustados. Contudo, será que realmente é possível ou factível se obter...

ver descrição completa

Autor principal:	Bezerra, Maria Azevedo
Outros Autores:	http://lattes.cnpq.br/8958421325539732
Grau:	Dissertação
Idioma:	por
Publicado em:	Universidade Federal do Amazonas 2015
Assuntos:	Métodos e Algoritmos de Classificação Características de URLs Aprendizagem de Máquina CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Acesso em linha:	http://tede.ufam.edu.br/handle/tede/4740

id	oai:https:--tede.ufam.edu.br-handle-:tede-4740
recordtype	dspace
spelling	oai:https:--tede.ufam.edu.br-handle-:tede-47402018-11-08T19:08:50Z Uma investigação do uso de características na tetecção de URLs Bezerra, Maria Azevedo Feitosa, Eduardo Luzeiro http://lattes.cnpq.br/8958421325539732 http://lattes.cnpq.br/5939944067207881 Métodos e Algoritmos de Classificação Características de URLs Aprendizagem de Máquina CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO URLs maliciosas tornaram-se um canal para atividades criminosas na Internet, como spam e phishing. As atuais soluções para validação e verificação de URLs maliciosas se consideram ou são consideradas precisas, com resultados bem ajustados. Contudo, será que realmente é possível ou factível se obter percentuais beirando 100% de precisão nessas soluções? Neste sentido, esta dissertação descreve uma simples e direta investigação de características, bases e formatos de URLs, visando mostrar que os resultados de validação e verificação de URLs são bastante dependentes de certos aspectos/fatores. A ideia é extrair características (léxicas, DNS e outras) que permitam obter o máximo de informação das URLs e empregar algoritmos de aprendizagem de máquina para questionar a influência dessas características em todo o processo. Como forma de provar essa ideia, foram elaboramos quatro hipóteses, que ao final no trabalho, mostraram que é possível discordar do resultado de vários trabalhos já existentes na literatura. Malicious URLs have become a channel for criminal activities on the Internet, such as spam and phishing. Current solutions for validation and verification of malicious URLs are considered or are believed to be accurate, with well-adjusted results. However, is it really possible or feasible to obtain 100% of accuracy in these solutions? This work describes a simple and direct investigation of features, bases and URL formats, aiming to show that the results of validation and verification URLs are highly dependent on certain aspects/factors. The idea is to extract URL features (lexical, DNS and others) for obtain the maximum information from the URLs and employ machine learning algorithms to question their influence throughout the process. In order to prove this idea, were created four hypotheses that showed that it is possible to disagree with the results of several studies from the literature. Não Informada 2015-12-03T19:24:08Z 2015-09-11 Dissertação BEZERRA, Maria Azevedo. Uma investigação do uso de características na detecção de URLs. 2015. 62 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2015. http://tede.ufam.edu.br/handle/tede/4740 por Acesso Aberto application/pdf Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática
institution	TEDE - Universidade Federal do Amazonas
collection	TEDE-UFAM
language	por
topic	Métodos e Algoritmos de Classificação Características de URLs Aprendizagem de Máquina CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
spellingShingle	Métodos e Algoritmos de Classificação Características de URLs Aprendizagem de Máquina CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Bezerra, Maria Azevedo Uma investigação do uso de características na tetecção de URLs
topic_facet	Métodos e Algoritmos de Classificação Características de URLs Aprendizagem de Máquina CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
description	URLs maliciosas tornaram-se um canal para atividades criminosas na Internet, como spam e phishing. As atuais soluções para validação e verificação de URLs maliciosas se consideram ou são consideradas precisas, com resultados bem ajustados. Contudo, será que realmente é possível ou factível se obter percentuais beirando 100% de precisão nessas soluções? Neste sentido, esta dissertação descreve uma simples e direta investigação de características, bases e formatos de URLs, visando mostrar que os resultados de validação e verificação de URLs são bastante dependentes de certos aspectos/fatores. A ideia é extrair características (léxicas, DNS e outras) que permitam obter o máximo de informação das URLs e empregar algoritmos de aprendizagem de máquina para questionar a influência dessas características em todo o processo. Como forma de provar essa ideia, foram elaboramos quatro hipóteses, que ao final no trabalho, mostraram que é possível discordar do resultado de vários trabalhos já existentes na literatura.
author_additional	Feitosa, Eduardo Luzeiro
author_additionalStr	Feitosa, Eduardo Luzeiro
format	Dissertação
author	Bezerra, Maria Azevedo
author2	http://lattes.cnpq.br/8958421325539732
author2Str	http://lattes.cnpq.br/8958421325539732
title	Uma investigação do uso de características na tetecção de URLs
title_short	Uma investigação do uso de características na tetecção de URLs
title_full	Uma investigação do uso de características na tetecção de URLs
title_fullStr	Uma investigação do uso de características na tetecção de URLs
title_full_unstemmed	Uma investigação do uso de características na tetecção de URLs
title_sort	uma investigação do uso de características na tetecção de urls
publisher	Universidade Federal do Amazonas
publishDate	2015
url	http://tede.ufam.edu.br/handle/tede/4740
_version_	1831969336209702912
score	11.755432

Uma investigação do uso de características na tetecção de URLs

Registros relacionados