Tese

Detecção de ruídos em repositórios de máquina de busca

Máquinas ou motores de busca são as ferramentas mais usadas para localizar informações na Internet. Para muitas empresas, a porta de entrada para seu negócio está nas respostas dadas por esses mecanismos a determinadas consultas. Por este motivo, é importante que suas páginas estejam bem posicionada...

ver descrição completa

Autor principal: Souza, Jucimar Brito de
Outros Autores: http://lattes.cnpq.br/0217852318751550
Grau: Tese
Idioma: por
Publicado em: Universidade Federal do Amazonas 2015
Assuntos:
Acesso em linha: http://tede.ufam.edu.br/handle/tede/3145
id oai:https:--tede.ufam.edu.br-handle-:tede-3145
recordtype dspace
spelling oai:https:--tede.ufam.edu.br-handle-:tede-31452018-03-23T17:38:39Z Detecção de ruídos em repositórios de máquina de busca Souza, Jucimar Brito de Moura, Edleno Silva de http://lattes.cnpq.br/0217852318751550 http://lattes.cnpq.br/4737852130924504 Máquina de Busca Repositórios de máquinas de busca Search engine CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Máquinas ou motores de busca são as ferramentas mais usadas para localizar informações na Internet. Para muitas empresas, a porta de entrada para seu negócio está nas respostas dadas por esses mecanismos a determinadas consultas. Por este motivo, é importante que suas páginas estejam bem posicionadas nestas respostas. Pesquisas recentes mostram que a confiança dos usuários neste mecanismo é relativamente alta. Entretanto, existe nos repositórios de máquinas de busca uma série de informações que podem levar à degradação da qualidade das respostas providas por estes sistemas. Tais informações são conhecidas como ruído, podendo ser geradas de maneira intencional ou não. Esta tese tem como principal objetivo desenvolver e aprimorar técnicas de detecção e tratamento de informação ruidosa em máquinas de busca. Foram avaliadas fontes ruidosas que podem estar nos textos de âncora e/ou nas estruturas dos apontadores presentes em repositórios de máquina de busca. Como resultados, são apresentados métodos para tornar máquinas de busca menos suscetíveis aos efeitos negativos da presença do ruído em seus repositórios. Search engines are among the most used tools to find information on the Web. Recent studies show that the user s confidence on these systems is high. However, the database of search engines usually contains noisy information that may decrease the search results quality and thus negatively affect the confidence of users in these systems. Such type of information is called noise and it can be intentional or not. The main goals of this thesis are to develop and enhance techniques to detect noise in databases of search engines. We evaluated noisy sources of information that may be present either in the anchor text and/or links structures of search engine indexes. As a result, we present methods to turn search engines less susceptible of negative impact caused by the presence of noisy. 2015-04-20T12:33:27Z 2013-11-05 2013-03-08 Tese SOUZA, Jucimar Brito de. Detecção de ruídos em repositórios de máquina de busca. 2013. 114 f. Tese (Doutorado em Informática) - Universidade Federal do Amazonas, Manaus, 2013. http://tede.ufam.edu.br/handle/tede/3145 por Acesso Aberto application/pdf Universidade Federal do Amazonas Instituto de Computação BR UFAM Programa de Pós-graduação em Informática
institution TEDE - Universidade Federal do Amazonas
collection TEDE-UFAM
language por
topic Máquina de Busca
Repositórios de máquinas de busca
Search engine
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
spellingShingle Máquina de Busca
Repositórios de máquinas de busca
Search engine
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Souza, Jucimar Brito de
Detecção de ruídos em repositórios de máquina de busca
topic_facet Máquina de Busca
Repositórios de máquinas de busca
Search engine
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
description Máquinas ou motores de busca são as ferramentas mais usadas para localizar informações na Internet. Para muitas empresas, a porta de entrada para seu negócio está nas respostas dadas por esses mecanismos a determinadas consultas. Por este motivo, é importante que suas páginas estejam bem posicionadas nestas respostas. Pesquisas recentes mostram que a confiança dos usuários neste mecanismo é relativamente alta. Entretanto, existe nos repositórios de máquinas de busca uma série de informações que podem levar à degradação da qualidade das respostas providas por estes sistemas. Tais informações são conhecidas como ruído, podendo ser geradas de maneira intencional ou não. Esta tese tem como principal objetivo desenvolver e aprimorar técnicas de detecção e tratamento de informação ruidosa em máquinas de busca. Foram avaliadas fontes ruidosas que podem estar nos textos de âncora e/ou nas estruturas dos apontadores presentes em repositórios de máquina de busca. Como resultados, são apresentados métodos para tornar máquinas de busca menos suscetíveis aos efeitos negativos da presença do ruído em seus repositórios.
author_additional Moura, Edleno Silva de
author_additionalStr Moura, Edleno Silva de
format Tese
author Souza, Jucimar Brito de
author2 http://lattes.cnpq.br/0217852318751550
author2Str http://lattes.cnpq.br/0217852318751550
title Detecção de ruídos em repositórios de máquina de busca
title_short Detecção de ruídos em repositórios de máquina de busca
title_full Detecção de ruídos em repositórios de máquina de busca
title_fullStr Detecção de ruídos em repositórios de máquina de busca
title_full_unstemmed Detecção de ruídos em repositórios de máquina de busca
title_sort detecção de ruídos em repositórios de máquina de busca
publisher Universidade Federal do Amazonas
publishDate 2015
url http://tede.ufam.edu.br/handle/tede/3145
_version_ 1831969106717310976
score 11.755432