Dissertação

Processamento de consultas documento-a-documento utilizando índice em camadas

Sistemas de busca são mecanismos capazes de buscar informação relevante dentro de grandes coleções de dados. O constante crescimento de meios eletrônicos para armazenamento de informação, junto com a popularização dos sistemas de busca, traz consigo a necessidade constante por soluções capazes de re...

ver descrição completa

Autor principal: Rossi, Cristian
Outros Autores: http://lattes.cnpq.br/4835067852871475
Grau: Dissertação
Idioma: por
Publicado em: Universidade Federal do Amazonas 2015
Assuntos:
Acesso em linha: http://tede.ufam.edu.br/handle/tede/4123
id oai:https:--tede.ufam.edu.br-handle-:tede-4123
recordtype dspace
spelling oai:https:--tede.ufam.edu.br-handle-:tede-41232016-05-11T14:36:23Z Processamento de consultas documento-a-documento utilizando índice em camadas Rossi, Cristian Moura, Edleno Silva de http://lattes.cnpq.br/4835067852871475 http://lattes.cnpq.br/4737852130924504 Recuperação de informação Processamento de consultas Índices invertidos Sistemas de busca Information retrieval Indexes reversed Search systems CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Sistemas de busca são mecanismos capazes de buscar informação relevante dentro de grandes coleções de dados. O constante crescimento de meios eletrônicos para armazenamento de informação, junto com a popularização dos sistemas de busca, traz consigo a necessidade constante por soluções capazes de reduzir os custos de processamento de consultas. Neste trabalho, apresentamos dois novos algoritmos para processamento de consultas em sistemas de busca. Os algoritmos utilizam a abordagem de processamento documento-a-documento e modificam o atual algoritmo estado-da-arte, BMW, para tirar vantagem de uma arquitetura de índice dividido em duas camadas. A primeira camada contém apenas as entradas de maior impacto do índice e é utilizada para preprocessar as consultas antes de acessar o restante do índice na segunda camada. Esta abordagem resulta em consideráveis ganhos de desempenho. O primeiro algoritmo proposto, chamado BMW-CS, chega a ser 40 vezes mais rápido em relação a diversos métodos comparados, porém provoca pequenas modificações no conjunto de resposta retornado. O segundo algoritmo proposto, chamado BMW-t, preserva o conjunto de resposta e é 10% mais rápido que o BMW. Search engines are mechanisms to seek relevant information within large data collections. The constant growth of electronic media for storage information, along with the popularization of search engines, brings the constant need for solutions that reduce processing costs queries. We present two new algorithms for query processing searching systems. The processing algorithms use the approach document-to-document and modify the current algorithm state of the art, BMW, for taking advantage of an index architecture divided into two layers. The first layer contains only the highest impact index entries and is used to preprocess consultations before accessing the rest of the index in the second layer. This approach results in significant performance gains. The first algorithm, called BMW-CS, is up to 40 times more fast compared to many compared methods, but causes small changes in the returned response. The second algorithm, called BMW-t, preserves the answer set and is 10% faster than the BMW. FAPEAM - Fundação de Amparo à Pesquisa do Estado do Amazonas 2015-06-17T20:42:11Z 2013-03-27 Dissertação ROSSI, Cristian. Processamento de consultas documento-a-documento utilizando índice em camadas. 2013. 67 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2013. http://tede.ufam.edu.br/handle/tede/4123 por Acesso Aberto application/pdf Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática
institution TEDE - Universidade Federal do Amazonas
collection TEDE-UFAM
language por
topic Recuperação de informação
Processamento de consultas
Índices invertidos
Sistemas de busca
Information retrieval
Indexes reversed
Search systems
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
spellingShingle Recuperação de informação
Processamento de consultas
Índices invertidos
Sistemas de busca
Information retrieval
Indexes reversed
Search systems
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Rossi, Cristian
Processamento de consultas documento-a-documento utilizando índice em camadas
topic_facet Recuperação de informação
Processamento de consultas
Índices invertidos
Sistemas de busca
Information retrieval
Indexes reversed
Search systems
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
description Sistemas de busca são mecanismos capazes de buscar informação relevante dentro de grandes coleções de dados. O constante crescimento de meios eletrônicos para armazenamento de informação, junto com a popularização dos sistemas de busca, traz consigo a necessidade constante por soluções capazes de reduzir os custos de processamento de consultas. Neste trabalho, apresentamos dois novos algoritmos para processamento de consultas em sistemas de busca. Os algoritmos utilizam a abordagem de processamento documento-a-documento e modificam o atual algoritmo estado-da-arte, BMW, para tirar vantagem de uma arquitetura de índice dividido em duas camadas. A primeira camada contém apenas as entradas de maior impacto do índice e é utilizada para preprocessar as consultas antes de acessar o restante do índice na segunda camada. Esta abordagem resulta em consideráveis ganhos de desempenho. O primeiro algoritmo proposto, chamado BMW-CS, chega a ser 40 vezes mais rápido em relação a diversos métodos comparados, porém provoca pequenas modificações no conjunto de resposta retornado. O segundo algoritmo proposto, chamado BMW-t, preserva o conjunto de resposta e é 10% mais rápido que o BMW.
author_additional Moura, Edleno Silva de
author_additionalStr Moura, Edleno Silva de
format Dissertação
author Rossi, Cristian
author2 http://lattes.cnpq.br/4835067852871475
author2Str http://lattes.cnpq.br/4835067852871475
title Processamento de consultas documento-a-documento utilizando índice em camadas
title_short Processamento de consultas documento-a-documento utilizando índice em camadas
title_full Processamento de consultas documento-a-documento utilizando índice em camadas
title_fullStr Processamento de consultas documento-a-documento utilizando índice em camadas
title_full_unstemmed Processamento de consultas documento-a-documento utilizando índice em camadas
title_sort processamento de consultas documento-a-documento utilizando índice em camadas
publisher Universidade Federal do Amazonas
publishDate 2015
url http://tede.ufam.edu.br/handle/tede/4123
_version_ 1831969236954644480
score 11.753735