Relatório de Pesquisa

Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual

A utilização de sistemas de busca cresce de acordo com a quantidade de dados armazenados. Quando os dados são grandes coleções de documentos, exige-se uma efetiva busca por meio de palavras chaves fornecidas pelo usuário. O crescimento da coleção de documentos e a falta de acompanhamento do potencia...

ver descrição completa

Autor principal: Lucas Citolin
Grau: Relatório de Pesquisa
Idioma: pt_BR
Publicado em: Universidade Federal do Amazonas 2017
Assuntos:
Acesso em linha: http://riu.ufam.edu.br/handle/prefix/5148
id oai:localhost:prefix-5148
recordtype dspace
spelling oai:localhost:prefix-51482025-03-10T20:18:07Z Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual Lucas Citolin Edleno Silva de Moura Processamento de consultas Recuperação de informação CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO A utilização de sistemas de busca cresce de acordo com a quantidade de dados armazenados. Quando os dados são grandes coleções de documentos, exige-se uma efetiva busca por meio de palavras chaves fornecidas pelo usuário. O crescimento da coleção de documentos e a falta de acompanhamento do potencial de processamento das máquinas atuais levou ao investimento na área conhecida como recuperação de informação. O constante investimento no processamento de consultas tem como objetivo o retorno de algoritmos efetivos (velozes, precisos) que acompanhem o grande crescimento de dados armazenados. Para que a busca seja efetuada na coleção de documentos, utiliza-se métodos para o cálculo de similaridade entre dois documentos, sendo este o fator decisivo na velocidade e precisão do (algoritmo)processo de busca. Fórmulas para o cálculo de similaridade se torna presente na literatura desde modelos mais tradicionais como o Modelo de Espaço Vetorial e o modelo BM25. Existe uma grande lacuna na implementação destes modelos: a falta de comparação entre eles. Uma função de similaridade pode ser implementada em algoritmos diferentes, fazendo parte essencial do desempenho do mesmo. Os trabalhos atuais não fazem uma efetiva comparação de seus algoritmos com modelos de similaridade diferentes, deixando uma lacuna na literatura pela combinação de modelos mais efetiva. A proposta deste projeto é de implementar os algoritmos de processamento de consultas, tais como o BMW, BMW-CS e o WAND com diferentes modelos para o cálculo de similaridade. CNPQ 2017-05-29T18:33:59Z 2017-05-29T18:33:59Z 2016-07-31 Relatório de Pesquisa http://riu.ufam.edu.br/handle/prefix/5148 pt_BR Acesso Aberto PDF Universidade Federal do Amazonas Brasil Ciências da Computação Instituto de Ciências Exatas PROGRAMA PIBIC 2015 UFAM
institution Repositório Institucional - Universidade Federal do Amazonas
collection RI-UFAM
language pt_BR
topic Processamento de consultas
Recuperação de informação
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
spellingShingle Processamento de consultas
Recuperação de informação
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Lucas Citolin
Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual
topic_facet Processamento de consultas
Recuperação de informação
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
description A utilização de sistemas de busca cresce de acordo com a quantidade de dados armazenados. Quando os dados são grandes coleções de documentos, exige-se uma efetiva busca por meio de palavras chaves fornecidas pelo usuário. O crescimento da coleção de documentos e a falta de acompanhamento do potencial de processamento das máquinas atuais levou ao investimento na área conhecida como recuperação de informação. O constante investimento no processamento de consultas tem como objetivo o retorno de algoritmos efetivos (velozes, precisos) que acompanhem o grande crescimento de dados armazenados. Para que a busca seja efetuada na coleção de documentos, utiliza-se métodos para o cálculo de similaridade entre dois documentos, sendo este o fator decisivo na velocidade e precisão do (algoritmo)processo de busca. Fórmulas para o cálculo de similaridade se torna presente na literatura desde modelos mais tradicionais como o Modelo de Espaço Vetorial e o modelo BM25. Existe uma grande lacuna na implementação destes modelos: a falta de comparação entre eles. Uma função de similaridade pode ser implementada em algoritmos diferentes, fazendo parte essencial do desempenho do mesmo. Os trabalhos atuais não fazem uma efetiva comparação de seus algoritmos com modelos de similaridade diferentes, deixando uma lacuna na literatura pela combinação de modelos mais efetiva. A proposta deste projeto é de implementar os algoritmos de processamento de consultas, tais como o BMW, BMW-CS e o WAND com diferentes modelos para o cálculo de similaridade.
author_additional Edleno Silva de Moura
author_additionalStr Edleno Silva de Moura
format Relatório de Pesquisa
author Lucas Citolin
title Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual
title_short Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual
title_full Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual
title_fullStr Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual
title_full_unstemmed Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual
title_sort um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual
publisher Universidade Federal do Amazonas
publishDate 2017
url http://riu.ufam.edu.br/handle/prefix/5148
_version_ 1831969670624706560
score 11.755432