Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual

Lucas Citolin

Relatório de Pesquisa

Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual

A utilização de sistemas de busca cresce de acordo com a quantidade de dados armazenados. Quando os dados são grandes coleções de documentos, exige-se uma efetiva busca por meio de palavras chaves fornecidas pelo usuário. O crescimento da coleção de documentos e a falta de acompanhamento do potencia...

ver descrição completa

Autor principal:	Lucas Citolin
Grau:	Relatório de Pesquisa
Idioma:	pt_BR
Publicado em:	Universidade Federal do Amazonas 2017
Assuntos:	Processamento de consultas Recuperação de informação CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Acesso em linha:	http://riu.ufam.edu.br/handle/prefix/5148

id	oai:localhost:prefix-5148
recordtype	dspace
spelling	oai:localhost:prefix-51482025-03-10T20:18:07Z Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual Lucas Citolin Edleno Silva de Moura Processamento de consultas Recuperação de informação CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO A utilização de sistemas de busca cresce de acordo com a quantidade de dados armazenados. Quando os dados são grandes coleções de documentos, exige-se uma efetiva busca por meio de palavras chaves fornecidas pelo usuário. O crescimento da coleção de documentos e a falta de acompanhamento do potencial de processamento das máquinas atuais levou ao investimento na área conhecida como recuperação de informação. O constante investimento no processamento de consultas tem como objetivo o retorno de algoritmos efetivos (velozes, precisos) que acompanhem o grande crescimento de dados armazenados. Para que a busca seja efetuada na coleção de documentos, utiliza-se métodos para o cálculo de similaridade entre dois documentos, sendo este o fator decisivo na velocidade e precisão do (algoritmo)processo de busca. Fórmulas para o cálculo de similaridade se torna presente na literatura desde modelos mais tradicionais como o Modelo de Espaço Vetorial e o modelo BM25. Existe uma grande lacuna na implementação destes modelos: a falta de comparação entre eles. Uma função de similaridade pode ser implementada em algoritmos diferentes, fazendo parte essencial do desempenho do mesmo. Os trabalhos atuais não fazem uma efetiva comparação de seus algoritmos com modelos de similaridade diferentes, deixando uma lacuna na literatura pela combinação de modelos mais efetiva. A proposta deste projeto é de implementar os algoritmos de processamento de consultas, tais como o BMW, BMW-CS e o WAND com diferentes modelos para o cálculo de similaridade. CNPQ 2017-05-29T18:33:59Z 2017-05-29T18:33:59Z 2016-07-31 Relatório de Pesquisa http://riu.ufam.edu.br/handle/prefix/5148 pt_BR Acesso Aberto PDF Universidade Federal do Amazonas Brasil Ciências da Computação Instituto de Ciências Exatas PROGRAMA PIBIC 2015 UFAM
institution	Repositório Institucional - Universidade Federal do Amazonas
collection	RI-UFAM
language	pt_BR
topic	Processamento de consultas Recuperação de informação CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
spellingShingle	Processamento de consultas Recuperação de informação CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Lucas Citolin Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual
topic_facet	Processamento de consultas Recuperação de informação CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
description	A utilização de sistemas de busca cresce de acordo com a quantidade de dados armazenados. Quando os dados são grandes coleções de documentos, exige-se uma efetiva busca por meio de palavras chaves fornecidas pelo usuário. O crescimento da coleção de documentos e a falta de acompanhamento do potencial de processamento das máquinas atuais levou ao investimento na área conhecida como recuperação de informação. O constante investimento no processamento de consultas tem como objetivo o retorno de algoritmos efetivos (velozes, precisos) que acompanhem o grande crescimento de dados armazenados. Para que a busca seja efetuada na coleção de documentos, utiliza-se métodos para o cálculo de similaridade entre dois documentos, sendo este o fator decisivo na velocidade e precisão do (algoritmo)processo de busca. Fórmulas para o cálculo de similaridade se torna presente na literatura desde modelos mais tradicionais como o Modelo de Espaço Vetorial e o modelo BM25. Existe uma grande lacuna na implementação destes modelos: a falta de comparação entre eles. Uma função de similaridade pode ser implementada em algoritmos diferentes, fazendo parte essencial do desempenho do mesmo. Os trabalhos atuais não fazem uma efetiva comparação de seus algoritmos com modelos de similaridade diferentes, deixando uma lacuna na literatura pela combinação de modelos mais efetiva. A proposta deste projeto é de implementar os algoritmos de processamento de consultas, tais como o BMW, BMW-CS e o WAND com diferentes modelos para o cálculo de similaridade.
author_additional	Edleno Silva de Moura
author_additionalStr	Edleno Silva de Moura
format	Relatório de Pesquisa
author	Lucas Citolin
title	Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual
title_short	Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual
title_full	Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual
title_fullStr	Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual
title_full_unstemmed	Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual
title_sort	um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual
publisher	Universidade Federal do Amazonas
publishDate	2017
url	http://riu.ufam.edu.br/handle/prefix/5148
_version_	1831969670624706560
score	11.755432

Um estudo sobre o impacto da função de similaridade sobre algoritmos de processamento de consultas em sistemas de busca textual

Registros relacionados