Relatório de Pesquisa

Aplicação do modelo vetorial para o estudo de um motor de busca voltado para documentos textuais

Com o crescimento do volume de publicações, ao longo dos anos, foram desenvolvidas técnicas de recuperação de informação para responder as necessidades dos usuários de bibliotecas, tradicionais ou digitais. Atualmente, já não é viável falar em crescimento do volume das publicações mas sim em uma ver...

ver descrição completa

Autor principal: Romário Lira Batista
Grau: Relatório de Pesquisa
Idioma: pt_BR
Publicado em: Universidade Federal do Amazonas 2016
Assuntos:
Acesso em linha: http://riu.ufam.edu.br/handle/prefix/3865
Resumo:
Com o crescimento do volume de publicações, ao longo dos anos, foram desenvolvidas técnicas de recuperação de informação para responder as necessidades dos usuários de bibliotecas, tradicionais ou digitais. Atualmente, já não é viável falar em crescimento do volume das publicações mas sim em uma verdadeira explosão, porém, esse cenário torna difícil a tarefa de encontrar uma informação específica no meio dessa grande quantidade. Nesse contexto, a Recuperação da Informação, que é uma área da informática que lida com o armazenamento de documentos e a recuperação automática de informações associadas a eles, trata da ciência de pesquisa que possibilita a busca por informações em documentos, busca pelos documentos propriamente ditos e busca em banco de dados, sendo assim, ela busca estudar técnicas de armazenamento, processos de busca, recuperação e apresentação de forma amigável das informações. Logo, um método de busca faz-se necessário para suprir a necessidade de encontrar informações específicas em documentos textuais (artigos científicos, artigos jornalisticos, etc.). Modelo Vetorial, ou Modelo de Espaço Vetorial, é uma técnica aplicada na Recuperação da Informação e representa documentos e consultas como vetores de termos. Termos são ocorrências únicas nos documentos. Os documentos devolvidos para uma consulta são representados similarmente, ou seja, o vetor resultado para uma consulta é montado através de um cálculo de similaridade. Em outras palavras, o Modelo Vetorial propõe um ambiente no qual é possível obter documentos que respondem parcialmente a uma expressão de busca, ou seja, como resultado obtém-se um conjunto de documentos ordenado pelo grau de similaridade de cada documento em relação a expressão de busca. A aplicação deste modelo nesse trabalho vem devido a sua vantagem sobre os demais modelos, que é a sua simplicidade e a sua facilidade de entendimento. Porém, faz-se necessário que, além de ter conhecimento a cerca do Modelo Vetorial, o aluno aplique esse conhecimento em algo dentro do contexto de Recuperação da Informação. Um objeto de estudo para a área de Recuperação da Informação são as máquinas de busca, ou motor de busca, estas por sua vez são um sistema de software projetado para encontrar informações armazenadas em um sistema computacional a partir de palavras-chave indicadas pelo utilizador, reduzindo o tempo necessário para encontrar informações solicitadas na busca. A Recuperação da Informação possibilita também que, após os estudos e/ou implementações de um Motor de Busca apliquem-se métodos de avaliação para comprovar a eficiência do Motor de Busca. Portanto, o objetivo deste projeto é aplicar o conhecimento matemático do Modelo Vetorial no estudo de um Motor de Busca para documentos textuais de uma base de dados e estudar os diversos métodos de avaliação e escolher o mais viável para aplicar em cima do motor de busca afim de comprovar sua autenticidade.