Relatório de Pesquisa

Iniciação Científica em Métodos de Coleta Focada para Web

O problema de Coleta Focada (Focused Crawling), consiste em percorrer a Web automaticamente para coletar páginas com informações sobre um determinado tópico ou assunto específico. Para tratar este problema, foi recentemente proposto um novo método, chamado de BFC (Booster Focused Crawler) qu...

ver descrição completa

Autor principal: Ramayana Assunção Menezes Júnior
Grau: Relatório de Pesquisa
Idioma: pt_BR
Publicado em: Universidade Federal do Amazonas 2016
Assuntos:
Web
Acesso em linha: http://riu.ufam.edu.br/handle/prefix/2591
Resumo:
O problema de Coleta Focada (Focused Crawling), consiste em percorrer a Web automaticamente para coletar páginas com informações sobre um determinado tópico ou assunto específico. Para tratar este problema, foi recentemente proposto um novo método, chamado de BFC (Booster Focused Crawler) que tira proveito das páginas já coletadas e indexadas por sistemas de busca de propósito geral (Google, Yahoo, Bing, etc). Neste projeto, desenvolveremos uma interface gráfica para permitir o uso do método BFC por usuários finais. Além disso, o projeto consiste no estudo detalhado do método e experimentação deste em novas aplicações.