Relatório de Pesquisa

Técnicas Baseadas em Similaridade de Árvores para Extração de Dados da Web em Larga Escala

Neste trabalho será desenvolvido um método automático para o problema de extrair pares valor-atributo presentes em páginas Web ricas em dados. O método será baseado em Algoritmo de Alinhamento de Árvores para encontrar nestas páginas exemplos de pares que correspondem a objetos de interesse. Em segu...

ver descrição completa

Autor principal: Daniel Fernandes da Silva Pereira
Grau: Relatório de Pesquisa
Idioma: pt_BR
Publicado em: Universidade Federal do Amazonas 2016
Assuntos:
Acesso em linha: http://riu.ufam.edu.br/handle/prefix/4838
Resumo:
Neste trabalho será desenvolvido um método automático para o problema de extrair pares valor-atributo presentes em páginas Web ricas em dados. O método será baseado em Algoritmo de Alinhamento de Árvores para encontrar nestas páginas exemplos de pares que correspondem a objetos de interesse. Em seguida, o método deve gerar expressões regulares para extrair pares atributo-valor similares aos exemplos dados.