/img alt="Imagem da capa" class="recordcover" src="""/>
Dissertação
Um estudo sobre o uso de informações de instâncias para o casamento de esquemas no domínio de comércio eletrônico
Integração de dados é a tarefa de combinar dados de diversas fontes e representá-los em um único conjunto de dados. Uma tarefa fundamental para integração de dados é o casamento de esquemas, definido como a tarefa de encontrar correspondências semânticas entre elementos de dois esquemas distintos. R...
Autor principal: | Silva, Luísa dos Reis e |
---|---|
Outros Autores: | http://lattes.cnpq.br/7431827440136985 |
Grau: | Dissertação |
Idioma: | por |
Publicado em: |
Universidade Federal do Amazonas
2019
|
Assuntos: | |
Acesso em linha: |
https://tede.ufam.edu.br/handle/tede/7210 |
Resumo: |
---|
Integração de dados é a tarefa de combinar dados de diversas fontes e representá-los em um único conjunto de dados. Uma tarefa fundamental para integração de dados é o casamento de esquemas, definido como a tarefa de encontrar correspondências semânticas entre elementos de dois esquemas distintos. Recentemente, esse problema tem sido estudado no domínio de comércio eletrônico, por ser um domínio de grande importância prática no dia-a-dia das pessoas. Vários métodos têm sido propostos na literatura com o objetivo de automatizar essa tarefa. Os métodos utilizam diferentes tipos de informação, como informação dos nomes e da estrutura dos elementos dos esquemas analisados. Neste trabalho, procuramos identificar se as informações de instâncias são mais significativas para os métodos de casamento de esquemas no domínio de comércio eletrônico. Para tanto, verificamos o comportamento de três métodos de casamento de esquemas ao adicionarmos essas informações: COMA, que utiliza heurísticas fixas para combinação de matchers; ALMa, que utiliza Aprendizado Ativo; e RFSM, que utiliza aprendizado de máquina supervisionado. Nos experimentos, percebemos que ao utilizar informação de instância os métodos apresentaram melhorias nos seus resultados, principalmente na precisão e medida-f. Verificamos também que os métodos não necessitam ter uma frequência alta dessa informação para que elas contribuam com os resultados. |