Dissertação

Aprendendo funções de previsão de notas em métodos de filtragem colaborativa baseada em usuário

A grande oferta de conteúdos na sociedade contemporânea torna difícil a tarefa de busca por informações que interessem aos usuários. Uma forma de lidar com tal sobrecarga de informações é prover ferramentas que recomendem para os usuários, dentre as informações alternativas, aquelas que devem ser d...

ver descrição completa

Autor principal: Gonçalves, Ludimila Carvalho
Outros Autores: http://lattes.cnpq.br/1764865833357404
Grau: Dissertação
Idioma: por
Publicado em: Universidade Federal do Amazonas 2015
Assuntos:
Acesso em linha: http://tede.ufam.edu.br/handle/tede/2920
Resumo:
A grande oferta de conteúdos na sociedade contemporânea torna difícil a tarefa de busca por informações que interessem aos usuários. Uma forma de lidar com tal sobrecarga de informações é prover ferramentas que recomendem para os usuários, dentre as informações alternativas, aquelas que devem ser de seu interesse. Tais ferramentas são os Sistemas de Recomendação (SR). As principais aplicações em SR se baseiam em duas técnicas, filtragem baseada em conteúdo e filtragem colaborativa. Dentre as duas, a filtragem colaborativa é a mais utilizada uma vez que, em geral, a estratégia que emprega, determinar grupos de usuários com interesses similares, é mais efetiva para capturar preferências. O problema de recomendação, como abordado em filtragem colaborativa, pode ser visto como um problema de previsão da preferência do usuário, normalmente representada por uma nota. Sistemas tradicionais prevêem esta nota através de uma equação de regressão obtida heuristicamente, envolvendo diversas evidências como nível de rigor do usuário e sua reputação. Como em qualquer estratégia heurística, não há nenhuma garantia que as equações usadas para a previsão sejam mais adequadas para um conjunto particular de dados, no sentido de minimizar o erro de previsão. Assim, neste trabalho, buscamos determinar se, em lugar de usar fórmulas heurísticas, não seria mais eficaz determinar automaticamente, por meio de uma técnica de aprendizagem de máquina, a melhor combinação das evidências disponíveis de forma a reduzir o erro de previsão. Nossos experimentos indicam que usando apenas evidências empregadas em métodos tradicionais, um método de regressão, como o proposto, pode alcançar resultados significativamente melhores que métodos tradicionais. Além disso, evidências como as notas que vizinhos atribuem ao item (como um todo ou individualmente) e as notas médias do usuário, do item e dos vizinhos possuíram melhor desempenho. Por fim, obtivemos ganhos de até 7% sobre o baseline com característica de confiança e de 6% sobre baseline sem uso de confiança.