/img alt="Imagem da capa" class="recordcover" src="""/>
Dissertação
Classificação de produtos com base em descrições textuais
Muitas aplicações de e-commerce lidam com grandes conjuntos de dados de produtos que precisam ser classificados em uma taxonomia predefinida de categorias. Além disso, em alguns cenários práticos, o conjunto de dados é volátil, com novos produtos sendo frequentemente lançados e introduzidos nas cate...
Autor principal: | Gomes, Manoel Aquino |
---|---|
Outros Autores: | http://lattes.cnpq.br/7322923092065512 |
Grau: | Dissertação |
Idioma: | por |
Publicado em: |
Universidade Federal do Amazonas
2021
|
Assuntos: | |
Acesso em linha: |
https://tede.ufam.edu.br/handle/tede/8295 |
id |
oai:https:--tede.ufam.edu.br-handle-:tede-8295 |
---|---|
recordtype |
dspace |
spelling |
oai:https:--tede.ufam.edu.br-handle-:tede-82952021-06-07T05:04:41Z Classificação de produtos com base em descrições textuais Product Classification Based on Textual Descriptions Gomes, Manoel Aquino Moura, Edleno Silva de http://lattes.cnpq.br/7322923092065512 http://lattes.cnpq.br/4737852130924504 Silva, Altigran Soares da Rosa, Thierson Couto Comércio eletrônico Redes neurais (Computação) CIENCIAS EXATAS E DA TERRA: CIENCIA DA COMPUTACAO: TEORIA DA COMPUTACAO: ANALISE DE ALGORITMOS E COMPLEXIDADE DE COMPUTACAO Aprendizagem de Máquina Classificação de Produtos Modelos de Linguagens Muitas aplicações de e-commerce lidam com grandes conjuntos de dados de produtos que precisam ser classificados em uma taxonomia predefinida de categorias. Além disso, em alguns cenários práticos, o conjunto de dados é volátil, com novos produtos sendo frequentemente lançados e introduzidos nas categorias existentes. A classificação de produtos tem se tornado uma tarefa essencial para o bom funcionamento de plataformas de vendas em ambientes de e-commerce, facilitando a organização e o acesso à informação nos sites das empresas. Nesta dissertação, estudamos e discutimos métodos eficientes e eficazes para a classificação de produtos. Apesentamos uma solução rápida e competitiva para classificação baseada em Language Models para classificar produtos e discutimos o uso de um método de classificação proposto na literatura que tem sido usado com sucesso em outras aplicações, o FastText, adaptando-o e estudando-o no cenário de classificação de produtos. Estudamos formas de combinar os métodos propostos à segmentação da descrição de produtos, uma ideia utilizada anteriormente na literatura, e apresentamos experimentos com 3 bases de dados de produtos onde comparamos o desempenho das alternativas estudadas. Os resultados apresentados indicam que tanto o método baseado em language models quanto o FastText apresentam resultados qualitativos bem competitivos quando comparados a um modelo de classificação baseado em redes neurais que é considerado estado-da-arte. Os resultados foram obtidos com uma redução significativa nos custos e no tempo de processamento necessários para realizar os experimentos nas 3 bases de dados estudadas. Many e-commerce applications have to deal with a large set of product data that needs to be classified into a predefined product category taxonomy. In addi- tion, in some practical scenarios, the data set is volatile, with new products being frequently launched and introduced in these product categories. Product classification has become an essential task for the good functioning of sales platforms in e-commerce environments, facilitating the organization and access to information on the companies’ websites. In this dissertation, we study and discuss efficient and effective methods for product classification. We present a fast and competitive solution for classification based on Language Models to classify products and discuss the use of a classification method proposed in the literature that has been used successfully in other applications, FastText, adapting and studying it in the product classification scenario. We studied ways of combining the proposed methods with product description segmentation, an idea previously used in the literature, and we presented experiments with 3 product databases where we compared the performance of the alternatives studied. The results presented indicate that both the method based on Language Models and FastText present very competitive qualitative results when compared to a classification model based on neural networks that is considered state-of-the-art. The results were obtained with a significant reduction in costs and in the processing time necessary to carry out the experiments in the 3 databases studied. 2021-06-07T03:08:14Z 2021-05-13 Dissertação GOMES, Manoel Aquino. Classificação de produtos com base em descrições textuais. 2021. 50 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus (AM), 2021. https://tede.ufam.edu.br/handle/tede/8295 por Acesso Aberto http://creativecommons.org/licenses/by/4.0/ application/pdf Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática |
institution |
TEDE - Universidade Federal do Amazonas |
collection |
TEDE-UFAM |
language |
por |
topic |
Comércio eletrônico Redes neurais (Computação) CIENCIAS EXATAS E DA TERRA: CIENCIA DA COMPUTACAO: TEORIA DA COMPUTACAO: ANALISE DE ALGORITMOS E COMPLEXIDADE DE COMPUTACAO Aprendizagem de Máquina Classificação de Produtos Modelos de Linguagens |
spellingShingle |
Comércio eletrônico Redes neurais (Computação) CIENCIAS EXATAS E DA TERRA: CIENCIA DA COMPUTACAO: TEORIA DA COMPUTACAO: ANALISE DE ALGORITMOS E COMPLEXIDADE DE COMPUTACAO Aprendizagem de Máquina Classificação de Produtos Modelos de Linguagens Gomes, Manoel Aquino Classificação de produtos com base em descrições textuais |
topic_facet |
Comércio eletrônico Redes neurais (Computação) CIENCIAS EXATAS E DA TERRA: CIENCIA DA COMPUTACAO: TEORIA DA COMPUTACAO: ANALISE DE ALGORITMOS E COMPLEXIDADE DE COMPUTACAO Aprendizagem de Máquina Classificação de Produtos Modelos de Linguagens |
description |
Muitas aplicações de e-commerce lidam com grandes conjuntos de dados de produtos que precisam ser classificados em uma taxonomia predefinida de categorias. Além disso, em alguns cenários práticos, o conjunto de dados é volátil, com novos produtos sendo frequentemente lançados e introduzidos nas categorias existentes. A classificação de produtos tem se tornado uma tarefa essencial para o bom funcionamento de plataformas de vendas em ambientes de e-commerce, facilitando a organização e o acesso à informação nos sites das empresas. Nesta dissertação, estudamos e discutimos métodos eficientes e eficazes para a classificação de produtos. Apesentamos uma solução rápida e competitiva para classificação baseada em Language Models para classificar produtos e discutimos o uso de um método de classificação proposto na literatura que tem sido usado com sucesso em outras aplicações, o FastText, adaptando-o e estudando-o no cenário de classificação de produtos. Estudamos formas de combinar os métodos propostos à segmentação da descrição de produtos, uma ideia utilizada anteriormente na literatura, e apresentamos experimentos com 3 bases de dados de produtos onde comparamos o desempenho das alternativas estudadas. Os resultados apresentados indicam que tanto o método baseado em language models quanto o FastText apresentam resultados qualitativos bem competitivos quando comparados a um modelo de classificação baseado em redes neurais que é considerado estado-da-arte. Os resultados foram obtidos com uma redução significativa nos custos e no tempo de processamento necessários para realizar os experimentos nas 3 bases de dados estudadas. |
author_additional |
Moura, Edleno Silva de |
author_additionalStr |
Moura, Edleno Silva de |
format |
Dissertação |
author |
Gomes, Manoel Aquino |
author2 |
http://lattes.cnpq.br/7322923092065512 |
author2Str |
http://lattes.cnpq.br/7322923092065512 |
title |
Classificação de produtos com base em descrições textuais |
title_short |
Classificação de produtos com base em descrições textuais |
title_full |
Classificação de produtos com base em descrições textuais |
title_fullStr |
Classificação de produtos com base em descrições textuais |
title_full_unstemmed |
Classificação de produtos com base em descrições textuais |
title_sort |
classificação de produtos com base em descrições textuais |
publisher |
Universidade Federal do Amazonas |
publishDate |
2021 |
url |
https://tede.ufam.edu.br/handle/tede/8295 |
_version_ |
1831969960813920256 |
score |
11.753735 |