Dissertação

AnnotationUI: padrões de interface para sistemas de rotulagem de texto

Devido ao grande volume de dados produzido por diversas aplicações, o Machine Learning (ML) tem sido explorado para o uso em sistemas de diferentes domínios do conhecimento humano. Como, por exemplo, sistemas que utilizam grande volume de dados textuais, como ChatGPT, podem necessitar de um passo an...

ver descrição completa

Autor principal: Passos, Letícia Carvalho
Outros Autores: http://lattes.cnpq.br/0564984904807510, https://orcid.org/0000-0002-8308-032X
Grau: Dissertação
Idioma: por
Publicado em: Universidade Federal do Amazonas 2023
Assuntos:
Acesso em linha: https://tede.ufam.edu.br/handle/tede/9637
id oai:https:--tede.ufam.edu.br-handle-:tede-9637
recordtype dspace
spelling oai:https:--tede.ufam.edu.br-handle-:tede-96372023-08-31T05:03:48Z AnnotationUI: padrões de interface para sistemas de rotulagem de texto Passos, Letícia Carvalho Conte, Tayana Uchoa http://lattes.cnpq.br/0564984904807510 http://lattes.cnpq.br/6682919653508224 Siveira, Milene Selbach http://lattes.cnpq.br/0483707899231728 Pessoa, Marcela Sávia Picanço http://lattes.cnpq.br/8158921311848193 https://orcid.org/0000-0002-8308-032X Aprendizado do computador Inteligência artificial Processamento de linguagem natural (Computação) CIENCIAS EXATAS E DA TERRA: CIENCIA DA COMPUTACAO Padrões de design de interface Interactive machine learning Processamento de linguagem natural Sistemas de rotulagem de texto Devido ao grande volume de dados produzido por diversas aplicações, o Machine Learning (ML) tem sido explorado para o uso em sistemas de diferentes domínios do conhecimento humano. Como, por exemplo, sistemas que utilizam grande volume de dados textuais, como ChatGPT, podem necessitar de um passo anterior de treinamento conhecido como rotulagem de dados. Comumente, a rotulagem é realizada por usuários especialistas no domínio dos dados e visa gerar uma base de treinamento para um modelo ML supervisionado. Contudo, a tarefa de rotular é muito cansativa para os usuá- rios. Por isso, as interfaces dos sistemas devem ser projetadas considerando aspectos de User Experience (UX). Algumas pesquisas focam em apoiar o desenvolvimento dos sistemas de rotulagem de dados, porém ainda existe uma lacuna sobre como projetar tais interfaces, considerando o tipo de dado a ser rotulado. Neste sentido, esta pesquisa foca em sistemas de rotulagem de texto, atendendo os problemas de Natural Language Processing (NLP), a qual é área de ML que atua com dados textuais. A partir do contexto mencionado, a seguinte questão de pesquisa (QP) guia este trabalho: Como apoiar o projeto de interface de sistemas de rotulagem de texto? Para responder esta questão, esta pesquisa foi conduzida tendo por base Action Research. A partir de uma demanda da indústria, foram conduzidos estudos e análises do estado-da-prática que resultou na produção de um artefato final: os padrões AnnotationUI. Os resultados obtidos, após avaliação com especialistas, mostram que os padrões AnnotationUI apoiam o projeto de interface dos sistemas de rotulagem de dados do tipo textual. Due to the large volume of data coming from various applications, Machine Learning (ML) has been explored for use in systems from different human knowledge domains. For example, systems that use large volume of textual data, such as ChatGPT, may re- quire a previous training step known as data labeling. Commonly, users who are experts in the data domain annotate data to generate a training basis for a supervised ML model. However, the task of labeling is exhausting for users. Therefore, software designers must design system interfaces considering User Experience (UX) aspects. Some research focuses on supporting the development of data labeling systems, however there is still a gap on how to design such interfaces considering the type of data to be labeled. In this sense, this research focuses on text labeling systems, addressing the problems of Natural Language Processing (NLP), which is an ML area that addresses textual data. From the context we mentioned above, the following research question (QP) guides this work: How to support the interface design of text labeling systems? To answer this question, this research was conducted based on Action Research. From an industry demand, we conducted empirical studies and a state-of-the-practice analysis, which resulted in the production of the final artifact: the AnnotationUI patterns. After evaluation with experts, the results show that the AnnotationUI patterns support the interface design of textual type data labeling systems. CNPQ - Conselho Nacional de Desenvolvimento Científico e Tecnológico 2023-08-31T01:24:53Z 2023-07-27 Dissertação PASSOS, Letícia Carvalho. AnnotationUI: padrões de interface para sistemas de rotulagem de texto. 2023. 161 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus (AM), 2023. https://tede.ufam.edu.br/handle/tede/9637 por Acesso Aberto application/pdf Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática
institution TEDE - Universidade Federal do Amazonas
collection TEDE-UFAM
language por
topic Aprendizado do computador
Inteligência artificial
Processamento de linguagem natural (Computação)
CIENCIAS EXATAS E DA TERRA: CIENCIA DA COMPUTACAO
Padrões de design de interface
Interactive machine learning
Processamento de linguagem natural
Sistemas de rotulagem de texto
spellingShingle Aprendizado do computador
Inteligência artificial
Processamento de linguagem natural (Computação)
CIENCIAS EXATAS E DA TERRA: CIENCIA DA COMPUTACAO
Padrões de design de interface
Interactive machine learning
Processamento de linguagem natural
Sistemas de rotulagem de texto
Passos, Letícia Carvalho
AnnotationUI: padrões de interface para sistemas de rotulagem de texto
topic_facet Aprendizado do computador
Inteligência artificial
Processamento de linguagem natural (Computação)
CIENCIAS EXATAS E DA TERRA: CIENCIA DA COMPUTACAO
Padrões de design de interface
Interactive machine learning
Processamento de linguagem natural
Sistemas de rotulagem de texto
description Devido ao grande volume de dados produzido por diversas aplicações, o Machine Learning (ML) tem sido explorado para o uso em sistemas de diferentes domínios do conhecimento humano. Como, por exemplo, sistemas que utilizam grande volume de dados textuais, como ChatGPT, podem necessitar de um passo anterior de treinamento conhecido como rotulagem de dados. Comumente, a rotulagem é realizada por usuários especialistas no domínio dos dados e visa gerar uma base de treinamento para um modelo ML supervisionado. Contudo, a tarefa de rotular é muito cansativa para os usuá- rios. Por isso, as interfaces dos sistemas devem ser projetadas considerando aspectos de User Experience (UX). Algumas pesquisas focam em apoiar o desenvolvimento dos sistemas de rotulagem de dados, porém ainda existe uma lacuna sobre como projetar tais interfaces, considerando o tipo de dado a ser rotulado. Neste sentido, esta pesquisa foca em sistemas de rotulagem de texto, atendendo os problemas de Natural Language Processing (NLP), a qual é área de ML que atua com dados textuais. A partir do contexto mencionado, a seguinte questão de pesquisa (QP) guia este trabalho: Como apoiar o projeto de interface de sistemas de rotulagem de texto? Para responder esta questão, esta pesquisa foi conduzida tendo por base Action Research. A partir de uma demanda da indústria, foram conduzidos estudos e análises do estado-da-prática que resultou na produção de um artefato final: os padrões AnnotationUI. Os resultados obtidos, após avaliação com especialistas, mostram que os padrões AnnotationUI apoiam o projeto de interface dos sistemas de rotulagem de dados do tipo textual.
author_additional Conte, Tayana Uchoa
author_additionalStr Conte, Tayana Uchoa
format Dissertação
author Passos, Letícia Carvalho
author2 http://lattes.cnpq.br/0564984904807510
https://orcid.org/0000-0002-8308-032X
author2Str http://lattes.cnpq.br/0564984904807510
https://orcid.org/0000-0002-8308-032X
title AnnotationUI: padrões de interface para sistemas de rotulagem de texto
title_short AnnotationUI: padrões de interface para sistemas de rotulagem de texto
title_full AnnotationUI: padrões de interface para sistemas de rotulagem de texto
title_fullStr AnnotationUI: padrões de interface para sistemas de rotulagem de texto
title_full_unstemmed AnnotationUI: padrões de interface para sistemas de rotulagem de texto
title_sort annotationui: padrões de interface para sistemas de rotulagem de texto
publisher Universidade Federal do Amazonas
publishDate 2023
url https://tede.ufam.edu.br/handle/tede/9637
_version_ 1831970217645834240
score 11.753735