/img alt="Imagem da capa" class="recordcover" src="""/>
Dissertação
Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades.
Análise de polaridade consiste em classificar a opinião do autor em positiva, negativa e neutra. No entanto, dado o grande volume de informações disponíveis na Web, esta análise manual torna-se inviável. Em particular, no domínio financeiro este tipo de análise é útil para empresas na tomada de d...
Autor principal: | Silva, Josiane Rodrigues da |
---|---|
Outros Autores: | http://lattes.cnpq.br/1788997377079235 |
Grau: | Dissertação |
Idioma: | por |
Publicado em: |
Universidade Federal do Amazonas
2015
|
Assuntos: | |
Acesso em linha: |
http://tede.ufam.edu.br/handle/tede/4071 |
id |
oai:https:--tede.ufam.edu.br-handle-:tede-4071 |
---|---|
recordtype |
dspace |
spelling |
oai:https:--tede.ufam.edu.br-handle-:tede-40712016-05-11T14:31:31Z Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades. Silva, Josiane Rodrigues da Cristo, Marco Antônio Pinheiro de http://lattes.cnpq.br/1788997377079235 http://lattes.cnpq.br/6261175351521953 Cristo, Marco Antônio Pinheiro de Oliveira, David Braga Fernandes de Rosa, Thierson Couto Análise de Polaridade Detecção de Subjetividade Aprendizagem de Máquina Resolução de Anáfora. Polarity Analysis Detection of Subjectivity Machine Learning Anaphora Resolution CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Análise de polaridade consiste em classificar a opinião do autor em positiva, negativa e neutra. No entanto, dado o grande volume de informações disponíveis na Web, esta análise manual torna-se inviável. Em particular, no domínio financeiro este tipo de análise é útil para empresas na tomada de decisões relacionadas ao mercado financeiro que parece ser particularmente propenso a mudanças de acordo com opiniões. Os trabalhos disponíveis na literatura propõem abordagens globais para esta tarefa, ou seja, consideram que o texto tem apenas uma polaridade. No entanto, verifica-se que os documentos, em sua grande maioria, citam várias entidades e as polaridades para estas entidades, em geral, são diferentes. Isto sugere que a classificação de polaridade deve ser feita em nível de entidade. Contudo, a maioria das abordagens tradicionais não concentram-se na tarefa de classificar polaridade por entidade. Além disso, observamos que muitos dos documentos no domínio financeiro nem sempre emitem opinião. Assim, uma primeira tarefa de interesse nesse domínio é identificar os documentos em que opiniões são expressas, isto é, documentos subjetivos. Portanto, neste trabalho propomos um método supervisionado para classificação de polaridade baseado em múltiplos modelos com o intuito de classificar documentos financeiros com múltiplas entidades. Em particular, estudamos estratégias de segmentação em texto que usam heurísticas de casamento de string e resolução de anáfora e propomos um método de classificação hierárquica baseada em detecção de subjetividade. Nossos resultados mostraram que uma abordagem baseada em múltiplos modelos é capaz de obter ganhos significativos sobre uma abordagem baseada em modelo global na tarefa de classificação de polaridade com múltiplas entidades. A segmentação do documento em sentenças que mencionam as entidades e a adoção de uma estratégia hierárquica também obtiveram ganhos, embora modestos. Polarity analysis aims at classifying the author’s opinion into positive, negative, or neutral. However, given the sheer volume of information available on the web, manually carrying out such task is unfeasible. In particular, in the financial domain this type of analysis is useful for companies in making decisions related to the financial market which is particularly prone to changes according to shifting of opinions. Most studies in literature deal with this problem by considering that documents have a global polarity. However, in general, documents cite several entities with possibly different polarities. This suggests that the classification should be performed in an entity level. Besides this problem, we also noted that many financial documents do not always emit opinion. Thus, a first task of interest in this research field is to identify documents on which opinions are expressed, that is, the subjective ones. Therefore, in this paper we propose a supervised polarity classification method based on multiple models to deal with financial documents with multiple entities. In particular, we study text segmentation strategies that use heuristics such as string matching and anaphora resolution and we propose a hierarchical classification method based on subjectivity detection. Our results showed that the multiple-models approach significantly outperformed the global-model baseline. The segmentation of the documents restricted to sentences that mention entities and the adoption of a hierarchical strategy also achieved gains, although modest. CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior 2015-06-15T18:06:18Z 2015-03-05 Dissertação SILVA, Josiane Rodrigues. Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades. 2015. 62 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2015. http://tede.ufam.edu.br/handle/tede/4071 por Acesso Aberto application/pdf Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática |
institution |
TEDE - Universidade Federal do Amazonas |
collection |
TEDE-UFAM |
language |
por |
topic |
Análise de Polaridade Detecção de Subjetividade Aprendizagem de Máquina Resolução de Anáfora. Polarity Analysis Detection of Subjectivity Machine Learning Anaphora Resolution CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
spellingShingle |
Análise de Polaridade Detecção de Subjetividade Aprendizagem de Máquina Resolução de Anáfora. Polarity Analysis Detection of Subjectivity Machine Learning Anaphora Resolution CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Silva, Josiane Rodrigues da Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades. |
topic_facet |
Análise de Polaridade Detecção de Subjetividade Aprendizagem de Máquina Resolução de Anáfora. Polarity Analysis Detection of Subjectivity Machine Learning Anaphora Resolution CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
description |
Análise de polaridade consiste em classificar a opinião do autor em positiva, negativa e
neutra. No entanto, dado o grande volume de informações disponíveis na Web, esta análise
manual torna-se inviável. Em particular, no domínio financeiro este tipo de análise é
útil para empresas na tomada de decisões relacionadas ao mercado financeiro que parece
ser particularmente propenso a mudanças de acordo com opiniões. Os trabalhos disponíveis
na literatura propõem abordagens globais para esta tarefa, ou seja, consideram que
o texto tem apenas uma polaridade. No entanto, verifica-se que os documentos, em sua
grande maioria, citam várias entidades e as polaridades para estas entidades, em geral,
são diferentes. Isto sugere que a classificação de polaridade deve ser feita em nível de
entidade. Contudo, a maioria das abordagens tradicionais não concentram-se na tarefa de
classificar polaridade por entidade. Além disso, observamos que muitos dos documentos
no domínio financeiro nem sempre emitem opinião. Assim, uma primeira tarefa de
interesse nesse domínio é identificar os documentos em que opiniões são expressas, isto
é, documentos subjetivos. Portanto, neste trabalho propomos um método supervisionado
para classificação de polaridade baseado em múltiplos modelos com o intuito de classificar
documentos financeiros com múltiplas entidades. Em particular, estudamos estratégias
de segmentação em texto que usam heurísticas de casamento de string e resolução
de anáfora e propomos um método de classificação hierárquica baseada em detecção de
subjetividade. Nossos resultados mostraram que uma abordagem baseada em múltiplos
modelos é capaz de obter ganhos significativos sobre uma abordagem baseada em modelo
global na tarefa de classificação de polaridade com múltiplas entidades. A segmentação
do documento em sentenças que mencionam as entidades e a adoção de uma estratégia
hierárquica também obtiveram ganhos, embora modestos. |
author_additional |
Cristo, Marco Antônio Pinheiro de |
author_additionalStr |
Cristo, Marco Antônio Pinheiro de |
format |
Dissertação |
author |
Silva, Josiane Rodrigues da |
author2 |
http://lattes.cnpq.br/1788997377079235 |
author2Str |
http://lattes.cnpq.br/1788997377079235 |
title |
Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades. |
title_short |
Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades. |
title_full |
Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades. |
title_fullStr |
Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades. |
title_full_unstemmed |
Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades. |
title_sort |
detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades. |
publisher |
Universidade Federal do Amazonas |
publishDate |
2015 |
url |
http://tede.ufam.edu.br/handle/tede/4071 |
_version_ |
1831969228624756736 |
score |
11.753735 |