/img alt="Imagem da capa" class="recordcover" src="""/>
Dissertação
Detecção automática de conteúdo ofensivo na web
A World Wide Web (Web) é uma fonte de informação com grande quantidade e diversidade de conteúdo, incluindo material de caráter ofensivo relacionado á pornografia. Diante deste cenário, existe a necessidade de detectar tal conteúdo ofensivo de maneira a evitar que o mesmo seja indevidamente acessado...
Autor principal: | Belém, Ruan Josemberg Silva |
---|---|
Outros Autores: | http://lattes.cnpq.br/1956136040044296 |
Grau: | Dissertação |
Idioma: | por |
Publicado em: |
Universidade Federal do Amazonas
2015
|
Assuntos: | |
Acesso em linha: |
http://tede.ufam.edu.br/handle/tede/2932 |
id |
oai:https:--tede.ufam.edu.br-handle-:tede-2932 |
---|---|
recordtype |
dspace |
spelling |
oai:https:--tede.ufam.edu.br-handle-:tede-29322016-04-22T14:34:33Z Detecção automática de conteúdo ofensivo na web Automatic detection of offensive content on Web Belém, Ruan Josemberg Silva Cavalcanti, João Marcos Bastos http://lattes.cnpq.br/1956136040044296 http://lattes.cnpq.br/3537707069694606 Recuperação de Informação Detecção de imagens ofensivas Web Processamento Digital de Imagens Recuperação de Informação Detecção de imagens ofensivas Web Processamento Digital de Imagens Information recoveing Offensive image detection Web Digital image processing CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO A World Wide Web (Web) é uma fonte de informação com grande quantidade e diversidade de conteúdo, incluindo material de caráter ofensivo relacionado á pornografia. Diante deste cenário, existe a necessidade de detectar tal conteúdo ofensivo de maneira a evitar que o mesmo seja indevidamente acessado por crianças ou por funcionários de empresas, onde o acesso a este tipo de conteúdo geralmente não é permitido. Embora este tipo de informação possa estar presente na Web em forma de texto, vídeo ou sons, grande parte deste conteúdo está disponibilizado na forma de imagens. O problema de identificação de imagens ofensivas pode ser visto como um problema de classificação. Como as imagens em questão estão inseridas em páginas web, além das informações que podem ser extraídas da própria imagem, também têm-se as informações textuais encontradas nas páginas que possuem as imagens. Aptos a extração de evidências a classificação é realizada usando-se um classificador baseado em SVM treinado com uma coleção de 1000 imagens ofensivas e 1000 imagens não-ofensivas. Este trabalho apresenta duas abordagens diferentes para detecção de imagens ofensivas na Web: a primeira, baseada no conteúdo da imagem e a segunda, baseada em evidências textuais extraídas das páginas web onde se encontram as imagens. Ambas as abordagens se mostraram efiazes na detecção de imagens ofensivas, apesar de utilizarem algoritmos simples para a extração de informações relacionadas às imagens. The World Wide Web is a huge source of diverse information, including offensive material such as pornography related content. This poses the problem of automatcally detecting offensive content as a way to avoid unauthorised access, for instance, by children or by employees during working hours. Although this sort of information is published in many forms, including text, sound and video, images are the most common form of publication of offensive content on the Web. Detecting offensive images can be considered as a classification problem. Given that images are part of Web pages, textual information can be used as important evidence along with the content extracted from images, such as colour, texture and shapes. This dissertation proposes two distinct approaches for automatic detection of offensive images on the Web. The first is based on image content, specifically colour. The second approach is based on textual terms extracted from the Web page that present the images. After evidence extraction the classification is performed using the SVM technique, based on a collection of 1000 offensive images and 1000 non-offensive images for training. Experiments carried out have shown that both approaches are effective, although they rely on simple algorithms for extracting evidences related to the images. Fundação de Amparo à Pesquisa do Estado do Amazonas 2015-04-11T14:03:02Z 2007-07-06 2006-05-12 Dissertação BELÉM, Ruan Josemberg Silva.Detecção automática de conteúdo ofensivo na web. 2006. 52 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2006. http://tede.ufam.edu.br/handle/tede/2932 por Acesso Aberto application/pdf Universidade Federal do Amazonas Instituto de Computação BR UFAM Programa de Pós-graduação em Informática |
institution |
TEDE - Universidade Federal do Amazonas |
collection |
TEDE-UFAM |
language |
por |
topic |
Recuperação de Informação Detecção de imagens ofensivas Web Processamento Digital de Imagens Recuperação de Informação Detecção de imagens ofensivas Web Processamento Digital de Imagens Information recoveing Offensive image detection Web Digital image processing CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
spellingShingle |
Recuperação de Informação Detecção de imagens ofensivas Web Processamento Digital de Imagens Recuperação de Informação Detecção de imagens ofensivas Web Processamento Digital de Imagens Information recoveing Offensive image detection Web Digital image processing CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO Belém, Ruan Josemberg Silva Detecção automática de conteúdo ofensivo na web |
topic_facet |
Recuperação de Informação Detecção de imagens ofensivas Web Processamento Digital de Imagens Recuperação de Informação Detecção de imagens ofensivas Web Processamento Digital de Imagens Information recoveing Offensive image detection Web Digital image processing CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
description |
A World Wide Web (Web) é uma fonte de informação com grande quantidade e diversidade de conteúdo, incluindo material de caráter ofensivo relacionado á pornografia. Diante deste cenário, existe a necessidade de detectar tal conteúdo ofensivo de maneira a evitar que o mesmo seja indevidamente acessado por crianças ou por funcionários de empresas, onde o acesso a este tipo de conteúdo geralmente não é permitido. Embora este tipo de informação possa estar presente na Web em forma de texto, vídeo ou sons, grande parte deste conteúdo está disponibilizado na forma de imagens. O problema de identificação de imagens ofensivas pode
ser visto como um problema de classificação. Como as imagens em questão estão inseridas em páginas web, além das informações que podem ser extraídas da própria imagem, também têm-se as informações textuais encontradas nas páginas que possuem as imagens. Aptos a extração de evidências a classificação é realizada usando-se um classificador baseado em SVM treinado com uma coleção de 1000 imagens ofensivas e 1000 imagens não-ofensivas. Este trabalho apresenta duas abordagens diferentes para detecção de imagens ofensivas na Web: a primeira, baseada no conteúdo da imagem e a segunda, baseada em evidências textuais extraídas das páginas web onde se encontram as imagens. Ambas as abordagens se mostraram efiazes na detecção de imagens ofensivas, apesar de utilizarem algoritmos simples para a extração de informações relacionadas às imagens. |
author_additional |
Cavalcanti, João Marcos Bastos |
author_additionalStr |
Cavalcanti, João Marcos Bastos |
format |
Dissertação |
author |
Belém, Ruan Josemberg Silva |
author2 |
http://lattes.cnpq.br/1956136040044296 |
author2Str |
http://lattes.cnpq.br/1956136040044296 |
title |
Detecção automática de conteúdo ofensivo na web |
title_short |
Detecção automática de conteúdo ofensivo na web |
title_full |
Detecção automática de conteúdo ofensivo na web |
title_fullStr |
Detecção automática de conteúdo ofensivo na web |
title_full_unstemmed |
Detecção automática de conteúdo ofensivo na web |
title_sort |
detecção automática de conteúdo ofensivo na web |
publisher |
Universidade Federal do Amazonas |
publishDate |
2015 |
url |
http://tede.ufam.edu.br/handle/tede/2932 |
_version_ |
1831969073638932480 |
score |
11.753735 |