Por favor, use este identificador para citar o enlazar este ítem: http://www.repositorio.ufop.br/jspui/handle/123456789/7360
Título : Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados.
Autor : Stiilpen Júnior, Milton
metadata.dc.contributor.advisor: Merschmann, Luiz Henrique de Campos
Palabras clave : Mineração de dados - computação
Redes sociais on-line
Processamento da linguagem natural - computação
Fecha de publicación : 2016
metadata.dc.contributor.referee: Merschmann, Luiz Henrique de Campos
Ferreira, Anderson Almeida
Souza, Fabrício Benevenuto de
Citación : STIILPEN JÚNIOR, Milton. Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados. 2016. 41 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2016.
Resumen : Redes Sociais online (RSO) surgiram no início do século XXI e dão indícios de que terão vida longa. Cerca de 64% dos usuários de mídias sociais dizem acessar ao menos uma rede social todos os dias. Desse modo, é imensa a quantidade de dados gerados por esses canais de comunicação. O Processamento de Linguagem Natural em textos de redes sociais é um tema de pesquisa recente que vem atraindo um número cada vez maior de pesquisadores. Portanto, neste trabalho, é proposta um arcabouço capaz de lidar com a diversidade do português brasileiro, com o informalismo, com a natureza de tempo real e com a falta de contextualização de textos publicados em redes sociais. O arcabouço proposto foi avaliado em duas tarefas (Categorização de Texto e Mineração de Opinião) e os resultados experimentais mostraram que os mecanismos de pré-processamento existentes no arcabouço foram importantes para obtenção de bons resultados.
metadata.dc.description.abstracten: Social Networks emerged at the beginning of 21st century and give us evidence that they are going to have a long life. Almost two-thirds of overall social media users affirm an everyday usage of a social media website and, therefore, the data volume across this platforms is huge. Natural language processing of social media texts is an attractive topic among researchers of this area. While there are many studies about natural language processing of social media texts for some languages (e.g., English), the researches for Brazilian Portuguese language are still limited. Then, in this work, a framework is proposed to deal with peculiarities of the Brazilian Portuguese language in informal, short and noisy texts, where the lack of context poses obstacles in text mining. The proposed framework has been evaluated in two tasks (Text Categorization and Opinion Mining) and experiments showed that the preprocessing mechanisms included in this framework were important to achieve better results.
Descripción : Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
URI : http://www.repositorio.ufop.br/handle/123456789/7360
metadata.dc.rights.license: Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 09/03/2017 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação.
Aparece en las colecciones: PPGCC - Mestrado (Dissertações)

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
DISSERTAÇÃO_ArcabouçoProcessamentoTextos.pdf3,38 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.