1. Introdução à Mineração de Dados
Estudos de caso (II)
Luis Paulo Vieira Braga
braga@dme.ufrj.br
lpbraga@geologia.ufrj.br
II Semana da ABE no Rio de Janeiro
ENCE
14, 15, 16 de setembro de 2009
2. Page 2
ESTUDOS DE CASO (Mineração de Textos)
Mineração de Textos
Luis Paulo Vieira Braga
3. Page 3
ESTUDOS DE CASO (Mineração de Textos)
O objetivo da mineração de textos é o processamento de
informação textual, podendo ser analisadas palavras,
agrupamentos de palavras, ou mesmo documentos entre
si através das suas similaridades ou de suas relações
com outras variáveis de interesse. Algumas aplicações
típicas para mineração de textos são a análise de
questões abertas em questionários, o processamento
automático de mensagens e a busca de referências em
uma coleção de artigos.Melhores resultados são obtidos
para um grande número de textos de tamanho médio ou
pequeno, ao invés de poucos textos longos.
4. Page 4
ESTUDOS DE CASO (Mineração de Textos)
As etapas em um projeto de mineração de textos
podem ser esquematizadas como:
a) entrada dos textos;
b) pré-processamento;
c) cálculo de freqüências;
d) redução de dimensionalidade;
e) visualização;
f) classificação não supervisionada
ou supervisionada.
5. Page 5
ESTUDOS DE CASO (Mineração de Textos)
Exemplo de um texto, em um
Projeto de Mineração destinado
a discriminar mensagens
comerciais (spam)
6. Page 6
ESTUDOS DE CASO (Mineração de Textos)
Os textos passam a
ser os dados.