SlideShare una empresa de Scribd logo
1 de 17
Introdução à Mineração de Dados
Estudos de caso (II)
Luis Paulo Vieira Braga
braga@dme.ufrj.br
lpbraga@geologia.ufrj.br
II Semana da ABE no Rio de Janeiro
ENCE
14, 15, 16 de setembro de 2009
Page  2
ESTUDOS DE CASO (Mineração de Textos)
Mineração de Textos
Luis Paulo Vieira Braga
Page  3
ESTUDOS DE CASO (Mineração de Textos)
O objetivo da mineração de textos é o processamento de
informação textual, podendo ser analisadas palavras,
agrupamentos de palavras, ou mesmo documentos entre
si através das suas similaridades ou de suas relações
com outras variáveis de interesse. Algumas aplicações
típicas para mineração de textos são a análise de
questões abertas em questionários, o processamento
automático de mensagens e a busca de referências em
uma coleção de artigos.Melhores resultados são obtidos
para um grande número de textos de tamanho médio ou
pequeno, ao invés de poucos textos longos.
Page  4
ESTUDOS DE CASO (Mineração de Textos)
As etapas em um projeto de mineração de textos
podem ser esquematizadas como:
a) entrada dos textos;
b) pré-processamento;
c) cálculo de freqüências;
d) redução de dimensionalidade;
e) visualização;
f) classificação não supervisionada
ou supervisionada.
Page  5
ESTUDOS DE CASO (Mineração de Textos)
Exemplo de um texto, em um
Projeto de Mineração destinado
a discriminar mensagens
comerciais (spam)
Page  6
ESTUDOS DE CASO (Mineração de Textos)
Os textos passam a
ser os dados.
Page  7
ESTUDOS DE CASO (Mineração de Textos)
Pré-Processamento
Page  8
ESTUDOS DE CASO (Mineração de Textos)
Page  9
ESTUDOS DE CASO (Mineração de Textos)
Page  10
ESTUDOS DE CASO (Mineração de Textos)
Cálculo de frequências
Page  11
ESTUDOS DE CASO (Mineração de Textos)
Frequências
binárias
Page  12
ESTUDOS DE CASO (Mineração de Textos)
Redução de
dimensionalidade
Page  13
ESTUDOS DE CASO (Mineração de Textos)
Page  14
ESTUDOS DE CASO (Mineração de Textos)
Classificação Não
Supervisionada
Page  15
ESTUDOS DE CASO (Mineração de Textos)
Classificação final
Page  16
ESTUDOS DE CASO (Mineração de Textos)
Validação
Page  17
ESTUDOS DE CASO (Mineração de Textos)
Gráfico de
Alavancagem

Más contenido relacionado

Destacado

Extração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache LuceneExtração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache LuceneAndré Luis Schwerz
 
Text Mining with Node.js - Philipp Burckhardt, Carnegie Mellon University
Text Mining with Node.js - Philipp Burckhardt, Carnegie Mellon UniversityText Mining with Node.js - Philipp Burckhardt, Carnegie Mellon University
Text Mining with Node.js - Philipp Burckhardt, Carnegie Mellon UniversityNodejsFoundation
 
Text Mining para BI e Finalização do Dashboard no Tableau
Text Mining para BI e Finalização do Dashboard no TableauText Mining para BI e Finalização do Dashboard no Tableau
Text Mining para BI e Finalização do Dashboard no TableauLeandro Guerra
 
Introduction to Text Mining
Introduction to Text MiningIntroduction to Text Mining
Introduction to Text MiningMinha Hwang
 
Big Data & Text Mining
Big Data & Text MiningBig Data & Text Mining
Big Data & Text MiningMichel Bruley
 

Destacado (6)

Extração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache LuceneExtração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache Lucene
 
Text Mining with Node.js - Philipp Burckhardt, Carnegie Mellon University
Text Mining with Node.js - Philipp Burckhardt, Carnegie Mellon UniversityText Mining with Node.js - Philipp Burckhardt, Carnegie Mellon University
Text Mining with Node.js - Philipp Burckhardt, Carnegie Mellon University
 
Text Mining para BI e Finalização do Dashboard no Tableau
Text Mining para BI e Finalização do Dashboard no TableauText Mining para BI e Finalização do Dashboard no Tableau
Text Mining para BI e Finalização do Dashboard no Tableau
 
Introduction to Text Mining
Introduction to Text MiningIntroduction to Text Mining
Introduction to Text Mining
 
Big Data & Text Mining
Big Data & Text MiningBig Data & Text Mining
Big Data & Text Mining
 
Textmining Introduction
Textmining IntroductionTextmining Introduction
Textmining Introduction
 

Más de ufrj

Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...
Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...
Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...ufrj
 
Os 3qs
Os 3qsOs 3qs
Os 3qsufrj
 
Financiar periódicos abertos ou bases abertas de periódicos
Financiar periódicos abertos ou bases abertas de periódicosFinanciar periódicos abertos ou bases abertas de periódicos
Financiar periódicos abertos ou bases abertas de periódicosufrj
 
IEncontroestudos de caso
IEncontroestudos de casoIEncontroestudos de caso
IEncontroestudos de casoufrj
 
IEncontroMinDados
IEncontroMinDadosIEncontroMinDados
IEncontroMinDadosufrj
 
Mapping gold pathfinders
Mapping gold pathfindersMapping gold pathfinders
Mapping gold pathfindersufrj
 
Maratona de negocios cp br7 apresentação do projeto obsuni
Maratona de negocios cp br7   apresentação do projeto obsuniMaratona de negocios cp br7   apresentação do projeto obsuni
Maratona de negocios cp br7 apresentação do projeto obsuniufrj
 
Ejercicio 2, parte II
Ejercicio 2, parte IIEjercicio 2, parte II
Ejercicio 2, parte IIufrj
 
Mineria de Datos y Statistica
Mineria de Datos y StatisticaMineria de Datos y Statistica
Mineria de Datos y Statisticaufrj
 
Mineria de Datos_parte V
Mineria de Datos_parte VMineria de Datos_parte V
Mineria de Datos_parte Vufrj
 
Mineria de datos_parte IV
Mineria de datos_parte IVMineria de datos_parte IV
Mineria de datos_parte IVufrj
 
Mineria de Datos Parte III
Mineria de Datos Parte IIIMineria de Datos Parte III
Mineria de Datos Parte IIIufrj
 
Mineria de datos Parte II
Mineria de datos Parte IIMineria de datos Parte II
Mineria de datos Parte IIufrj
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I ufrj
 
Presentation sinape
Presentation sinapePresentation sinape
Presentation sinapeufrj
 
AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?
AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?
AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?ufrj
 
Publicar, publicar, publicar
Publicar, publicar, publicarPublicar, publicar, publicar
Publicar, publicar, publicarufrj
 
O futuro do livro
O futuro do livroO futuro do livro
O futuro do livroufrj
 
O futuro do livro
O futuro do livroO futuro do livro
O futuro do livroufrj
 
Abe Curso Estudos De Caso
Abe Curso Estudos De CasoAbe Curso Estudos De Caso
Abe Curso Estudos De Casoufrj
 

Más de ufrj (20)

Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...
Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...
Os três “q´s” da formação universitária de jovens no Brasil: Para o quê? Quem...
 
Os 3qs
Os 3qsOs 3qs
Os 3qs
 
Financiar periódicos abertos ou bases abertas de periódicos
Financiar periódicos abertos ou bases abertas de periódicosFinanciar periódicos abertos ou bases abertas de periódicos
Financiar periódicos abertos ou bases abertas de periódicos
 
IEncontroestudos de caso
IEncontroestudos de casoIEncontroestudos de caso
IEncontroestudos de caso
 
IEncontroMinDados
IEncontroMinDadosIEncontroMinDados
IEncontroMinDados
 
Mapping gold pathfinders
Mapping gold pathfindersMapping gold pathfinders
Mapping gold pathfinders
 
Maratona de negocios cp br7 apresentação do projeto obsuni
Maratona de negocios cp br7   apresentação do projeto obsuniMaratona de negocios cp br7   apresentação do projeto obsuni
Maratona de negocios cp br7 apresentação do projeto obsuni
 
Ejercicio 2, parte II
Ejercicio 2, parte IIEjercicio 2, parte II
Ejercicio 2, parte II
 
Mineria de Datos y Statistica
Mineria de Datos y StatisticaMineria de Datos y Statistica
Mineria de Datos y Statistica
 
Mineria de Datos_parte V
Mineria de Datos_parte VMineria de Datos_parte V
Mineria de Datos_parte V
 
Mineria de datos_parte IV
Mineria de datos_parte IVMineria de datos_parte IV
Mineria de datos_parte IV
 
Mineria de Datos Parte III
Mineria de Datos Parte IIIMineria de Datos Parte III
Mineria de Datos Parte III
 
Mineria de datos Parte II
Mineria de datos Parte IIMineria de datos Parte II
Mineria de datos Parte II
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 
Presentation sinape
Presentation sinapePresentation sinape
Presentation sinape
 
AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?
AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?
AVAs e Moodle - Novos Recursos Pedagógicos somente para EAD?
 
Publicar, publicar, publicar
Publicar, publicar, publicarPublicar, publicar, publicar
Publicar, publicar, publicar
 
O futuro do livro
O futuro do livroO futuro do livro
O futuro do livro
 
O futuro do livro
O futuro do livroO futuro do livro
O futuro do livro
 
Abe Curso Estudos De Caso
Abe Curso Estudos De CasoAbe Curso Estudos De Caso
Abe Curso Estudos De Caso
 

Introdução à Mineração de Dados Estudos de Caso

  • 1. Introdução à Mineração de Dados Estudos de caso (II) Luis Paulo Vieira Braga braga@dme.ufrj.br lpbraga@geologia.ufrj.br II Semana da ABE no Rio de Janeiro ENCE 14, 15, 16 de setembro de 2009
  • 2. Page  2 ESTUDOS DE CASO (Mineração de Textos) Mineração de Textos Luis Paulo Vieira Braga
  • 3. Page  3 ESTUDOS DE CASO (Mineração de Textos) O objetivo da mineração de textos é o processamento de informação textual, podendo ser analisadas palavras, agrupamentos de palavras, ou mesmo documentos entre si através das suas similaridades ou de suas relações com outras variáveis de interesse. Algumas aplicações típicas para mineração de textos são a análise de questões abertas em questionários, o processamento automático de mensagens e a busca de referências em uma coleção de artigos.Melhores resultados são obtidos para um grande número de textos de tamanho médio ou pequeno, ao invés de poucos textos longos.
  • 4. Page  4 ESTUDOS DE CASO (Mineração de Textos) As etapas em um projeto de mineração de textos podem ser esquematizadas como: a) entrada dos textos; b) pré-processamento; c) cálculo de freqüências; d) redução de dimensionalidade; e) visualização; f) classificação não supervisionada ou supervisionada.
  • 5. Page  5 ESTUDOS DE CASO (Mineração de Textos) Exemplo de um texto, em um Projeto de Mineração destinado a discriminar mensagens comerciais (spam)
  • 6. Page  6 ESTUDOS DE CASO (Mineração de Textos) Os textos passam a ser os dados.
  • 7. Page  7 ESTUDOS DE CASO (Mineração de Textos) Pré-Processamento
  • 8. Page  8 ESTUDOS DE CASO (Mineração de Textos)
  • 9. Page  9 ESTUDOS DE CASO (Mineração de Textos)
  • 10. Page  10 ESTUDOS DE CASO (Mineração de Textos) Cálculo de frequências
  • 11. Page  11 ESTUDOS DE CASO (Mineração de Textos) Frequências binárias
  • 12. Page  12 ESTUDOS DE CASO (Mineração de Textos) Redução de dimensionalidade
  • 13. Page  13 ESTUDOS DE CASO (Mineração de Textos)
  • 14. Page  14 ESTUDOS DE CASO (Mineração de Textos) Classificação Não Supervisionada
  • 15. Page  15 ESTUDOS DE CASO (Mineração de Textos) Classificação final
  • 16. Page  16 ESTUDOS DE CASO (Mineração de Textos) Validação
  • 17. Page  17 ESTUDOS DE CASO (Mineração de Textos) Gráfico de Alavancagem

Notas del editor

  1. 1