Mgtr. Luis Fernando Aguas Bucheli
+593 984015184
@Aguaszoft
Aguaszoft@Outlook.es
Minería deTexto
(Text mining)
Cuando te encuentres a ti mismo al lado de
la mayoría, es tiempo de parar y
reflexionar
(Mark Twain)
Objetivo general
Conocer qué es y qué utilidades tiene la aplicación de la Minería de Texto, las
facilidades que presenta, las ventajas y desventajas.
Metodología
La metodología consiste en un proceso interactivo entre el profesor
[dinamizador] y los estudiantes, la cual se hadefinido como: “Aprender
haciendo - haciendo aprendiendo”.
En este proceso el profesor será el que guiará la dinámica para que los
estudiantes puedan aprender de forma constructiva su conocimiento.
Contenidos
• Text – Mining
• Técnicas de Text-Mining
• Text-Mining con Data-Mining
• Aprendizaje Supervisado
• Aplicaciones de Text Mining
• Tendencias
• Beneficios
• Plataformas
Text - Mining
• Es el proceso de analizar colecciones de materiales textuales con el fin de
capturar conceptos y temas clave y descubrir relaciones y tendencias ocultas
sin requerir que conozca las palabras o términos precisos que los autores
han usado para expresar esos conceptos.
• Surgió a principios de los 80 cuando los textos empezaban a necesitar una
gran cantidad de esfuerzo humano.
Técnicas deText-Mining
Extracción de
términos
• Identifica los
términos
clave y
entidades
lógicas
Extracción de
información
• Términos
extraídos del
texto para
identificar
las
relaciones
básicas
Análisis
relacional
• Permite
tener una
idea de las
relaciones
entre varias
entidades
Text-Miningcon Data-Mining
Se prepara el texto
Si hay varios
archivos, una sola
ubicación
En base de Datos,
se determina el
campo
Identificar el
texto
Aplicar algoritmos
text mining
Extraer el
texto y datos
Identificar
conceptos claves
Calificar por
categorías
Construir
modelos Emplear técnicas
tradicionales
•Clustering
•Clasificación
•Etc.
Analizar los
datos
AprendizajeSupervisado
Modelo
Clasificador
Nuevos
Documentos
Documentos de
Entrenamiento
Máquina de
Aprendizaje
Aplicaciones deText Mining
Resumen
automático
de textos
Detección de
fraudes
Tendencias
Electorales
Análisis de
sentimientos
Clasificación
de textos
Aplicaciones deText Mining
Interfaz de text mining de
TAKMI.
A: Número de documentos
que devolvió la búsqueda.
B: Títulos de documentos
relevantes.
C: Distribución de conceptos
que han sido extraídos de
esos documentos.
D: Estadísticas de los
conceptos.
Sentiment140
(anteriormente conocido
como "Twitter
Sentiment") le permite
descubrir el sentimiento
de una marca, producto o
tema en Twitter.
Aplicaciones deText Mining
La interfaz del sistema
Politics del .
La tabla a continuación
destaca el número de posts
relacionados con los
candidatos a Gobernador o al
Senado.
Aplicaciones deText Mining
Sistema VOSviewer.
Mapa de calor del
Journal of the
American Society for
Information Science
and Technology.
El color de un término
indica el índice de
citación promedio de
las publicaciones en
que el término
ocurrió.
Aplicaciones deText Mining
Tendencias
Text Mining
Business
Analytics
Text
Analytics
Beneficios delText - Mining
Costo y velocidad
•Facilidad en comparaciones
•Útil en datos grandes
Consistencia
•El análisis es más eficiente
•Facilita la integración de varias fuentes
Escalabilidad
•Parámetros establecidos
•Eficiencia en el análisis
Simplicidad
•Facilidad en filtrar, buscar y hacer referencias
Tecnologías para el text mining
CRISP-DM (Cross Industry Standard Process for Data Mining)
Plataformas
Gracias
Mgtr. Luis Fernando Aguas Bucheli
+593 984015184
@Aguaszoft
Aguaszoft@Outlook.es

Minería de Texto (Text mining)

  • 1.
    Mgtr. Luis FernandoAguas Bucheli +593 984015184 @Aguaszoft Aguaszoft@Outlook.es Minería deTexto (Text mining)
  • 2.
    Cuando te encuentresa ti mismo al lado de la mayoría, es tiempo de parar y reflexionar (Mark Twain)
  • 3.
    Objetivo general Conocer quées y qué utilidades tiene la aplicación de la Minería de Texto, las facilidades que presenta, las ventajas y desventajas.
  • 4.
    Metodología La metodología consisteen un proceso interactivo entre el profesor [dinamizador] y los estudiantes, la cual se hadefinido como: “Aprender haciendo - haciendo aprendiendo”. En este proceso el profesor será el que guiará la dinámica para que los estudiantes puedan aprender de forma constructiva su conocimiento.
  • 5.
    Contenidos • Text –Mining • Técnicas de Text-Mining • Text-Mining con Data-Mining • Aprendizaje Supervisado • Aplicaciones de Text Mining • Tendencias • Beneficios • Plataformas
  • 6.
    Text - Mining •Es el proceso de analizar colecciones de materiales textuales con el fin de capturar conceptos y temas clave y descubrir relaciones y tendencias ocultas sin requerir que conozca las palabras o términos precisos que los autores han usado para expresar esos conceptos. • Surgió a principios de los 80 cuando los textos empezaban a necesitar una gran cantidad de esfuerzo humano.
  • 7.
    Técnicas deText-Mining Extracción de términos •Identifica los términos clave y entidades lógicas Extracción de información • Términos extraídos del texto para identificar las relaciones básicas Análisis relacional • Permite tener una idea de las relaciones entre varias entidades
  • 8.
    Text-Miningcon Data-Mining Se preparael texto Si hay varios archivos, una sola ubicación En base de Datos, se determina el campo Identificar el texto Aplicar algoritmos text mining Extraer el texto y datos Identificar conceptos claves Calificar por categorías Construir modelos Emplear técnicas tradicionales •Clustering •Clasificación •Etc. Analizar los datos
  • 9.
  • 10.
    Aplicaciones deText Mining Resumen automático detextos Detección de fraudes Tendencias Electorales Análisis de sentimientos Clasificación de textos
  • 11.
    Aplicaciones deText Mining Interfazde text mining de TAKMI. A: Número de documentos que devolvió la búsqueda. B: Títulos de documentos relevantes. C: Distribución de conceptos que han sido extraídos de esos documentos. D: Estadísticas de los conceptos.
  • 12.
    Sentiment140 (anteriormente conocido como "Twitter Sentiment")le permite descubrir el sentimiento de una marca, producto o tema en Twitter. Aplicaciones deText Mining
  • 13.
    La interfaz delsistema Politics del . La tabla a continuación destaca el número de posts relacionados con los candidatos a Gobernador o al Senado. Aplicaciones deText Mining
  • 14.
    Sistema VOSviewer. Mapa decalor del Journal of the American Society for Information Science and Technology. El color de un término indica el índice de citación promedio de las publicaciones en que el término ocurrió. Aplicaciones deText Mining
  • 15.
  • 16.
    Beneficios delText -Mining Costo y velocidad •Facilidad en comparaciones •Útil en datos grandes Consistencia •El análisis es más eficiente •Facilita la integración de varias fuentes Escalabilidad •Parámetros establecidos •Eficiencia en el análisis Simplicidad •Facilidad en filtrar, buscar y hacer referencias
  • 17.
    Tecnologías para eltext mining CRISP-DM (Cross Industry Standard Process for Data Mining)
  • 18.
  • 19.
    Gracias Mgtr. Luis FernandoAguas Bucheli +593 984015184 @Aguaszoft Aguaszoft@Outlook.es

Notas del editor

  • #20 Tutorial MVA Emprendimientos con BizSpark y Azure: https://mva.microsoft.com/es-es/training-courses/emprendiendo-con-bizspark-y-microsoft-azure-11151