Minería de texto: conceptos, técnicas y aplicaciones
1. Mgtr. Luis Fernando Aguas Bucheli
+593 984015184
@Aguaszoft
Aguaszoft@Outlook.es
Minería deTexto
(Text mining)
2. Cuando te encuentres a ti mismo al lado de
la mayoría, es tiempo de parar y
reflexionar
(Mark Twain)
3. Objetivo general
Conocer qué es y qué utilidades tiene la aplicación de la Minería de Texto, las
facilidades que presenta, las ventajas y desventajas.
4. Metodología
La metodología consiste en un proceso interactivo entre el profesor
[dinamizador] y los estudiantes, la cual se hadefinido como: “Aprender
haciendo - haciendo aprendiendo”.
En este proceso el profesor será el que guiará la dinámica para que los
estudiantes puedan aprender de forma constructiva su conocimiento.
5. Contenidos
• Text – Mining
• Técnicas de Text-Mining
• Text-Mining con Data-Mining
• Aprendizaje Supervisado
• Aplicaciones de Text Mining
• Tendencias
• Beneficios
• Plataformas
6. Text - Mining
• Es el proceso de analizar colecciones de materiales textuales con el fin de
capturar conceptos y temas clave y descubrir relaciones y tendencias ocultas
sin requerir que conozca las palabras o términos precisos que los autores
han usado para expresar esos conceptos.
• Surgió a principios de los 80 cuando los textos empezaban a necesitar una
gran cantidad de esfuerzo humano.
7. Técnicas deText-Mining
Extracción de
términos
• Identifica los
términos
clave y
entidades
lógicas
Extracción de
información
• Términos
extraídos del
texto para
identificar
las
relaciones
básicas
Análisis
relacional
• Permite
tener una
idea de las
relaciones
entre varias
entidades
8. Text-Miningcon Data-Mining
Se prepara el texto
Si hay varios
archivos, una sola
ubicación
En base de Datos,
se determina el
campo
Identificar el
texto
Aplicar algoritmos
text mining
Extraer el
texto y datos
Identificar
conceptos claves
Calificar por
categorías
Construir
modelos Emplear técnicas
tradicionales
•Clustering
•Clasificación
•Etc.
Analizar los
datos
11. Aplicaciones deText Mining
Interfaz de text mining de
TAKMI.
A: Número de documentos
que devolvió la búsqueda.
B: Títulos de documentos
relevantes.
C: Distribución de conceptos
que han sido extraídos de
esos documentos.
D: Estadísticas de los
conceptos.
13. La interfaz del sistema
Politics del .
La tabla a continuación
destaca el número de posts
relacionados con los
candidatos a Gobernador o al
Senado.
Aplicaciones deText Mining
14. Sistema VOSviewer.
Mapa de calor del
Journal of the
American Society for
Information Science
and Technology.
El color de un término
indica el índice de
citación promedio de
las publicaciones en
que el término
ocurrió.
Aplicaciones deText Mining
16. Beneficios delText - Mining
Costo y velocidad
•Facilidad en comparaciones
•Útil en datos grandes
Consistencia
•El análisis es más eficiente
•Facilita la integración de varias fuentes
Escalabilidad
•Parámetros establecidos
•Eficiencia en el análisis
Simplicidad
•Facilidad en filtrar, buscar y hacer referencias
17. Tecnologías para el text mining
CRISP-DM (Cross Industry Standard Process for Data Mining)