Este documento presenta un proyecto de minería de textos realizado por un grupo de estudiantes. Explica brevemente qué es la minería de textos, sus aplicaciones en diferentes campos como investigación, negocios y salud, y algunas técnicas utilizadas como la extracción de términos e información y el análisis relacional. También resalta la importancia de los datos no estructurados y cómo las empresas usan la minería de textos para la gestión de contenido y recomendaciones.
1. PROYECTO #3 TEXT MINING
INTEGRANTES
SILVIA
CARVAJAL
MENDEZ
BERTHY VARGAS
VILLARREAL
LUIS ENRIQUE
CESARY AÑEZ
XAVIER MARCELO
PANIAGUA
ALARCÓN
MODULO :
FUNDAMENTOS DE
MINERIA Y CIENCIAS
DE DATOS
GRUPO:2
DOCENTE: ING. DAVID E.
MENDOZA GUTIERREZ
2. La minería de textos busca extraer información útil e importante
de formatos de documentos heterogéneos, tales como páginas
web, correos electrónicos, medios sociales, artículos de revistas,
etc.
¿Que es la minería de textos?
3. La minería de textos tiene muchas aplicaciones. Por ejemplo, la
minería de textos puede ayudar a encontrar tecnologías nuevas e
innovadoras dentro de ciertos dominios. Es un método muy
eficiente para generar nueva información y conocimiento.
¿Por qué la necesitamos?
4. Estos son algunos ejemplos de uso en diferentes campos:
● Investigación
● Negocios
● Seguridad
● Uso Diario
● Salud
¿Que clase de gente hace minería
de textos?
5. Los motores de búsqueda como Google, recuperan todos los
documentos que contienen las palabras clave que has
especificado, pero no hay valor añadido a los datos.
¿Cual es la diferencia entre minería
de texto y google?
6. ● Extracción de términos
● Extraccion de informacion
● Análisis Relacional
Técnicas de Text-Mining
7. ¿Estamos recopilando todos nuestros datos?
● Datos estructurados
● Datos no estructurados
Fuentes de Text-Mining
8. Estos datos cargados de texto contienen información que ayudan
a las empresas a tomar decisiones basadas en datos. Pero,
debido a que provienen de humanos en lugar de datos
almacenados por campos en bases de datos o etiquetados en
documentos, habrá irregularidades en el contenido,
ambigüedades debido al idioma, entre otros.
¿Por qué son importantes los datos
no estructurados?
9. ● Gestión de contenido
● Búsqueda semántica
● Cumplimiento regulatorio
● Recomendaciones de contenido
¿Cómo utilizan las empresas la
minería de textos?
10. ● Costo y Velocidad
● Consistencia
● Escalabilidad
● Simplicidad
● Mejores Ideas
Beneficios del Text-Mining
11. ¿Cómo funciona la minería de texto?
La extracción de textos puede dividirse en cinco pasos:
1. Recolección
2. Preprocesamiento
3. Limpieza de textos
4. Tokenización
5. Extraccion de caracteristicas
12. Ejemplo de Aplicación de Text Mining
Este ejemplo pretende servir de introduccion al analisis de texto(text mining)
con Python. Para ello, analizaremos las publicaciones que han hecho en twitter
diferentes personalidades con el objetivo de :
● Obtener número de tweets publicados por mes
● Top 10 de palabras por autor
● Top 15 palabras más características de cada autor