SlideShare una empresa de Scribd logo
1 de 12
PROYECTO #3 TEXT MINING
INTEGRANTES
SILVIA
CARVAJAL
MENDEZ
BERTHY VARGAS
VILLARREAL
LUIS ENRIQUE
CESARY AÑEZ
XAVIER MARCELO
PANIAGUA
ALARCÓN
MODULO :
FUNDAMENTOS DE
MINERIA Y CIENCIAS
DE DATOS
GRUPO:2
DOCENTE: ING. DAVID E.
MENDOZA GUTIERREZ
La minería de textos busca extraer información útil e importante
de formatos de documentos heterogéneos, tales como páginas
web, correos electrónicos, medios sociales, artículos de revistas,
etc.
¿Que es la minería de textos?
La minería de textos tiene muchas aplicaciones. Por ejemplo, la
minería de textos puede ayudar a encontrar tecnologías nuevas e
innovadoras dentro de ciertos dominios. Es un método muy
eficiente para generar nueva información y conocimiento.
¿Por qué la necesitamos?
Estos son algunos ejemplos de uso en diferentes campos:
● Investigación
● Negocios
● Seguridad
● Uso Diario
● Salud
¿Que clase de gente hace minería
de textos?
Los motores de búsqueda como Google, recuperan todos los
documentos que contienen las palabras clave que has
especificado, pero no hay valor añadido a los datos.
¿Cual es la diferencia entre minería
de texto y google?
● Extracción de términos
● Extraccion de informacion
● Análisis Relacional
Técnicas de Text-Mining
¿Estamos recopilando todos nuestros datos?
● Datos estructurados
● Datos no estructurados
Fuentes de Text-Mining
Estos datos cargados de texto contienen información que ayudan
a las empresas a tomar decisiones basadas en datos. Pero,
debido a que provienen de humanos en lugar de datos
almacenados por campos en bases de datos o etiquetados en
documentos, habrá irregularidades en el contenido,
ambigüedades debido al idioma, entre otros.
¿Por qué son importantes los datos
no estructurados?
● Gestión de contenido
● Búsqueda semántica
● Cumplimiento regulatorio
● Recomendaciones de contenido
¿Cómo utilizan las empresas la
minería de textos?
● Costo y Velocidad
● Consistencia
● Escalabilidad
● Simplicidad
● Mejores Ideas
Beneficios del Text-Mining
¿Cómo funciona la minería de texto?
La extracción de textos puede dividirse en cinco pasos:
1. Recolección
2. Preprocesamiento
3. Limpieza de textos
4. Tokenización
5. Extraccion de caracteristicas
Ejemplo de Aplicación de Text Mining
Este ejemplo pretende servir de introduccion al analisis de texto(text mining)
con Python. Para ello, analizaremos las publicaciones que han hecho en twitter
diferentes personalidades con el objetivo de :
● Obtener número de tweets publicados por mes
● Top 10 de palabras por autor
● Top 15 palabras más características de cada autor

Más contenido relacionado

La actualidad más candente

Big data y big query
Big data y big queryBig data y big query
Big data y big queryJorge Urquiza
 
BIG DATA GRUPO #7
BIG DATA GRUPO #7 BIG DATA GRUPO #7
BIG DATA GRUPO #7 Dyllan Raza
 
Big Data y el ERP en México
Big Data y el ERP en MéxicoBig Data y el ERP en México
Big Data y el ERP en MéxicoSoftware Guru
 
BDAS-2017 | Organizaciones Orientadas al dato
BDAS-2017 | Organizaciones Orientadas al datoBDAS-2017 | Organizaciones Orientadas al dato
BDAS-2017 | Organizaciones Orientadas al datoBig-Data-Summit
 
Webinar: "Datos no Estructurados" en TIBCO Spotfire
Webinar: "Datos no Estructurados" en TIBCO SpotfireWebinar: "Datos no Estructurados" en TIBCO Spotfire
Webinar: "Datos no Estructurados" en TIBCO SpotfireIT-NOVA
 
BDAS-2017 | Deep Learning para Extracción de Valor en Contenidos Digitales
BDAS-2017 | Deep Learning para Extracción de Valor en Contenidos DigitalesBDAS-2017 | Deep Learning para Extracción de Valor en Contenidos Digitales
BDAS-2017 | Deep Learning para Extracción de Valor en Contenidos DigitalesBig-Data-Summit
 
Nuevas tecnologias power point pptx
Nuevas tecnologias power point pptxNuevas tecnologias power point pptx
Nuevas tecnologias power point pptxnelsonsanchez86
 
Big data de luis cipamocha 11 2
Big data de luis cipamocha 11 2Big data de luis cipamocha 11 2
Big data de luis cipamocha 11 2Luchito B
 
Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...
Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...
Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...Joan David Baena
 
Big data y la inteligencia de negocios
Big data y la inteligencia de negociosBig data y la inteligencia de negocios
Big data y la inteligencia de negociosnnakasone
 
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQIntroducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQSolidQ
 

La actualidad más candente (18)

Big data y big query
Big data y big queryBig data y big query
Big data y big query
 
BIG DATA GRUPO #7
BIG DATA GRUPO #7 BIG DATA GRUPO #7
BIG DATA GRUPO #7
 
Big data y big query
Big data y big queryBig data y big query
Big data y big query
 
Que es big data
Que es big dataQue es big data
Que es big data
 
Big Data y el ERP en México
Big Data y el ERP en MéxicoBig Data y el ERP en México
Big Data y el ERP en México
 
BDAS-2017 | Organizaciones Orientadas al dato
BDAS-2017 | Organizaciones Orientadas al datoBDAS-2017 | Organizaciones Orientadas al dato
BDAS-2017 | Organizaciones Orientadas al dato
 
Webinar: "Datos no Estructurados" en TIBCO Spotfire
Webinar: "Datos no Estructurados" en TIBCO SpotfireWebinar: "Datos no Estructurados" en TIBCO Spotfire
Webinar: "Datos no Estructurados" en TIBCO Spotfire
 
Big data-grupo-7
Big data-grupo-7Big data-grupo-7
Big data-grupo-7
 
BDAS-2017 | Deep Learning para Extracción de Valor en Contenidos Digitales
BDAS-2017 | Deep Learning para Extracción de Valor en Contenidos DigitalesBDAS-2017 | Deep Learning para Extracción de Valor en Contenidos Digitales
BDAS-2017 | Deep Learning para Extracción de Valor en Contenidos Digitales
 
Nuevas tecnologias power point pptx
Nuevas tecnologias power point pptxNuevas tecnologias power point pptx
Nuevas tecnologias power point pptx
 
Big data de luis cipamocha 11 2
Big data de luis cipamocha 11 2Big data de luis cipamocha 11 2
Big data de luis cipamocha 11 2
 
Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...
Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...
Big data y su impacto en los Objetivos de Desarrollo Sostenible (ODS) - Unive...
 
Big data kelly valencia
Big data kelly valenciaBig data kelly valencia
Big data kelly valencia
 
Big data y big query
Big data y big queryBig data y big query
Big data y big query
 
Big data y la inteligencia de negocios
Big data y la inteligencia de negociosBig data y la inteligencia de negocios
Big data y la inteligencia de negocios
 
Big data
Big dataBig data
Big data
 
Big data presentacion
Big data presentacionBig data presentacion
Big data presentacion
 
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQIntroducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
 

Similar a PROYECTO #3 MINERÍA DE TEXTO

Conociendo el bigdata por Camargo y Joyanes
Conociendo el bigdata por Camargo y JoyanesConociendo el bigdata por Camargo y Joyanes
Conociendo el bigdata por Camargo y Joyanesjacristancho
 
La gestión de datos de investigación en el horizonte de las bibliotecas de i...
La gestión de datos de investigación en el  horizonte de las bibliotecas de i...La gestión de datos de investigación en el  horizonte de las bibliotecas de i...
La gestión de datos de investigación en el horizonte de las bibliotecas de i...Julio Alonso Arévalo
 
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.www.cathedratic.com
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual dataPamela Paz
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual dataJonathan Calero
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual dataPamela Paz
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual dataJonathan Calero
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual dataPamela Paz
 
Inventario de contenido Diplomado Arquitectura de Información y UX
Inventario de contenido Diplomado Arquitectura de Información y UXInventario de contenido Diplomado Arquitectura de Información y UX
Inventario de contenido Diplomado Arquitectura de Información y UXSady Ignacio Maureria Bulnes
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxJavierNavarrete43
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Ris Fernandez
 

Similar a PROYECTO #3 MINERÍA DE TEXTO (20)

Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Big data
Big dataBig data
Big data
 
Conociendo el bigdata por Camargo y Joyanes
Conociendo el bigdata por Camargo y JoyanesConociendo el bigdata por Camargo y Joyanes
Conociendo el bigdata por Camargo y Joyanes
 
Gestión de datos de investigación (gdi) (1)
Gestión de datos de investigación (gdi) (1)Gestión de datos de investigación (gdi) (1)
Gestión de datos de investigación (gdi) (1)
 
La gestión de datos de investigación en el horizonte de las bibliotecas de i...
La gestión de datos de investigación en el  horizonte de las bibliotecas de i...La gestión de datos de investigación en el  horizonte de las bibliotecas de i...
La gestión de datos de investigación en el horizonte de las bibliotecas de i...
 
Jorge luis rojas barnett
Jorge luis rojas barnett Jorge luis rojas barnett
Jorge luis rojas barnett
 
Ensayo sobre data mining
Ensayo sobre data miningEnsayo sobre data mining
Ensayo sobre data mining
 
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Conociendo big data
Conociendo big dataConociendo big data
Conociendo big data
 
Herramientas de Vigilancia Tecnológica
Herramientas de Vigilancia TecnológicaHerramientas de Vigilancia Tecnológica
Herramientas de Vigilancia Tecnológica
 
Inventario de contenido Diplomado Arquitectura de Información y UX
Inventario de contenido Diplomado Arquitectura de Información y UXInventario de contenido Diplomado Arquitectura de Información y UX
Inventario de contenido Diplomado Arquitectura de Información y UX
 
Que es big data
Que es big dataQue es big data
Que es big data
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion
 

PROYECTO #3 MINERÍA DE TEXTO

  • 1. PROYECTO #3 TEXT MINING INTEGRANTES SILVIA CARVAJAL MENDEZ BERTHY VARGAS VILLARREAL LUIS ENRIQUE CESARY AÑEZ XAVIER MARCELO PANIAGUA ALARCÓN MODULO : FUNDAMENTOS DE MINERIA Y CIENCIAS DE DATOS GRUPO:2 DOCENTE: ING. DAVID E. MENDOZA GUTIERREZ
  • 2. La minería de textos busca extraer información útil e importante de formatos de documentos heterogéneos, tales como páginas web, correos electrónicos, medios sociales, artículos de revistas, etc. ¿Que es la minería de textos?
  • 3. La minería de textos tiene muchas aplicaciones. Por ejemplo, la minería de textos puede ayudar a encontrar tecnologías nuevas e innovadoras dentro de ciertos dominios. Es un método muy eficiente para generar nueva información y conocimiento. ¿Por qué la necesitamos?
  • 4. Estos son algunos ejemplos de uso en diferentes campos: ● Investigación ● Negocios ● Seguridad ● Uso Diario ● Salud ¿Que clase de gente hace minería de textos?
  • 5. Los motores de búsqueda como Google, recuperan todos los documentos que contienen las palabras clave que has especificado, pero no hay valor añadido a los datos. ¿Cual es la diferencia entre minería de texto y google?
  • 6. ● Extracción de términos ● Extraccion de informacion ● Análisis Relacional Técnicas de Text-Mining
  • 7. ¿Estamos recopilando todos nuestros datos? ● Datos estructurados ● Datos no estructurados Fuentes de Text-Mining
  • 8. Estos datos cargados de texto contienen información que ayudan a las empresas a tomar decisiones basadas en datos. Pero, debido a que provienen de humanos en lugar de datos almacenados por campos en bases de datos o etiquetados en documentos, habrá irregularidades en el contenido, ambigüedades debido al idioma, entre otros. ¿Por qué son importantes los datos no estructurados?
  • 9. ● Gestión de contenido ● Búsqueda semántica ● Cumplimiento regulatorio ● Recomendaciones de contenido ¿Cómo utilizan las empresas la minería de textos?
  • 10. ● Costo y Velocidad ● Consistencia ● Escalabilidad ● Simplicidad ● Mejores Ideas Beneficios del Text-Mining
  • 11. ¿Cómo funciona la minería de texto? La extracción de textos puede dividirse en cinco pasos: 1. Recolección 2. Preprocesamiento 3. Limpieza de textos 4. Tokenización 5. Extraccion de caracteristicas
  • 12. Ejemplo de Aplicación de Text Mining Este ejemplo pretende servir de introduccion al analisis de texto(text mining) con Python. Para ello, analizaremos las publicaciones que han hecho en twitter diferentes personalidades con el objetivo de : ● Obtener número de tweets publicados por mes ● Top 10 de palabras por autor ● Top 15 palabras más características de cada autor