SlideShare una empresa de Scribd logo
1 de 12
PROYECTO #3 TEXT MINING
INTEGRANTES
SILVIA
CARVAJAL
MENDEZ
BERTHY VARGAS
VILLARREAL
LUIS ENRIQUE
CESARY AÑEZ
XAVIER MARCELO
PANIAGUA
ALARCÓN
MODULO :
FUNDAMENTOS DE
MINERIA Y CIENCIAS
DE DATOS
GRUPO:2
DOCENTE: ING. DAVID E.
MENDOZA GUTIERREZ
La minería de textos busca extraer información útil e importante
de formatos de documentos heterogéneos, tales como páginas
web, correos electrónicos, medios sociales, artículos de revistas,
etc.
¿Que es la minería de textos?
La minería de textos tiene muchas aplicaciones. Por ejemplo, la
minería de textos puede ayudar a encontrar tecnologías nuevas e
innovadoras dentro de ciertos dominios. Es un método muy
eficiente para generar nueva información y conocimiento.
¿Por qué la necesitamos?
Estos son algunos ejemplos de uso en diferentes campos:
● Investigación
● Negocios
● Seguridad
● Uso Diario
● Salud
¿Que clase de gente hace minería
de textos?
Los motores de búsqueda como Google, recuperan todos los
documentos que contienen las palabras clave que has
especificado, pero no hay valor añadido a los datos.
¿Cual es la diferencia entre minería
de texto y google?
● Extracción de términos
● Extraccion de informacion
● Análisis Relacional
Técnicas de Text-Mining
¿Estamos recopilando todos nuestros datos?
● Datos estructurados
● Datos no estructurados
Fuentes de Text-Mining
Estos datos cargados de texto contienen información que ayudan
a las empresas a tomar decisiones basadas en datos. Pero,
debido a que provienen de humanos en lugar de datos
almacenados por campos en bases de datos o etiquetados en
documentos, habrá irregularidades en el contenido,
ambigüedades debido al idioma, entre otros.
¿Por qué son importantes los datos
no estructurados?
● Gestión de contenido
● Búsqueda semántica
● Cumplimiento regulatorio
● Recomendaciones de contenido
¿Cómo utilizan las empresas la
minería de textos?
● Costo y Velocidad
● Consistencia
● Escalabilidad
● Simplicidad
● Mejores Ideas
Beneficios del Text-Mining
¿Cómo funciona la minería de texto?
La extracción de textos puede dividirse en cinco pasos:
1. Recolección
2. Preprocesamiento
3. Limpieza de textos
4. Tokenización
5. Extraccion de caracteristicas
Ejemplo de Aplicación de Text Mining
Este ejemplo pretende servir de introduccion al analisis de texto(text mining)
con Python. Para ello, analizaremos las publicaciones que han hecho en twitter
diferentes personalidades con el objetivo de :
● Obtener número de tweets publicados por mes
● Top 10 de palabras por autor
● Top 15 palabras más características de cada autor

Más contenido relacionado

La actualidad más candente

La actualidad más candente (11)

Base da datos
Base da datosBase da datos
Base da datos
 
Big data presentacion diapositiva
Big data presentacion diapositivaBig data presentacion diapositiva
Big data presentacion diapositiva
 
Minería de Datos
Minería de DatosMinería de Datos
Minería de Datos
 
Aplicando mineria de datos - Latinoamerica
Aplicando mineria de datos - LatinoamericaAplicando mineria de datos - Latinoamerica
Aplicando mineria de datos - Latinoamerica
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Breve Introducción al Big Data
Breve Introducción al Big DataBreve Introducción al Big Data
Breve Introducción al Big Data
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Información e informática
Información e informáticaInformación e informática
Información e informática
 
Que son el big data la ciencia de datos y el data mining
Que son el big data la ciencia de datos y el data miningQue son el big data la ciencia de datos y el data mining
Que son el big data la ciencia de datos y el data mining
 
Base de datos.docx
Base de datos.docxBase de datos.docx
Base de datos.docx
 
Big data presentación
Big data presentaciónBig data presentación
Big data presentación
 

Similar a Text mining

La gestión de datos de investigación en el horizonte de las bibliotecas de i...
La gestión de datos de investigación en el  horizonte de las bibliotecas de i...La gestión de datos de investigación en el  horizonte de las bibliotecas de i...
La gestión de datos de investigación en el horizonte de las bibliotecas de i...
Julio Alonso Arévalo
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
Pamela Paz
 

Similar a Text mining (20)

Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Big data
Big dataBig data
Big data
 
Conociendo el bigdata por Camargo y Joyanes
Conociendo el bigdata por Camargo y JoyanesConociendo el bigdata por Camargo y Joyanes
Conociendo el bigdata por Camargo y Joyanes
 
Gestión de datos de investigación (gdi) (1)
Gestión de datos de investigación (gdi) (1)Gestión de datos de investigación (gdi) (1)
Gestión de datos de investigación (gdi) (1)
 
La gestión de datos de investigación en el horizonte de las bibliotecas de i...
La gestión de datos de investigación en el  horizonte de las bibliotecas de i...La gestión de datos de investigación en el  horizonte de las bibliotecas de i...
La gestión de datos de investigación en el horizonte de las bibliotecas de i...
 
Jorge luis rojas barnett
Jorge luis rojas barnett Jorge luis rojas barnett
Jorge luis rojas barnett
 
Ensayo sobre data mining
Ensayo sobre data miningEnsayo sobre data mining
Ensayo sobre data mining
 
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Conociendo big data
Conociendo big dataConociendo big data
Conociendo big data
 
Herramientas de Vigilancia Tecnológica
Herramientas de Vigilancia TecnológicaHerramientas de Vigilancia Tecnológica
Herramientas de Vigilancia Tecnológica
 
Inventario de contenido Diplomado Arquitectura de Información y UX
Inventario de contenido Diplomado Arquitectura de Información y UXInventario de contenido Diplomado Arquitectura de Información y UX
Inventario de contenido Diplomado Arquitectura de Información y UX
 
Que es big data
Que es big dataQue es big data
Que es big data
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion
 

Último

Gribbin, John. - Historia de la ciencia, 1543-2001 [EPL-FS] [2019].pdf
Gribbin, John. - Historia de la ciencia, 1543-2001 [EPL-FS] [2019].pdfGribbin, John. - Historia de la ciencia, 1543-2001 [EPL-FS] [2019].pdf
Gribbin, John. - Historia de la ciencia, 1543-2001 [EPL-FS] [2019].pdf
frank0071
 
5.2 DERIVADAS PARCIALES (64RG45G45G45G).pptx
5.2 DERIVADAS PARCIALES (64RG45G45G45G).pptx5.2 DERIVADAS PARCIALES (64RG45G45G45G).pptx
5.2 DERIVADAS PARCIALES (64RG45G45G45G).pptx
llacza2004
 
Terapia Cognitivo Conductual CAPITULO 2.
Terapia Cognitivo Conductual CAPITULO 2.Terapia Cognitivo Conductual CAPITULO 2.
Terapia Cognitivo Conductual CAPITULO 2.
ChiquinquirMilagroTo
 
Althusser, Louis. - Ideología y aparatos ideológicos de Estado [ocr] [2003].pdf
Althusser, Louis. - Ideología y aparatos ideológicos de Estado [ocr] [2003].pdfAlthusser, Louis. - Ideología y aparatos ideológicos de Estado [ocr] [2003].pdf
Althusser, Louis. - Ideología y aparatos ideológicos de Estado [ocr] [2003].pdf
frank0071
 
Hobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdf
Hobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdfHobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdf
Hobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdf
frank0071
 
Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...
Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...
Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...
frank0071
 

Último (20)

SEGUNDAS VANGUARDIAS ARTÍSTICAS DEL SIGLO XX.pdf
SEGUNDAS VANGUARDIAS ARTÍSTICAS DEL SIGLO XX.pdfSEGUNDAS VANGUARDIAS ARTÍSTICAS DEL SIGLO XX.pdf
SEGUNDAS VANGUARDIAS ARTÍSTICAS DEL SIGLO XX.pdf
 
Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)
Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)
Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)
 
Diario experiencias Quehacer Científico y tecnológico vf.docx
Diario experiencias Quehacer Científico y tecnológico vf.docxDiario experiencias Quehacer Científico y tecnológico vf.docx
Diario experiencias Quehacer Científico y tecnológico vf.docx
 
Mapa Conceptual Modelos de Comunicación .pdf
Mapa Conceptual Modelos de Comunicación .pdfMapa Conceptual Modelos de Comunicación .pdf
Mapa Conceptual Modelos de Comunicación .pdf
 
PRUEBA CALIFICADA 4º sec biomoleculas y bioelementos .docx
PRUEBA CALIFICADA 4º sec biomoleculas y bioelementos .docxPRUEBA CALIFICADA 4º sec biomoleculas y bioelementos .docx
PRUEBA CALIFICADA 4º sec biomoleculas y bioelementos .docx
 
2. Hormonas y Ciclo estral de los animales
2. Hormonas y Ciclo estral de los animales2. Hormonas y Ciclo estral de los animales
2. Hormonas y Ciclo estral de los animales
 
Gribbin, John. - Historia de la ciencia, 1543-2001 [EPL-FS] [2019].pdf
Gribbin, John. - Historia de la ciencia, 1543-2001 [EPL-FS] [2019].pdfGribbin, John. - Historia de la ciencia, 1543-2001 [EPL-FS] [2019].pdf
Gribbin, John. - Historia de la ciencia, 1543-2001 [EPL-FS] [2019].pdf
 
Pelos y fibras. Criminalistica pelos y fibras
Pelos y fibras. Criminalistica pelos y fibrasPelos y fibras. Criminalistica pelos y fibras
Pelos y fibras. Criminalistica pelos y fibras
 
5.2 DERIVADAS PARCIALES (64RG45G45G45G).pptx
5.2 DERIVADAS PARCIALES (64RG45G45G45G).pptx5.2 DERIVADAS PARCIALES (64RG45G45G45G).pptx
5.2 DERIVADAS PARCIALES (64RG45G45G45G).pptx
 
Glaeser, E. - El triunfo de las ciudades [2011].pdf
Glaeser, E. - El triunfo de las ciudades [2011].pdfGlaeser, E. - El triunfo de las ciudades [2011].pdf
Glaeser, E. - El triunfo de las ciudades [2011].pdf
 
Matemáticas Aplicadas usando Python
Matemáticas Aplicadas   usando    PythonMatemáticas Aplicadas   usando    Python
Matemáticas Aplicadas usando Python
 
La biodiversidad de Guanajuato (resumen)
La biodiversidad de Guanajuato (resumen)La biodiversidad de Guanajuato (resumen)
La biodiversidad de Guanajuato (resumen)
 
el amor en los tiempos del colera (resumen).pptx
el amor en los tiempos del colera (resumen).pptxel amor en los tiempos del colera (resumen).pptx
el amor en los tiempos del colera (resumen).pptx
 
1890 –7 de junio - Henry Marmaduke Harris obtuvo una patente británica (Nº 88...
1890 –7 de junio - Henry Marmaduke Harris obtuvo una patente británica (Nº 88...1890 –7 de junio - Henry Marmaduke Harris obtuvo una patente británica (Nº 88...
1890 –7 de junio - Henry Marmaduke Harris obtuvo una patente británica (Nº 88...
 
Terapia Cognitivo Conductual CAPITULO 2.
Terapia Cognitivo Conductual CAPITULO 2.Terapia Cognitivo Conductual CAPITULO 2.
Terapia Cognitivo Conductual CAPITULO 2.
 
Althusser, Louis. - Ideología y aparatos ideológicos de Estado [ocr] [2003].pdf
Althusser, Louis. - Ideología y aparatos ideológicos de Estado [ocr] [2003].pdfAlthusser, Louis. - Ideología y aparatos ideológicos de Estado [ocr] [2003].pdf
Althusser, Louis. - Ideología y aparatos ideológicos de Estado [ocr] [2003].pdf
 
CASO CLÍNICO INFECCIONES Y TUMORES.pptx
CASO CLÍNICO INFECCIONES Y TUMORES.pptxCASO CLÍNICO INFECCIONES Y TUMORES.pptx
CASO CLÍNICO INFECCIONES Y TUMORES.pptx
 
medicinatradicionalescuelanacionaldesalud.pptx
medicinatradicionalescuelanacionaldesalud.pptxmedicinatradicionalescuelanacionaldesalud.pptx
medicinatradicionalescuelanacionaldesalud.pptx
 
Hobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdf
Hobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdfHobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdf
Hobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdf
 
Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...
Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...
Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...
 

Text mining

  • 1. PROYECTO #3 TEXT MINING INTEGRANTES SILVIA CARVAJAL MENDEZ BERTHY VARGAS VILLARREAL LUIS ENRIQUE CESARY AÑEZ XAVIER MARCELO PANIAGUA ALARCÓN MODULO : FUNDAMENTOS DE MINERIA Y CIENCIAS DE DATOS GRUPO:2 DOCENTE: ING. DAVID E. MENDOZA GUTIERREZ
  • 2. La minería de textos busca extraer información útil e importante de formatos de documentos heterogéneos, tales como páginas web, correos electrónicos, medios sociales, artículos de revistas, etc. ¿Que es la minería de textos?
  • 3. La minería de textos tiene muchas aplicaciones. Por ejemplo, la minería de textos puede ayudar a encontrar tecnologías nuevas e innovadoras dentro de ciertos dominios. Es un método muy eficiente para generar nueva información y conocimiento. ¿Por qué la necesitamos?
  • 4. Estos son algunos ejemplos de uso en diferentes campos: ● Investigación ● Negocios ● Seguridad ● Uso Diario ● Salud ¿Que clase de gente hace minería de textos?
  • 5. Los motores de búsqueda como Google, recuperan todos los documentos que contienen las palabras clave que has especificado, pero no hay valor añadido a los datos. ¿Cual es la diferencia entre minería de texto y google?
  • 6. ● Extracción de términos ● Extraccion de informacion ● Análisis Relacional Técnicas de Text-Mining
  • 7. ¿Estamos recopilando todos nuestros datos? ● Datos estructurados ● Datos no estructurados Fuentes de Text-Mining
  • 8. Estos datos cargados de texto contienen información que ayudan a las empresas a tomar decisiones basadas en datos. Pero, debido a que provienen de humanos en lugar de datos almacenados por campos en bases de datos o etiquetados en documentos, habrá irregularidades en el contenido, ambigüedades debido al idioma, entre otros. ¿Por qué son importantes los datos no estructurados?
  • 9. ● Gestión de contenido ● Búsqueda semántica ● Cumplimiento regulatorio ● Recomendaciones de contenido ¿Cómo utilizan las empresas la minería de textos?
  • 10. ● Costo y Velocidad ● Consistencia ● Escalabilidad ● Simplicidad ● Mejores Ideas Beneficios del Text-Mining
  • 11. ¿Cómo funciona la minería de texto? La extracción de textos puede dividirse en cinco pasos: 1. Recolección 2. Preprocesamiento 3. Limpieza de textos 4. Tokenización 5. Extraccion de caracteristicas
  • 12. Ejemplo de Aplicación de Text Mining Este ejemplo pretende servir de introduccion al analisis de texto(text mining) con Python. Para ello, analizaremos las publicaciones que han hecho en twitter diferentes personalidades con el objetivo de : ● Obtener número de tweets publicados por mes ● Top 10 de palabras por autor ● Top 15 palabras más características de cada autor