SlideShare una empresa de Scribd logo
MINIG TEXT AND AUDIOVISUAL DATA SISTEMAS INFORMÁTICOS Y COMPUTACIÓN  REALIZACIÓN: Irina Anabel Veintimilla Toro,iaveintimilla@utpl.edu.ec Ana Karolis Paz Alberca, akpaz@utpl.edu.ec JonathanGandin Calero Armijos, jgcalero@utpl.edu.ec
INTRODUCCIÓN La información esta representada en lenguaje natural. La búsqueda de información depende del contexto de la misma para extraer el conocimiento de los distintos repositorios.  Para la extracción de información nos valemos de la minería de texto. La minería de texto es el descubrimiento de patrones y nuevos conocimientos en un conjunto de textos.
La ciencia encargada del tratamiento de la información mediante la minería de texto (textmining) es la lingüística computacional. La lingüística computacional trata de la aplicación de los métodos computacionales en el estudio del lenguaje natural, investiga métodos computacionales para la manipulación de sistemas complejos. El objetivo primordial es transformar la información en lenguaje natural a una representación formal del conocimiento, como por ejemplo una red semántica.
Tradicionalmente la solución para resolver éste tipo de problemas, es mediante un procesador lingüístico  que consta de los módulos:  El módulo morfológico, se encarga de reconocer las palabras. Y convierte las cadenas de letras a una entrada de un diccionario, y ubica las marcas de tiempo, género y número.   El módulo sintáctico reconoce oraciones, convierte las cadenas de palabras marcadas a una estructura gráfica, en donde se hacen explicitas algunas relaciones entre las palabras de la oración.  El módulo semántico reconoce la estructura completa del texto y lo convierte a una “red semántica”.  
La lingüística computacional también se encargada del procesamiento automático de textos, que considera diversidad de tareas y dentro de éstas la minería de texto, que es el objeto a tratar en ésta investigación.  La minería de datos incluye tecnología de base de datos, aprendizaje de máquinas, estadísticas, reconocimiento de patrones, inteligencia artificial, visualización de datos.
MINERÍA DE DATOS Minería de datos, se refiere a la extracción de conocimientos de grandes  cantidades de datos que son parte de repositorios de información. Conocida también como KnowledgeDiscoveryfrom Data, o KDD. La minería de datos envuelve una integración de técnicas como tecnologías de BD y warehouses, estadísticas, aprendizaje de máquinas, reconocimiento de patrones, análisis espacial y temporal de datos.
Descubrimiento de conocimiento consiste: Limpieza de datos. Integración de datos. Selección de datos. Transformación de datos. Minerías de datos Evaluación de patrones. Presentación del conocimiento.
Tipo de datos donde realizar minería de datos La minería de datos se aplica a cualquier repositorio de datos, estos repositorios incluyen BD relacionales, data warehouses, BD transaccionales, sistemas avanzados de BD, archivos planos, data streams, y el WWW.  Los sistemas avanzados de bases de datos incluyen BD de objetos relacionados y especificas, BD orientadas a aplicaciones,  BD espaciales, BD textuales.  Los desafíos y técnicas de minería pueden diferir para cada uno de los sistemas repositorios.
MINERÍA DE TEXTO La minería de texto, se basa en documentos de texto no estructurados, los cuales son la base para el descubrimiento de nueva información. Para realizar minería de texto se debe realizar las siguientes actividades:  Agrupamiento de documentos.  Identificación de categorías.  Categorización. Clasificación. Asociaciones.
La minería de texto realiza el descubrimiento de conocimientos que no existían explícitamente en ningún texto de la colección, pero que surgen de relacionar el contenido de varios de ellos. Consiste de dos etapas: 					Primera etapa, los textos se transforman tipo de representación estructurada o semi-estructurada; la segunda etapa las representaciones intermedias se analizan para descubrir en ellas algunos patrones interesantes o nuevos conocimientos.
Pre procesamiento En ésta etapa de procesamiento las técnicas utilizadas intentan transformar a una representación semiestructurada o estructurada los documentos de datos textuales en crudo. Las representaciones intermedias de los textos deben ser sencillasycompletas.  Existen representaciones que son utilizadas en ésta etapa de la minería de texto , que son de dos tipos:  A nivel documento y a nivel de concepto.  A nivel concepto.
APLICACIONES  Las prácticas de minería de datos se utilizan en diversas industrias y funciones de negocios: Empresas de telecomunicaciones.  La industria del comercio.  La industria de la medicina. Bancos e Instituciones Financieras.
REDES NEURONALES EN LA MINERIA DE DATOS  Las Redes Neuronales (Neural Networks) son utilizadas para la predicción, la minería de datos (data mining), el reconocimiento de patrones y los sistemas de control adaptativo. Constituyen una parte muy importante en el estudio y desarrollo de la inteligencia artificial (AI) y el de la vida artificial (a-life). Las Redes Neuronales pueden ser combinadas con otras herramientas  como la lógica difusa (lógica fuzzy), los algoritmos genéticos, los sistemas expertos, las estadísticas, las transformadas de Fourier, etc.
TÉCNICAS BASADAS EN REDES NEURONALES ARTIFICIALES Su ventaja principal es que, cuando están bien ajustadas, obtienen precisiones muy altas. Además son muy expresivas y permiten capturar modelos no lineales.  Entre sus inconvenientes se suelen nombrar su sensibilidad a valores anómalos (aunque son robustos al ruido no extremo y a los atributos no significativos), necesitan muchos ejemplos para el aprendizaje y son relativamente lentas y fundamentalmente, su incomprensibilidad.  Son técnicas muy eficientes que permiten trabajar con datos con alta dimensionalidad y precisión.
APLICACIONES DE LAS REDES NEURONALES EN LA MINERÍA DE DATOS Minería de Datos con Redes Neuronales Artificiales: Aplicación en Vacunas – Tuberculosis. 	La Minería de Datos se apoya en la aplicación de métodos matemáticos de análisis, y específicamente del uso redes neuronales artificiales. 	Esta revolución de la Tecnología de la Información coincide con la revolución que paralelamente está teniendo lugar en la Biotecnología, debido a un mundo de avances tecnológicos que han permitido la obtención y acumulación automática de inmensas cantidades de información biológica. 	Del encuentro de estas dos revoluciones nace la Bioinformática como una multidisciplina estratégica que pone al servicio de la Biotecnología los recursos de la nuevas Tecnologías de la Información.
Aplicación de redes neuronales artificiales para determinar la distribución Espacial de la humedad del suelo en una pequeña cuenca de drenaje.  Este estudio trata de demostrar que es posible realizar una predicción razonable de la distribución espacial de la humedad edáfica superficial, estudiar sus patrones espaciales y contrastar la importancia de cada variable a partir de un número limitado de mediciones mediante el uso de redes neuronales artificiales multicapa de tipo feedforward con aprendizaje mediante mecanismos de retro propagación del error utilizando principalmente variables derivadas de un modelo digital de elevaciones (MDE) y de fotografía aérea.
CONCLUSIONES  La minería de datos (DM, Data Mining) nos ayuda a preparar, y explorar los datos para sacar la información oculta en ellos. Está fuertemente ligado con la supervisión de procesos industriales ya que resulta muy útil para aprovechar los datos almacenados en las bases de datos. Al momento de utilizar técnicas de minería de datos se aborda la solución a problemas de predicción, clasificación y segmentación.
Las redes neuronales artificiales han sido claramente aceptadas en la minería de datos como nuevos sistemas eficaces para el tratamiento de la información en muchas disciplinas. Pues esto ha dado como resultado sus diferentes aplicaciones en áreas de Ciencia e Ingeniería, Medicina y Salud, Transporte y Comunicaciones, Finanzas, Negocios, etc. Las redes neuronales artificiales se hacen muy evidentes en la minería de datos, específicamente las basadas en el modelo Kohonen,  ya que pueden ser aplicadas como una herramienta de análisis.
RECOMENDACIONES  Hacer uso de aplicaciones que permitan mejorar el proceso de formación académica de los estudiantes. Fomentar el desarrollo de proyectos de descubrimiento de Conocimiento en BD en la Universidad. Las redes neuronales no constituyen una área nueva de conocimiento, pero actualmente no se le está prestando la suficiente atención es por esto que se recomendaría que se tome en cuenta las ventajas que presentan sobre otras técnicas en la minería de datos para resolver los diferentes problemas. Una recomendación importante de las redes neuronales es que con el estudio de ellas, después su empleo es relativamente fácil y adaptable a diferentes series.
APORTE PERSONAL  En el desarrollo de la presente temática  que hemos escogido nos hemos podido dar cuenta ya que debido a la abundancia de información de texto, la recuperación de información ha encontrado algunas aplicaciones. Por lo cual existen algunos sistemas de recuperación de formación, como sistemas de catálogos de bibliotecas en línea, sistemas de gestión de documentos y los desarrollados más recientemente motores de búsqueda Web. Es de gran importancia la minería de Datos ya que es una de las ramas de la lingüística computacional que trata de obtener información y conocimiento a partir de conjuntos de datos que en principio no tienen un orden o no están dispuestos en origen para transmitir esa información. Estas redes poseen dos tipos de aprendizaje tales como aprendizaje supervisado y no supervisado. Como en toda aplicación existen ventajas y desventajas al utilizar este método, algunas de la ventajas son: aprendizaje adaptativo: auto organización: tolerancia a fallos: operación en tiempo real. Una de las desventajas es que las redes neuronales padecen de falta de hardware, debido a que su habilidad radica en procesar información en paralelo.
BIBLIOGRAFÍA Y REFERENCIAS  Montes Manuel -y- Gómez.- Minería de texto: Un nuevo reto computacional.  Carmen Gálvez, PhD.- TEXT-MINING: THE NEW GENERATION OF SCIENTIFIC LITERATURE ANALYSIS IN MOLECULAR BIOLOGY AND GENOMICS  Machine Learning: An Artificial Intelligence Approach Vol I-IV [Michalski and Teccuci, 1994]. M. Montes-y-Gómez y A. Gelbukh.- Un método de agrupamiento de grafos conceptuales para minería de texto*. Hernandezjosé, Ramírez MaJose, Ferri cesar.- Introducción a la minería de datos. Redes Neuronales (Neurales). (Neural Networks), disponible enhttp://www.answermath.com/redes_neuronales_o_neurales.htm Aplicación de la minería de datos al estudio de las alteraciones respiratorias durante el sueño, Carlos Zamarrón Sanz, Vanesa García Paz, Uxío Calvo Álvarez, Fernanda Pichel Guerrero, José Ramón Rodríguez, Pdf disponible en http://www.sogapar.org/pneuma/pneuma6/pneuma-n-6-5c.pdf Minería de datos con redes neuronales artificiales: aplicación en Vacunas – tuberculosis,  M.v. Guzmán, h. Carrillo , e. Villaseñor , e. Valencia, r. Calero, L. E. Morán  y a. Acosta,Pdf disponible en: http://www.dynamics.unam.edu/DinamicaNoLineal/Articulos/MineriaRedesNVacunas.pdf Aplicación de redes neuronales artificiales para determinar la distribución Espacial de la humedad del suelo en una pequeña cuenca de drenaje. Estudios Preliminares, M. Maneta y S. Schnabel, Pdf disponible en:  http://www.zonanosaturada.com/publics/V6/p295-304.pdf

Más contenido relacionado

La actualidad más candente

Herramientas de mineria_de_datos
Herramientas de mineria_de_datosHerramientas de mineria_de_datos
Herramientas de mineria_de_datos
travon1
 
Teoría de la Información
Teoría de la InformaciónTeoría de la Información
Teoría de la Información
Nicolás Giacaman
 
Presentacion del blog
Presentacion del blogPresentacion del blog
Presentacion del blog
juananzolamaldonado
 
Lectura ia rna y aplicaciones 2 as_06mem
Lectura ia rna y aplicaciones 2 as_06memLectura ia rna y aplicaciones 2 as_06mem
Lectura ia rna y aplicaciones 2 as_06memjcbp_peru
 
Agrupamiento de datos de series de tiempo. Estado del arte
Agrupamiento de datos de series de tiempo. Estado del arteAgrupamiento de datos de series de tiempo. Estado del arte
Agrupamiento de datos de series de tiempo. Estado del arte
travon1
 
Comunicacion cientifica
Comunicacion cientifica Comunicacion cientifica
Comunicacion cientifica
Paola Ramos Siwon
 
Teoria de la Informacion - Fuentes de Informacion
Teoria de la Informacion - Fuentes de InformacionTeoria de la Informacion - Fuentes de Informacion
Teoria de la Informacion - Fuentes de Informacion
Alejandro Rodriguez
 
Herramientas exposicion
Herramientas exposicionHerramientas exposicion
Herramientas exposicion
LuisEduardo334
 
Teoría de la información
Teoría de la informaciónTeoría de la información
Teoría de la información
oscar Guaita
 
Articulo ICIEI
Articulo ICIEIArticulo ICIEI
Articulo ICIEI
Jean Sanchez
 
Machine learning
Machine learningMachine learning
Machine learning
Enmer Genaro Leandro Ricra
 
Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
Armando Romani
 
2. del dato individual a la informaciòn electrónica estructurada
2. del dato individual a la informaciòn electrónica estructurada2. del dato individual a la informaciòn electrónica estructurada
2. del dato individual a la informaciòn electrónica estructurada
Cipriano Segura sierra
 

La actualidad más candente (14)

Maestría
MaestríaMaestría
Maestría
 
Herramientas de mineria_de_datos
Herramientas de mineria_de_datosHerramientas de mineria_de_datos
Herramientas de mineria_de_datos
 
Teoría de la Información
Teoría de la InformaciónTeoría de la Información
Teoría de la Información
 
Presentacion del blog
Presentacion del blogPresentacion del blog
Presentacion del blog
 
Lectura ia rna y aplicaciones 2 as_06mem
Lectura ia rna y aplicaciones 2 as_06memLectura ia rna y aplicaciones 2 as_06mem
Lectura ia rna y aplicaciones 2 as_06mem
 
Agrupamiento de datos de series de tiempo. Estado del arte
Agrupamiento de datos de series de tiempo. Estado del arteAgrupamiento de datos de series de tiempo. Estado del arte
Agrupamiento de datos de series de tiempo. Estado del arte
 
Comunicacion cientifica
Comunicacion cientifica Comunicacion cientifica
Comunicacion cientifica
 
Teoria de la Informacion - Fuentes de Informacion
Teoria de la Informacion - Fuentes de InformacionTeoria de la Informacion - Fuentes de Informacion
Teoria de la Informacion - Fuentes de Informacion
 
Herramientas exposicion
Herramientas exposicionHerramientas exposicion
Herramientas exposicion
 
Teoría de la información
Teoría de la informaciónTeoría de la información
Teoría de la información
 
Articulo ICIEI
Articulo ICIEIArticulo ICIEI
Articulo ICIEI
 
Machine learning
Machine learningMachine learning
Machine learning
 
Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
 
2. del dato individual a la informaciòn electrónica estructurada
2. del dato individual a la informaciòn electrónica estructurada2. del dato individual a la informaciòn electrónica estructurada
2. del dato individual a la informaciòn electrónica estructurada
 

Destacado

Malcolm Dare Fashion
Malcolm Dare FashionMalcolm Dare Fashion
Malcolm Dare Fashionkeriknight
 
Portifólio Alex Jason
Portifólio Alex JasonPortifólio Alex Jason
Portifólio Alex Jason
Stomp! Branding e Comunicação
 
The royal family
The royal familyThe royal family
The royal familyMaarit R
 
Green Infrastructure
Green InfrastructureGreen Infrastructure
Green Infrastructure
msoden
 
Serengeti in africa 大地上的產床
Serengeti in africa 大地上的產床Serengeti in africa 大地上的產床
Serengeti in africa 大地上的產床freemanh
 
Liv's millionare game
Liv's millionare gameLiv's millionare game
Liv's millionare gameL1Y
 

Destacado (9)

Malcolm Dare Fashion
Malcolm Dare FashionMalcolm Dare Fashion
Malcolm Dare Fashion
 
Portifólio Alex Jason
Portifólio Alex JasonPortifólio Alex Jason
Portifólio Alex Jason
 
The royal family
The royal familyThe royal family
The royal family
 
Congruent tri
Congruent triCongruent tri
Congruent tri
 
Green Infrastructure
Green InfrastructureGreen Infrastructure
Green Infrastructure
 
Serengeti in africa 大地上的產床
Serengeti in africa 大地上的產床Serengeti in africa 大地上的產床
Serengeti in africa 大地上的產床
 
Scheda tecnica Crossline
Scheda tecnica CrosslineScheda tecnica Crossline
Scheda tecnica Crossline
 
72 会話幇助
72 会話幇助72 会話幇助
72 会話幇助
 
Liv's millionare game
Liv's millionare gameLiv's millionare game
Liv's millionare game
 

Similar a Minig text and audiovisual data

Monografia Data Mining
Monografia Data Mining   Monografia Data Mining
Monografia Data Mining
PabloMolina111
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Anyeni Garay
 
Dialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdf
Dialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdfDialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdf
Dialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdf
Jairo Almeida
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
María Inés Cahuana Lázaro
 
Text mining para historiadores de arte
Text mining para historiadores de arteText mining para historiadores de arte
Text mining para historiadores de artePepe
 
BIG DATA (MACRODATOS).pdf
BIG DATA (MACRODATOS).pdfBIG DATA (MACRODATOS).pdf
BIG DATA (MACRODATOS).pdf
ssuser88a1941
 
Mining data, big data, cloud computing
Mining data, big data, cloud computingMining data, big data, cloud computing
Mining data, big data, cloud computingintex
 
Unidad 4 clas int datos.pptx
Unidad 4 clas int datos.pptxUnidad 4 clas int datos.pptx
Unidad 4 clas int datos.pptx
fernandalemus15
 
Identificación y caracterización de productos de análisis de información.
Identificación y caracterización de productos de análisis de información.Identificación y caracterización de productos de análisis de información.
Identificación y caracterización de productos de análisis de información.
Universidad de Guadalajara
 
Electiva2
Electiva2 Electiva2
Electiva2
Brayan Diaz
 
Bibliominería: bibliometría y minería de datos
Bibliominería: bibliometría y minería de datosBibliominería: bibliometría y minería de datos
Bibliominería: bibliometría y minería de datosUniversidad de Belgrano
 
Técnicas mineria de datos
Técnicas mineria de datosTécnicas mineria de datos
Técnicas mineria de datos
lalopg
 
3m 8ago11E-investigación bibliográfica: Web 2.0 y 3.0, teoría y práctica
3m 8ago11E-investigación  bibliográfica:  Web 2.0 y 3.0, teoría y  práctica3m 8ago11E-investigación  bibliográfica:  Web 2.0 y 3.0, teoría y  práctica
3m 8ago11E-investigación bibliográfica: Web 2.0 y 3.0, teoría y práctica
E-investigación bibliográfica, FCUNAM
 
2024-T19-Redes_Neuronales_II.pdf
2024-T19-Redes_Neuronales_II.pdf2024-T19-Redes_Neuronales_II.pdf
2024-T19-Redes_Neuronales_II.pdf
Ricardo Lopez-Ruiz
 
Ensayo cientifico
Ensayo cientificoEnsayo cientifico
Ensayo cientifico
SalvadorXool
 

Similar a Minig text and audiovisual data (20)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Monografia Data Mining
Monografia Data Mining   Monografia Data Mining
Monografia Data Mining
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Dialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdf
Dialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdfDialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdf
Dialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdf
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Text mining para historiadores de arte
Text mining para historiadores de arteText mining para historiadores de arte
Text mining para historiadores de arte
 
BIG DATA (MACRODATOS).pdf
BIG DATA (MACRODATOS).pdfBIG DATA (MACRODATOS).pdf
BIG DATA (MACRODATOS).pdf
 
Mining data, big data, cloud computing
Mining data, big data, cloud computingMining data, big data, cloud computing
Mining data, big data, cloud computing
 
Unidad 4 clas int datos.pptx
Unidad 4 clas int datos.pptxUnidad 4 clas int datos.pptx
Unidad 4 clas int datos.pptx
 
J15 45 peset_fernanda
J15 45 peset_fernandaJ15 45 peset_fernanda
J15 45 peset_fernanda
 
Identificación y caracterización de productos de análisis de información.
Identificación y caracterización de productos de análisis de información.Identificación y caracterización de productos de análisis de información.
Identificación y caracterización de productos de análisis de información.
 
Electiva2
Electiva2 Electiva2
Electiva2
 
Bibliominería: bibliometría y minería de datos
Bibliominería: bibliometría y minería de datosBibliominería: bibliometría y minería de datos
Bibliominería: bibliometría y minería de datos
 
Técnicas mineria de datos
Técnicas mineria de datosTécnicas mineria de datos
Técnicas mineria de datos
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
3m 8ago11E-investigación bibliográfica: Web 2.0 y 3.0, teoría y práctica
3m 8ago11E-investigación  bibliográfica:  Web 2.0 y 3.0, teoría y  práctica3m 8ago11E-investigación  bibliográfica:  Web 2.0 y 3.0, teoría y  práctica
3m 8ago11E-investigación bibliográfica: Web 2.0 y 3.0, teoría y práctica
 
2024-T19-Redes_Neuronales_II.pdf
2024-T19-Redes_Neuronales_II.pdf2024-T19-Redes_Neuronales_II.pdf
2024-T19-Redes_Neuronales_II.pdf
 
Ensayo cientifico
Ensayo cientificoEnsayo cientifico
Ensayo cientifico
 

Más de Pamela Paz

Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
Pamela Paz
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
Pamela Paz
 
Open Innovation
Open InnovationOpen Innovation
Open InnovationPamela Paz
 
Open Innovation
Open InnovationOpen Innovation
Open InnovationPamela Paz
 

Más de Pamela Paz (7)

Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Pipeline
PipelinePipeline
Pipeline
 
No Puedo
No PuedoNo Puedo
No Puedo
 
No Puedo
No PuedoNo Puedo
No Puedo
 
Open Innovation
Open InnovationOpen Innovation
Open Innovation
 
Open Innovation
Open InnovationOpen Innovation
Open Innovation
 

Último

Semana 10-TSM-del 27 al 31 de mayo 2024.pptx
Semana 10-TSM-del 27 al 31 de mayo 2024.pptxSemana 10-TSM-del 27 al 31 de mayo 2024.pptx
Semana 10-TSM-del 27 al 31 de mayo 2024.pptx
LorenaCovarrubias12
 
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
auxsoporte
 
Sesión: El fundamento del gobierno de Dios.pdf
Sesión: El fundamento del gobierno de Dios.pdfSesión: El fundamento del gobierno de Dios.pdf
Sesión: El fundamento del gobierno de Dios.pdf
https://gramadal.wordpress.com/
 
Fase 3; Estudio de la Geometría Analítica
Fase 3; Estudio de la Geometría AnalíticaFase 3; Estudio de la Geometría Analítica
Fase 3; Estudio de la Geometría Analítica
YasneidyGonzalez
 
Horarios Exámenes EVAU Ordinaria 2024 de Madrid
Horarios Exámenes EVAU Ordinaria 2024 de MadridHorarios Exámenes EVAU Ordinaria 2024 de Madrid
Horarios Exámenes EVAU Ordinaria 2024 de Madrid
20minutos
 
Un libro sin recetas, para la maestra y el maestro Fase 3.pdf
Un libro sin recetas, para la maestra y el maestro Fase 3.pdfUn libro sin recetas, para la maestra y el maestro Fase 3.pdf
Un libro sin recetas, para la maestra y el maestro Fase 3.pdf
sandradianelly
 
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptxAutomatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
GallardoJahse
 
PRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNET
PRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNETPRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNET
PRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNET
CESAR MIJAEL ESPINOZA SALAZAR
 
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdfFORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
El Fortí
 
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
HuallpaSamaniegoSeba
 
Portafolio de servicios Centro de Educación Continua EPN
Portafolio de servicios Centro de Educación Continua EPNPortafolio de servicios Centro de Educación Continua EPN
Portafolio de servicios Centro de Educación Continua EPN
jmorales40
 
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
Monseespinoza6
 
Libro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdfLibro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdf
danitarb
 
Fase 1, Lenguaje algebraico y pensamiento funcional
Fase 1, Lenguaje algebraico y pensamiento funcionalFase 1, Lenguaje algebraico y pensamiento funcional
Fase 1, Lenguaje algebraico y pensamiento funcional
YasneidyGonzalez
 
1º GRADO CONCLUSIONES DESCRIPTIVAS PRIMARIA.docx
1º GRADO CONCLUSIONES DESCRIPTIVAS  PRIMARIA.docx1º GRADO CONCLUSIONES DESCRIPTIVAS  PRIMARIA.docx
1º GRADO CONCLUSIONES DESCRIPTIVAS PRIMARIA.docx
FelixCamachoGuzman
 
Conocemos la ermita de Ntra. Sra. del Arrabal
Conocemos la ermita de Ntra. Sra. del ArrabalConocemos la ermita de Ntra. Sra. del Arrabal
Conocemos la ermita de Ntra. Sra. del Arrabal
Profes de Relideleón Apellidos
 
CONCLUSIONES-DESCRIPTIVAS NIVEL PRIMARIA
CONCLUSIONES-DESCRIPTIVAS NIVEL PRIMARIACONCLUSIONES-DESCRIPTIVAS NIVEL PRIMARIA
CONCLUSIONES-DESCRIPTIVAS NIVEL PRIMARIA
BetzabePecheSalcedo1
 
Mapa_Conceptual de los fundamentos de la evaluación educativa
Mapa_Conceptual de los fundamentos de la evaluación educativaMapa_Conceptual de los fundamentos de la evaluación educativa
Mapa_Conceptual de los fundamentos de la evaluación educativa
TatianaVanessaAltami
 
Asistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdf
Asistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdfAsistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdf
Asistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdf
Demetrio Ccesa Rayme
 
PPT: El fundamento del gobierno de Dios.
PPT: El fundamento del gobierno de Dios.PPT: El fundamento del gobierno de Dios.
PPT: El fundamento del gobierno de Dios.
https://gramadal.wordpress.com/
 

Último (20)

Semana 10-TSM-del 27 al 31 de mayo 2024.pptx
Semana 10-TSM-del 27 al 31 de mayo 2024.pptxSemana 10-TSM-del 27 al 31 de mayo 2024.pptx
Semana 10-TSM-del 27 al 31 de mayo 2024.pptx
 
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
 
Sesión: El fundamento del gobierno de Dios.pdf
Sesión: El fundamento del gobierno de Dios.pdfSesión: El fundamento del gobierno de Dios.pdf
Sesión: El fundamento del gobierno de Dios.pdf
 
Fase 3; Estudio de la Geometría Analítica
Fase 3; Estudio de la Geometría AnalíticaFase 3; Estudio de la Geometría Analítica
Fase 3; Estudio de la Geometría Analítica
 
Horarios Exámenes EVAU Ordinaria 2024 de Madrid
Horarios Exámenes EVAU Ordinaria 2024 de MadridHorarios Exámenes EVAU Ordinaria 2024 de Madrid
Horarios Exámenes EVAU Ordinaria 2024 de Madrid
 
Un libro sin recetas, para la maestra y el maestro Fase 3.pdf
Un libro sin recetas, para la maestra y el maestro Fase 3.pdfUn libro sin recetas, para la maestra y el maestro Fase 3.pdf
Un libro sin recetas, para la maestra y el maestro Fase 3.pdf
 
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptxAutomatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
 
PRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNET
PRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNETPRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNET
PRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNET
 
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdfFORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
 
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
 
Portafolio de servicios Centro de Educación Continua EPN
Portafolio de servicios Centro de Educación Continua EPNPortafolio de servicios Centro de Educación Continua EPN
Portafolio de servicios Centro de Educación Continua EPN
 
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
 
Libro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdfLibro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdf
 
Fase 1, Lenguaje algebraico y pensamiento funcional
Fase 1, Lenguaje algebraico y pensamiento funcionalFase 1, Lenguaje algebraico y pensamiento funcional
Fase 1, Lenguaje algebraico y pensamiento funcional
 
1º GRADO CONCLUSIONES DESCRIPTIVAS PRIMARIA.docx
1º GRADO CONCLUSIONES DESCRIPTIVAS  PRIMARIA.docx1º GRADO CONCLUSIONES DESCRIPTIVAS  PRIMARIA.docx
1º GRADO CONCLUSIONES DESCRIPTIVAS PRIMARIA.docx
 
Conocemos la ermita de Ntra. Sra. del Arrabal
Conocemos la ermita de Ntra. Sra. del ArrabalConocemos la ermita de Ntra. Sra. del Arrabal
Conocemos la ermita de Ntra. Sra. del Arrabal
 
CONCLUSIONES-DESCRIPTIVAS NIVEL PRIMARIA
CONCLUSIONES-DESCRIPTIVAS NIVEL PRIMARIACONCLUSIONES-DESCRIPTIVAS NIVEL PRIMARIA
CONCLUSIONES-DESCRIPTIVAS NIVEL PRIMARIA
 
Mapa_Conceptual de los fundamentos de la evaluación educativa
Mapa_Conceptual de los fundamentos de la evaluación educativaMapa_Conceptual de los fundamentos de la evaluación educativa
Mapa_Conceptual de los fundamentos de la evaluación educativa
 
Asistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdf
Asistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdfAsistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdf
Asistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdf
 
PPT: El fundamento del gobierno de Dios.
PPT: El fundamento del gobierno de Dios.PPT: El fundamento del gobierno de Dios.
PPT: El fundamento del gobierno de Dios.
 

Minig text and audiovisual data

  • 1. MINIG TEXT AND AUDIOVISUAL DATA SISTEMAS INFORMÁTICOS Y COMPUTACIÓN REALIZACIÓN: Irina Anabel Veintimilla Toro,iaveintimilla@utpl.edu.ec Ana Karolis Paz Alberca, akpaz@utpl.edu.ec JonathanGandin Calero Armijos, jgcalero@utpl.edu.ec
  • 2. INTRODUCCIÓN La información esta representada en lenguaje natural. La búsqueda de información depende del contexto de la misma para extraer el conocimiento de los distintos repositorios. Para la extracción de información nos valemos de la minería de texto. La minería de texto es el descubrimiento de patrones y nuevos conocimientos en un conjunto de textos.
  • 3. La ciencia encargada del tratamiento de la información mediante la minería de texto (textmining) es la lingüística computacional. La lingüística computacional trata de la aplicación de los métodos computacionales en el estudio del lenguaje natural, investiga métodos computacionales para la manipulación de sistemas complejos. El objetivo primordial es transformar la información en lenguaje natural a una representación formal del conocimiento, como por ejemplo una red semántica.
  • 4. Tradicionalmente la solución para resolver éste tipo de problemas, es mediante un procesador lingüístico que consta de los módulos: El módulo morfológico, se encarga de reconocer las palabras. Y convierte las cadenas de letras a una entrada de un diccionario, y ubica las marcas de tiempo, género y número.   El módulo sintáctico reconoce oraciones, convierte las cadenas de palabras marcadas a una estructura gráfica, en donde se hacen explicitas algunas relaciones entre las palabras de la oración. El módulo semántico reconoce la estructura completa del texto y lo convierte a una “red semántica”.  
  • 5. La lingüística computacional también se encargada del procesamiento automático de textos, que considera diversidad de tareas y dentro de éstas la minería de texto, que es el objeto a tratar en ésta investigación. La minería de datos incluye tecnología de base de datos, aprendizaje de máquinas, estadísticas, reconocimiento de patrones, inteligencia artificial, visualización de datos.
  • 6. MINERÍA DE DATOS Minería de datos, se refiere a la extracción de conocimientos de grandes cantidades de datos que son parte de repositorios de información. Conocida también como KnowledgeDiscoveryfrom Data, o KDD. La minería de datos envuelve una integración de técnicas como tecnologías de BD y warehouses, estadísticas, aprendizaje de máquinas, reconocimiento de patrones, análisis espacial y temporal de datos.
  • 7. Descubrimiento de conocimiento consiste: Limpieza de datos. Integración de datos. Selección de datos. Transformación de datos. Minerías de datos Evaluación de patrones. Presentación del conocimiento.
  • 8. Tipo de datos donde realizar minería de datos La minería de datos se aplica a cualquier repositorio de datos, estos repositorios incluyen BD relacionales, data warehouses, BD transaccionales, sistemas avanzados de BD, archivos planos, data streams, y el WWW. Los sistemas avanzados de bases de datos incluyen BD de objetos relacionados y especificas, BD orientadas a aplicaciones, BD espaciales, BD textuales. Los desafíos y técnicas de minería pueden diferir para cada uno de los sistemas repositorios.
  • 9. MINERÍA DE TEXTO La minería de texto, se basa en documentos de texto no estructurados, los cuales son la base para el descubrimiento de nueva información. Para realizar minería de texto se debe realizar las siguientes actividades: Agrupamiento de documentos. Identificación de categorías. Categorización. Clasificación. Asociaciones.
  • 10. La minería de texto realiza el descubrimiento de conocimientos que no existían explícitamente en ningún texto de la colección, pero que surgen de relacionar el contenido de varios de ellos. Consiste de dos etapas: Primera etapa, los textos se transforman tipo de representación estructurada o semi-estructurada; la segunda etapa las representaciones intermedias se analizan para descubrir en ellas algunos patrones interesantes o nuevos conocimientos.
  • 11. Pre procesamiento En ésta etapa de procesamiento las técnicas utilizadas intentan transformar a una representación semiestructurada o estructurada los documentos de datos textuales en crudo. Las representaciones intermedias de los textos deben ser sencillasycompletas. Existen representaciones que son utilizadas en ésta etapa de la minería de texto , que son de dos tipos: A nivel documento y a nivel de concepto. A nivel concepto.
  • 12. APLICACIONES Las prácticas de minería de datos se utilizan en diversas industrias y funciones de negocios: Empresas de telecomunicaciones. La industria del comercio. La industria de la medicina. Bancos e Instituciones Financieras.
  • 13. REDES NEURONALES EN LA MINERIA DE DATOS Las Redes Neuronales (Neural Networks) son utilizadas para la predicción, la minería de datos (data mining), el reconocimiento de patrones y los sistemas de control adaptativo. Constituyen una parte muy importante en el estudio y desarrollo de la inteligencia artificial (AI) y el de la vida artificial (a-life). Las Redes Neuronales pueden ser combinadas con otras herramientas  como la lógica difusa (lógica fuzzy), los algoritmos genéticos, los sistemas expertos, las estadísticas, las transformadas de Fourier, etc.
  • 14. TÉCNICAS BASADAS EN REDES NEURONALES ARTIFICIALES Su ventaja principal es que, cuando están bien ajustadas, obtienen precisiones muy altas. Además son muy expresivas y permiten capturar modelos no lineales. Entre sus inconvenientes se suelen nombrar su sensibilidad a valores anómalos (aunque son robustos al ruido no extremo y a los atributos no significativos), necesitan muchos ejemplos para el aprendizaje y son relativamente lentas y fundamentalmente, su incomprensibilidad. Son técnicas muy eficientes que permiten trabajar con datos con alta dimensionalidad y precisión.
  • 15. APLICACIONES DE LAS REDES NEURONALES EN LA MINERÍA DE DATOS Minería de Datos con Redes Neuronales Artificiales: Aplicación en Vacunas – Tuberculosis. La Minería de Datos se apoya en la aplicación de métodos matemáticos de análisis, y específicamente del uso redes neuronales artificiales. Esta revolución de la Tecnología de la Información coincide con la revolución que paralelamente está teniendo lugar en la Biotecnología, debido a un mundo de avances tecnológicos que han permitido la obtención y acumulación automática de inmensas cantidades de información biológica. Del encuentro de estas dos revoluciones nace la Bioinformática como una multidisciplina estratégica que pone al servicio de la Biotecnología los recursos de la nuevas Tecnologías de la Información.
  • 16. Aplicación de redes neuronales artificiales para determinar la distribución Espacial de la humedad del suelo en una pequeña cuenca de drenaje. Este estudio trata de demostrar que es posible realizar una predicción razonable de la distribución espacial de la humedad edáfica superficial, estudiar sus patrones espaciales y contrastar la importancia de cada variable a partir de un número limitado de mediciones mediante el uso de redes neuronales artificiales multicapa de tipo feedforward con aprendizaje mediante mecanismos de retro propagación del error utilizando principalmente variables derivadas de un modelo digital de elevaciones (MDE) y de fotografía aérea.
  • 17. CONCLUSIONES La minería de datos (DM, Data Mining) nos ayuda a preparar, y explorar los datos para sacar la información oculta en ellos. Está fuertemente ligado con la supervisión de procesos industriales ya que resulta muy útil para aprovechar los datos almacenados en las bases de datos. Al momento de utilizar técnicas de minería de datos se aborda la solución a problemas de predicción, clasificación y segmentación.
  • 18. Las redes neuronales artificiales han sido claramente aceptadas en la minería de datos como nuevos sistemas eficaces para el tratamiento de la información en muchas disciplinas. Pues esto ha dado como resultado sus diferentes aplicaciones en áreas de Ciencia e Ingeniería, Medicina y Salud, Transporte y Comunicaciones, Finanzas, Negocios, etc. Las redes neuronales artificiales se hacen muy evidentes en la minería de datos, específicamente las basadas en el modelo Kohonen, ya que pueden ser aplicadas como una herramienta de análisis.
  • 19. RECOMENDACIONES Hacer uso de aplicaciones que permitan mejorar el proceso de formación académica de los estudiantes. Fomentar el desarrollo de proyectos de descubrimiento de Conocimiento en BD en la Universidad. Las redes neuronales no constituyen una área nueva de conocimiento, pero actualmente no se le está prestando la suficiente atención es por esto que se recomendaría que se tome en cuenta las ventajas que presentan sobre otras técnicas en la minería de datos para resolver los diferentes problemas. Una recomendación importante de las redes neuronales es que con el estudio de ellas, después su empleo es relativamente fácil y adaptable a diferentes series.
  • 20. APORTE PERSONAL En el desarrollo de la presente temática que hemos escogido nos hemos podido dar cuenta ya que debido a la abundancia de información de texto, la recuperación de información ha encontrado algunas aplicaciones. Por lo cual existen algunos sistemas de recuperación de formación, como sistemas de catálogos de bibliotecas en línea, sistemas de gestión de documentos y los desarrollados más recientemente motores de búsqueda Web. Es de gran importancia la minería de Datos ya que es una de las ramas de la lingüística computacional que trata de obtener información y conocimiento a partir de conjuntos de datos que en principio no tienen un orden o no están dispuestos en origen para transmitir esa información. Estas redes poseen dos tipos de aprendizaje tales como aprendizaje supervisado y no supervisado. Como en toda aplicación existen ventajas y desventajas al utilizar este método, algunas de la ventajas son: aprendizaje adaptativo: auto organización: tolerancia a fallos: operación en tiempo real. Una de las desventajas es que las redes neuronales padecen de falta de hardware, debido a que su habilidad radica en procesar información en paralelo.
  • 21. BIBLIOGRAFÍA Y REFERENCIAS Montes Manuel -y- Gómez.- Minería de texto: Un nuevo reto computacional. Carmen Gálvez, PhD.- TEXT-MINING: THE NEW GENERATION OF SCIENTIFIC LITERATURE ANALYSIS IN MOLECULAR BIOLOGY AND GENOMICS Machine Learning: An Artificial Intelligence Approach Vol I-IV [Michalski and Teccuci, 1994]. M. Montes-y-Gómez y A. Gelbukh.- Un método de agrupamiento de grafos conceptuales para minería de texto*. Hernandezjosé, Ramírez MaJose, Ferri cesar.- Introducción a la minería de datos. Redes Neuronales (Neurales). (Neural Networks), disponible enhttp://www.answermath.com/redes_neuronales_o_neurales.htm Aplicación de la minería de datos al estudio de las alteraciones respiratorias durante el sueño, Carlos Zamarrón Sanz, Vanesa García Paz, Uxío Calvo Álvarez, Fernanda Pichel Guerrero, José Ramón Rodríguez, Pdf disponible en http://www.sogapar.org/pneuma/pneuma6/pneuma-n-6-5c.pdf Minería de datos con redes neuronales artificiales: aplicación en Vacunas – tuberculosis, M.v. Guzmán, h. Carrillo , e. Villaseñor , e. Valencia, r. Calero, L. E. Morán y a. Acosta,Pdf disponible en: http://www.dynamics.unam.edu/DinamicaNoLineal/Articulos/MineriaRedesNVacunas.pdf Aplicación de redes neuronales artificiales para determinar la distribución Espacial de la humedad del suelo en una pequeña cuenca de drenaje. Estudios Preliminares, M. Maneta y S. Schnabel, Pdf disponible en: http://www.zonanosaturada.com/publics/V6/p295-304.pdf