Este documento describe la sociedad del conocimiento y contrasta con la sociedad de la información. Explica que la sociedad del conocimiento se basa en la utilización del conocimiento como motor central, mientras que la sociedad de la información se caracteriza por la capacidad de obtener y procesar información a través de las TIC. También analiza los procesos de creación de conocimiento y las herramientas para gestionar la información y el conocimiento en las organizaciones.
WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...Jean Sanchez
El WebApps permite a la Ingeniería Web el uso de diferentes medios (audio, video, multimedia entre otros), con el cual los usuarios tienen la posibilidad de acelerar su aprendizaje. Además, disminuye los costos de reproducción, publicación y distribución del material impreso, otra ventaja es que el acceso al contenido de este material, se hace en forma oportuna y confiable. La Minería de Datos (DM) es la tercera fase del KDD (Knowledge Discovery in Databases), que es una rama de la Inteligencia Artificial; la DM es tan amplia y novedosa que la Universidad Nacional Abierta (UNA) debería incluirla en la asignatura “Introducción a la Inteligencia Artificial y Sistemas Expertos”, o ser una nueva asignatura de la carrera. WEKA, es uno de los programas que permite comprender y acercarse a la DM, fue desarrollado en la Universidad de Waikato, Nueva Zelanda, bajo licencia GNU e implementado en Java.
WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...Jean Sanchez
El WebApps permite a la Ingeniería Web el uso de diferentes medios (audio, video, multimedia entre otros), con el cual los usuarios tienen la posibilidad de acelerar su aprendizaje. Además, disminuye los costos de reproducción, publicación y distribución del material impreso, otra ventaja es que el acceso al contenido de este material, se hace en forma oportuna y confiable. La Minería de Datos (DM) es la tercera fase del KDD (Knowledge Discovery in Databases), que es una rama de la Inteligencia Artificial; la DM es tan amplia y novedosa que la Universidad Nacional Abierta (UNA) debería incluirla en la asignatura “Introducción a la Inteligencia Artificial y Sistemas Expertos”, o ser una nueva asignatura de la carrera. WEKA, es uno de los programas que permite comprender y acercarse a la DM, fue desarrollado en la Universidad de Waikato, Nueva Zelanda, bajo licencia GNU e implementado en Java.
Seminario Almacenamiento de Datos Ambientales HoyCAESCG.org
Seminario "Almacenamiento de Datos Ambientales Hoy" impartido el 13/12/10 a los participantes del Proyecto Glocharid.
Ponentes: Isaac Francés y Balbino Fernández
Evaluation of techno-scientific networks: a Spanish network on protected area...Pepe
Co-occurrence relations between keywords, researchers and journals in the papers can be analyzed and mapped to know their nodes, subnets, and strategic research areas It has made strategic analysis and dynamic analysis of the Spanish Research Network on Protected Areas as the Web of Science from 1981-2005. We have obtained the Strategic Diagram, Strategic Knowledge Maps of Techno-scientific Network or CERT Map, lists of researchers and journals of strategic importance and activity analysis table of subnets. Techno-scientific network is a well-structured network with twenty-two subnets strategic. Network analysis with KDD techniques and engineering and knowledge mapping is a first class support to strategic decision-making in Science Policy and Evaluation of Science and Technology.
El concepto de affordance en los procesos de gestión del aprendizaje y del co...Julio Ernesto Rojas Mesa
De alguna manera, la tensión producida en la relación entre un comportamiento cultural y la función original de un artefacto tiene gran incidencia en las formas de affordance que emergen como potencias. Un ejemplo carácteristico de esta relación puede ser el uso de los cubiertos en los hogares de familias pertenecientes a diferentes culturas.
Es asi que mientras en la cultura europea la cuchara y el tenedor se convirtieron en elementos fundamentales para el consumo de alimentos, para la cultura oriental este tema se resolvió con dos palillos, con los cuales el comensal interactua con diferentes tipos de platos. En otro sentido lógico, el desarrollo del artefacto para el consumo de los alimentos no fue un problema importante en la cultura india pues allí comúnmente se come con la mano, a pesar de que dicha cultura se ha caracterizado por su gran capacidad para el manejo de los metales desde épocas muy antiguas de la humanidad. Finalmente, en el mundo indígena americano, el tema del artefacto en la comida se expresó como un evento de plieque y despliegue del devenir humano con la naturaleza. Los grupos indígenas tomaban materiales del contexto natural en el que se encontraban, construían con ellos sus utensilios y una vez habían terminado de alimentarse los regresaban al contexto natural de donde los habían tomado.
Ponencia impartida en el Curso de Ingeniería del Conocimiento y del Producto, organizado por AINVEX y Techné Research Group, en la Facultad de Ciencias de la Universidad de Granada, los días 12 y 14 de abril de 2012.
Enlace del curso:
http://secretariageneral.ugr.es/pages/tablon/*/noticias-canal-ugr/2012/04/01/la-ugr-organiza-un-curso-sobre-aingenieria-del-conocimiento-y-del-productoa-para-el-desarrollo-de-productos-comerciales-innovadores
Enlace a página de Techné:
http://www.ugr.es/~tep028/eventos/curso_IC_IP_2012/curso_IC_IP_2012.php
Enlace a página de AINVEX:
http://ainvex.blogspot.com.es/2012/04/curso-ingenieria-del-conocimiento-y-del.html
Seminario Almacenamiento de Datos Ambientales HoyCAESCG.org
Seminario "Almacenamiento de Datos Ambientales Hoy" impartido el 13/12/10 a los participantes del Proyecto Glocharid.
Ponentes: Isaac Francés y Balbino Fernández
Evaluation of techno-scientific networks: a Spanish network on protected area...Pepe
Co-occurrence relations between keywords, researchers and journals in the papers can be analyzed and mapped to know their nodes, subnets, and strategic research areas It has made strategic analysis and dynamic analysis of the Spanish Research Network on Protected Areas as the Web of Science from 1981-2005. We have obtained the Strategic Diagram, Strategic Knowledge Maps of Techno-scientific Network or CERT Map, lists of researchers and journals of strategic importance and activity analysis table of subnets. Techno-scientific network is a well-structured network with twenty-two subnets strategic. Network analysis with KDD techniques and engineering and knowledge mapping is a first class support to strategic decision-making in Science Policy and Evaluation of Science and Technology.
El concepto de affordance en los procesos de gestión del aprendizaje y del co...Julio Ernesto Rojas Mesa
De alguna manera, la tensión producida en la relación entre un comportamiento cultural y la función original de un artefacto tiene gran incidencia en las formas de affordance que emergen como potencias. Un ejemplo carácteristico de esta relación puede ser el uso de los cubiertos en los hogares de familias pertenecientes a diferentes culturas.
Es asi que mientras en la cultura europea la cuchara y el tenedor se convirtieron en elementos fundamentales para el consumo de alimentos, para la cultura oriental este tema se resolvió con dos palillos, con los cuales el comensal interactua con diferentes tipos de platos. En otro sentido lógico, el desarrollo del artefacto para el consumo de los alimentos no fue un problema importante en la cultura india pues allí comúnmente se come con la mano, a pesar de que dicha cultura se ha caracterizado por su gran capacidad para el manejo de los metales desde épocas muy antiguas de la humanidad. Finalmente, en el mundo indígena americano, el tema del artefacto en la comida se expresó como un evento de plieque y despliegue del devenir humano con la naturaleza. Los grupos indígenas tomaban materiales del contexto natural en el que se encontraban, construían con ellos sus utensilios y una vez habían terminado de alimentarse los regresaban al contexto natural de donde los habían tomado.
Ponencia impartida en el Curso de Ingeniería del Conocimiento y del Producto, organizado por AINVEX y Techné Research Group, en la Facultad de Ciencias de la Universidad de Granada, los días 12 y 14 de abril de 2012.
Enlace del curso:
http://secretariageneral.ugr.es/pages/tablon/*/noticias-canal-ugr/2012/04/01/la-ugr-organiza-un-curso-sobre-aingenieria-del-conocimiento-y-del-productoa-para-el-desarrollo-de-productos-comerciales-innovadores
Enlace a página de Techné:
http://www.ugr.es/~tep028/eventos/curso_IC_IP_2012/curso_IC_IP_2012.php
Enlace a página de AINVEX:
http://ainvex.blogspot.com.es/2012/04/curso-ingenieria-del-conocimiento-y-del.html
Open Data in the world of Science” by Dr. Claudio GutiérrezLEARN Project
Open Data in the world of Science”, Dr. Claudio Gutiérrez, DCC, Universidad de Chile / CIWS - presented at the 4th LEARN RDM Workshop in Santiago, Chile: http://learn-rdm.eu/
Cómo fue que surgió lo que llamamos Big Data.
Varias perspectivas sobre qué es Data Science.
Qué estudia exactamente la Ciencia de Datos.
Introducción al Arte de la Ciencia de Datos.
Hoy en día, la minería de datos (MD) está consiguiendo cada vez más captar la atención de las empresas. Todavía es
infrecuente oír frases como “deberíamos segmentar a nuestros clientes utilizando herramientas de MD”, “la MD
incrementará la satisfacción del cliente”, o “la competencia está utilizando MD para ganar cuota de mercado”.
CEHAD. Curso de Especialización en Historia del arte Digital. Pepe
CEHAD
CURSO DE ESPECIALIZACIÓN EN
HISTORIA DEL ARTE DIGITAL. NIVEL
BÁSICO
Año académico 2013-2014
Departamento de Historia del Arte
Universidad de Málaga
Guía de visita. Parque Nacional del Archipiélago de Cabrera.Pepe
Primera publicación oficial que se edita sobre el Parque Nacional de la isla de la Cabrera a cargo del Ministerio de Medio Ambiente. Con una estructura concisa y un lenguaje ameno este libro nos permite adentrarnos en la geología, clima, flora, fauna y sociedad de este espacio natural protegido. Tras una ficha técnica de presentación del parque se hace un amplio recorrido sobre el medio natural (historia, geología, clima, suelo y fauna). Incluye recomendaciones a la hora de realizar recorridos, información sobre los centros de interpretación, miradores e itinerarios a pie totalmente detallados, con mapas y perfiles. También incluye información sobre escalada, así como anexos y datos prácticos. Editado en formato práctico, contiene numerosas fotografías en color de excelente calidad. En definitiva, una guía imprescindible para todo aquél que quiera conocer y descubrir la Cabrera.
Caracterización estratégica de la investigación española sobre literatura art...Pepe
Palabras clave: Redes científicas; Literatura artística; Tratados de arte; Tratados de arquitectura; Tratados de pintura; Tratados de música; Libros de arte; Libros de artistas; Análisis de palabras asociadas; Diagrama estratégico; Vigilancia estratégica, científica y tecnológica; Sistemas de conocimiento; Gestión del Conocimiento; Evaluación de la actividad científica y técnica.
Keywords: artistic literature; art treaties; architecture treaties; painting treaties; music treaties; art books: artist books; co-words analysis; strategic diagram; strategic watching; scientific and technological watching; knowledge systems; scientific and technological networks; knowledge management; scientific and technological evaluation; knowledge discovery in databases; KDD; information mapping, knowledge mapping; mapping strategic research network.
La méthode du centroïde du réseau tecno-scientifique et le paramètre de la ce...Pepe
L'objectif de cette recherche est de développer un référentiel d’application dans des cartes stratégiques de réseaux d'acteurs de domaines textuels scientifiques en utilisant la technologie et la méthodologie de l’analyse des graphes et des systèmes d'information géographique, SIG. On construira des cartes stratégiques de réseaux scientifiques, préalablement obtenus de systèmes de connaissance, avec la conviction que la visualisation des cartes 2D et images 3D
favorisera la veille scientifique et la prise de décisions.
Inteligencia competitiva aplicada a la búsqueda de empleoPepe
Ponencia impartida en el Curso de Ingeniería del Conocimiento y del Producto, organizado por AINVEX y Techné Research Group, en la Facultad de Ciencias de la Universidad de Granada, los días 12 y 14 de abril de 2012.
Enlace del curso:
http://secretariageneral.ugr.es/pages/tablon/*/noticias-canal-ugr/2012/04/01/la-ugr-organiza-un-curso-sobre-aingenieria-del-conocimiento-y-del-productoa-para-el-desarrollo-de-productos-comerciales-innovadores
Enlace a página de Techné:
http://www.ugr.es/~tep028/eventos/curso_IC_IP_2012/curso_IC_IP_2012.php
Enlace a página de AINVEX:
http://ainvex.blogspot.com.es/2012/04/curso-ingenieria-del-conocimiento-y-del.html
Transnevada. Ruta para bicicleta de montaña en el Espacio Natural de Sierra N...Pepe
Edita: Consejería de Medio Ambiente. Junta de Andalucía.
Consejero de Medio Ambiente: José Juan Díaz Trillo
Viceconsejera de Medio Ambiente: Ana Patricia Cubillo Guevara
Directora General de Espacios Naturales y Participación Ciudadana: Rocío Espinosa de la Torre
Equipo de Gestión del Espacio Natural de Sierra Nevada:
Director: Fco. Javier Sánchez Gutiérrez.
Conservador: Ignacio Henares Civantos.
Gerente: Mª del Mar Lara López.
Director Técnico: José Pino-Díaz
Textos: José Miguel Muñoz Díaz, Mª Teresa Carreto Díaz, José A. López Lorenzo, José Pino-Díaz.
Fotografías (por orden alfabético): José Miguel Barea Azcón (JBA), Gloria Cabezas Moreno (GCM),
Mª Teresa Carreto Díaz (TCD), Ramón Fernández Moreno (RFM), José Hernández Bugés (JHB), José
Miguel Muñoz Díaz (JMD), Miguel Ángel Navarro Espigares (MNE), Sergio Pueyos Castillo (SPC),
Antonio J. Ramos Lafuente (ARL), Mª del Mar Rodríguez Ruiz (MRR), Julio Vicioso González (JVG) y
Pilar Villegas Campos (PVC).
Cartografía y Gráficos: Mª Teresa Carreto Díaz, Daniel Callejón Mayoral. Base cartográfica: Mapa
Guía Parque Nacional y Natural Sierra Nevada. Año 2007. Escala 1:60.000. Consejería de Medio
Ambiente. Junta de Andalucía.
Colaboradores: Miguel Ángel Navarro Espígares, Esperanza Jiménez Shaw y Asociación
Internacional de Bicicleta de Montaña (IMBA-España).
Diseño: Creados Visual S.L.
Impresión: GRX Servicios Gráficos.
ISBN: en tramitación
D.L.: en tramitación
Agradecimientos:
A Miguel Ángel Navarro Espigares, amante de la montaña y de la bicicleta, de cuya idea original
nace la ruta para bicicleta de montaña Transnevada.
Al Equipo de Gestión, Técnicos, Guías y Agentes de Medio Ambiente del Parque Nacional y Parque
Natural de Sierra Nevada. A la Federación Andaluza de Ciclismo, Club de Ciclismo Granabike,
Asociación de Empresas de Turismo Activo de Granada y al equipo técnico y de campo de la
Agencia de Medio Ambiente y Agua de Andalucía.
Integración de sistemas de información textuales y espaciales. Análisis estra...Pepe
En el presente trabajo se realiza un análisis estratégico de la investigación sobre áreas protegidas objeto de tesis doctorales leídas en España en el periodo 1979-2004. La información documental se ha extraído de la base de datos TESEO, base de tesis doctorales leídas en España desde 1976, (http://www.mcu.es/TESEO/). A partir de esta información se ha realizado una base de datos propia, en la que se han incluído los campos de interés del presente estudio: disciplinas académicas, miembros de los tribunales y disciplinas y miembros de tribunal, ya tratados para su procesamiento con el sistema de conocimiento Redes 2005 v. 1.0.0. El análisis estratégico se ha realizado con el método ciencimétrico de análisis de palabras asociadas, usualmente utilizado en vigilancia tecnológica e inteligencia competitiva. Para cada uno de los tres campos de estudio se ha obtenido la red y su diagrama estratégico. Con las matrices de distancias, obtenidas a partir de las matrices de co-ocurrencias de Redes 2.005 v. 1.0.0, se ha realizado un análisis estadístico con Statistica 6.0 y SPSS 12.0, con la
finalidad de determinar las coordenadas MDS de los descriptores. Estas últimas se han utilizado como dato de entrada en ArcView 3.2, sistema de información geográfica, para la obtención de mapas en dos y tres dimensiones del dominio “tésis doctorales sobre áreas protegidas”. Se ha comprobado como ArcView 3.2 permite la recuperación de datos de las tablas de atributos de los temas, tanto mediante búsquedas textuales como gráficas, así como la realización de gráficos de diversos tipos a partir de dichos atributos. Por último se ha obtenido con Cortona VRML Client (plug-in para Internet Explorer) el escenario virtual en 3D de dicho dominio.
La Ingeniería del Conocimiento y la Cartografía de la Información son disciplinas científicas recientes y en constante desarrollo, en las que convergen las Matemáticas, la Lingüística, la Informática y la Visualización de la información. Enfocadas a la creación y visualización de nuevo conocimiento a partir de la información contenida en las bases de datos documentales, tienen un enorme y novedoso campo de aplicación en Gestión del Conocimiento, en Inteligencia Competitiva, en Evaluación de la Ciencia y la Técnica y en Política Científica y Tecnológica.
En esta tesis doctoral se realiza el "Análisis Estratégico de la Investigación Española sobre Áreas Protegidas" realizada en un periodo reciente de veinticinco años (1981-2005). Para ello se han estudiado dos grandes conjuntos documentales: uno internacional o de visibilidad internacional, los artículos científicos indexados en la Web of Science, y otro nacional o de visibilidad nacional, los artículos indexados en las bases de datos españolas del Instituto de Estudios Documentales sobre Ciencia y Tecnología, IEDCYT, (ICYT, ISOC e IME).
El empleo conjunto de técnicas KDD (Knowledge Discovery Databases), de análisis estratégico, de análisis de redes, de trazado de grafos y de cartografía, ha permitido crear y visualizar nuevo conocimiento, de carácter estratégico, sobre la Investigación Española en Áreas Protegidas. Los mapas obtenidos, denominados Mapas de Conocimiento Estratégico de las Redes Tecnocientíficas (Mapas CERT), son en sí mismos la imagen visual, uno de los productos de esta investigación; no obstante detrás de ellos existe, por un lado, un novedoso desarrollo de Ingeniería del Conocimiento (el "Método del Centroide de la Red Tecnocientífica y de la Centralidad Nodal") y, por otro lado, un "Método Gráfico de Visualización de las Subredes Estratégicas y de las Áreas Estratégicas de Investigación" mediante el empleo del Sistema de Conocimiento Copalred®, del software de análisis de redes Pajek® y del Sistema de Información Geográfica ArcView®.
El análisis VECT de las dos redes tecnocientíficas, la Red Internacional Web of Science y la Red Nacional IEDCYT, ha permitido conocer cuáles son sus subredes estratégicas y sus áreas estratégicas de investigación. Este nuevo conocimiento, de interés para la Toma de Decisiones en Política Científica y Tecnológica, ha sido descrito, diseccionado (en palabras clave, investigadores y revistas), evaluado y cartografiado. Para ello se han desarrollado los conceptos de "Centroide del Grafo de Mínima Energía de la Red" y de "Centralidad Nodal"; se ha implementado un nuevo método gráfico de análisis estructural y estratégico de las redes y de las subredes de investigación; se han obtenido nuevos parámetros de los términos y de las subredes: centralidad normalizada (CVECT), densidad normalizada (DVECT), e importancia absoluta (zVECT); y se han construido los diagramas estratégicos de las redes. Además se han elaborado los rankings de importancia estratégica (IVECT) de los términos (palabras clave, autores y revistas) y de las subredes de investigación y, para finalizar, se ha desarrollado una novedosa técnica de Cartografía del Conocimiento mediante "Mapas de Conocimiento Estratégico de las Redes Tecnocientíficas (Mapas CERT)": mapas cartográficos 2D, imágenes 3D y "Mapas de Importancia Estratégica (Mapas IVECT)"
Gestión y Administración de Proyectos. Curso AINVEX sobre Estrategias de Comunicación Científica (Facultad de Ciencias. Granada, 21-23 de febrero de 2011).
Curso de acreditación de conocimientos para ejercer de Guía Intérprete en el ...Pepe
Curso de acreditación de conocimientos para ejercer de Guía Intérprete en el Parque Nacional de Sierra Nevada (Almería, Granada). Pitres (Granada) Octubre de 2010.
Instrucciones del procedimiento para la oferta y la gestión conjunta del proceso de admisión a los centros públicos de primer ciclo de educación infantil de Pamplona para el curso 2024-2025.
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
Text mining para historiadores de arte
1. Sociedad del Conocimiento
Prof. Dr. José Pino Díaz
Departamento de Historia del Arte
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
2. Trilogía DIC
Datos, Información y Conocimiento.
Los datos son expresiones mínimas de información que aisladas no tienen.
La información son datos elaborados con un significado para el receptor.
El conocimiento es la información interpretada, personalizada, que propicia la
toma adecuada de decisiones en el marco de una organización .
Ejemplo:
• La organización de las notas musicales (datos=objeto)
• En forma de partitura (información=contexto) constituyen
información que puede ser interpretada por muchos
músicos.
• La destreza particular de un músico
(conocimiento=acción) para interpretar la partitura se
refiere al concepto de conocimiento.
3. Sociedad de la Información y Sociedad del
Conocimiento
La Sociedad de la Información es un estado de desarrollo social
caracterizado por la capacidad de sus miembros para obtener, compartir y
procesar cualquier información por medios de las Tecnologías de
Información y Comunicación (TICs), desde cualquier lugar y en la forma
que se prefiera.
La “Sociedad del Conocimiento" es la situación social, económica y
tecnológica basada en la utilización del conocimiento. El motor central de la
sociedad actual es el conocimiento, las actividades relacionadas con la
producción de conocimiento.
En la actualidad las organizaciones se enfrentan a dos problemas
importantes relacionados con la información:
Infoxicación
• Por una parte, la sobreabundancia de información, ya que las
organizaciones acumulan gran cantidad de información de todo tipo.
• Por otra parte, la escasez de información útil para tomar decisiones,
4. Sociedad de la Información y Sociedad del
Conocimiento
¿Qué indican las cifras del gráfico?
Las cifras del gráfico reflejan el número de búsquedas de un término concreto que se han realizado, en
comparación con el total de búsquedas realizadas en Google a lo largo del tiempo. No representan cifras
de volumen de búsquedas absolutas, porque los datos están normalizados y presentados en una escala
de 0 a 100. Cada punto del gráfico está dividido entre el punto máximo, o 100. Si no disponemos de
datos suficientes, se mostrará el valor 0.
5. Proceso de creación del conocimiento
(Nonaka-Takeuchi, 1995)
Socialización, es el proceso de adquirir conocimiento tácito a través de
compartir experiencias y que añade el nuevo conocimiento a la base colectiva que
posee la organización.
Exteriorización, es el proceso de convertir conocimiento tácito en conocimiento
explícito; es la actividad esencial en la creación del conocimiento.
Combinación, es el proceso de crear conocimiento explícito al reunir
conocimiento explícito proveniente de cierto número de fuentes.
Interiorización, es un proceso de incorporación conocimiento explícito en
conocimiento tácito.
6. Gestión de la Información y
Gestión del Conocimiento.
La Gestión de la Información es la gestión de documentos de todo tipo (gestión del
conocimiento explícito).
La Gestión del Conocimiento engloba tanto la gestión de la información
(conocimiento explícito) como la gestión del conocimiento tácito (conocimiento
interno de las personas).
Las principales herramientas que apoyan a un programa de gestión del
conocimiento son:
1. Data warehousing (Almacén de datos)
2. Data mining (Minería de datos)
3. Sistemas de soporte a la toma de decisiones
4. Groupware (Software colaborativo)
5. Sistemas de información para la dirección, todas ellas han de ser apoyadas
adecuadamente por los sistemas de gestión documental
8. Minería de datos
Data mining
Exploration de données
Prof. Dr. José Pino Díaz
Departamento de Historia del Arte
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
9. Databases
Una base de datos es un conjunto de información estructurada en registros
y almacenada en un soporte electrónico legible por ordenador.
• Cada registro constituye una unidad autónoma de información que
puede a su vez estar estructurada en diferentes campos o tipos de
datos que se recogen en la base de datos
10. Creación de nuevo conocimiento a partir de bases
de datos bibliográficas
(Knowledge Discovery in Databases, KDD)
11. Data Mining, a KDD Process
Data mining: the core of
Knowledge Discovery Pattern Evaluation
Databases process.
Data Mining
Task-relevant Data
Data Selection
Data Preprocessing
Data Warehouse
Data Cleaning
Data Integration
Databases
12. Minería de datos
La Minería de Datos es la extracción dirigida de la información existente en las bases de
datos con el fin de descubrir patrones, relaciones o asociaciones para generar nuevo
conocimiento.
Algunos tipos de DM:
- Web mining
- Web content mining (minería de contenido web)
- Web structure mining (minería de estructura web)
- Web usage mining (minería de uso web)
- Text mining (minería de datos textuales)
- Spatial data mining (minería de datos espaciales)
13. Data Mining: Confluence of Multiple Disciplines
Database
Statistics
Technology
Machine
Data Mining Visualization
Learning
Information Other
Science Disciplines
14. Data mining and Making decisions
Increasing potential
to support
making decisions End User
Making
Decisions
Data Presentation Business
Analyst
Visualization Techniques
Data Mining Data
Knowledge Databases Discovery Analyst
Data Exploration
Statistical Analysis, Querying and Reporting
Data Warehouses / Data Marts
OLAP, MDA DBA
Data Sources
Paper, Files, Information Providers, Database Systems, OLTP
15. Minería de textos
Text mining
Fouille de textes
Prof. Dr. José Pino Díaz
Departamento de Historia del Arte
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
16. Text mining, a KDD Process
En 2001, Dow Chemicals se unió a Union Carbide Corporation (UCC). Esta unión requirió la
integración de 35.000 informes de UCC en el sistema de gestión del documentos de Dow. Dow
Chemicals eligió a la empresa ClearForest, líder en text-driven business solutions, para realizar la
integración de la colección de documentos. Usando tecnología ad-hoc se identificaron sustancias
químicas, productos, empresas, centros y personas. Esto permitió que Dow Chemicals agregara
más de 80 años de investigación de UCC a su sistema de gestión de información y
aproximadamente 100.000 nuevas sustancias químicas a su registro. Cuando el proyecto se
completó, se estimó que Dow Chemicals ahorró casi 3 millones de dólares y que el tiempo
empleado en clasificar los documentos se redujo un 50% y los errores de datos entre un 10-15%.
23. Text mining:
Concept linckage
Una aplicación muy popular del text mining es relatada en Hearst (Untangling Text Data Mining, 1999), Don Swanson intenta
extraer información derivada de coleccionesde texto. Teniendo en cuenta que los expertos sólo pueden leer una pequeña
parte de lo que se publica en su campo, por lo general no se dan cuenta de los nuevos desarrollos que se suceden en otros
campos.
Así, Swanson ha demostrado cómo cadenas de implicaciones causales dentro de la literatura médica pueden conducir a
hipótesis para enfermedades poco frecuentes, algunas de las cuales han recibido pruebas de soporte experimental.
Investigando las causas de la migraña, dicho investigador extrajo varias piezas de evidencia a partir de títulos de artículos
presentes en la literatura biomédica. Algunas de esas claves fueron:
• El estrés está asociado con la migraña.
• El estrés puede conducir a la pérdida de magnesio.
• Los bloqueadores de canales de calcio previenen algunas migrañas.
• El magnesio es un bloqueador natural del canal de calcio.
• La depresión cortical diseminada (DCD) está implicada en algunas migrañas.
• Los niveles altos de magnesio inhiben la DCD.
• Los pacientes con migraña tienen una alta agregación plaquetaria.
• El magnesio puede suprimir la agregación plaquetaria.
Estas claves sugieren que la deficiencia de magnesio podría representar un papel en algunos tipos de migraña, una hipótesis
que no existía en la literatura y que Swanson encontró mediante esas ligas. De acuerdo con Swanson (Swanson y otros,
1994), estudios posteriores han probado experimentalmente esta hipótesis obtenida por text mining con buenos
resultados.
“Data mining: torturando a los datos hasta que confiesen”.
http://www.uoc.edu/molina1102/esp/art/molina1102/molina1102.html
31. Teoría Actor-Red
Actor-network theory
Théorie de l’acteur-Réseau
Prof. Dr. José Pino Díaz
Departamento de Historia del Arte
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
32. Conocimiento Científico y Tecnológico
Teoría Actor-Red
• Filosofía de las Ciencias (Michel Serres)
• Sociología del Conocimiento (David Bloor)
• Sociología de la Ciencia y de la Técnica (Michel Callon, Bruno
Latour)
• Sociología de la Traducción
• Sociología de las Asociaciones
• Teoría Actor-Red (M. Callon, J.P. Courtial, B. Latour, etc.)
“ … en la construcción social de un hecho científico intervienen entidades humanas y no humanas y el
proceso continuo de transformación o traducción de las relaciones establecidas entre tales entidades
da como resultado una red en continuo cambio …”
33. Teoría Actor-Red
El desarrollo en los años ochenta de la
Sociología de las Ciencias y Técnicas, Sociología
de la Traducción o Sociología de las
Asociaciones por Michel Callon y Bruno Latour
(Centre de Sociologie de l’Innovation, Paris) a
partir de recursos conceptuales, entre otros, de
Michel Serres (Filosofía de las Ciencias) y de
David Bloor (Sociología del Conocimiento), tiene
su exponente en la Teoría Actor-Red (ANT en
inglés), según la cual en la construcción social
de un hecho científico intervienen entidades
humanas y no humanas y el proceso continuo
de transformación o traducción de las
relaciones establecidas entre tales entidades da
como resultado una red en continuo cambio;
entendida ésta como una malla formada por
nudos (actores) enlazados entre sí (relaciones
que establecen entre ellos).
34. Redes Tecnocientíficas
Se emplea el concepto de “red tecnocientífica” tal como fue planteado por
Latour en 1983, es decir como la forma abreviada de “red de ciencia y
tecnología”
La Teoría Actor-Red es útil para describir las complejas relaciones que se
establecen en las redes de la Ciencia y Tecnología, así como las de la Tecnociencia
(Echevarría y González, 2009), entendida ésta como una modalidad de la
actividad científica y tecnológica fruto de la hibridación entre Ciencia y
Tecnología.
Así cualquier red de la Tecnociencia (Latour, 1983) está formada por un conjunto
de actores y un conjunto de relaciones establecidas entre ellos en un periodo
temporal concreto. Con el tiempo los actores y las relaciones cambian y dan lugar
a nuevas redes y así se suceden unos a otros a lo largo del periodo de análisis.
Esta teoría también llamada Sociología de la Traducción (entendida traducción
como conversión, transformación, variación o cambio), estudia los cambios que
se producen en las redes de conocimiento tecnocientífico.
35. Análisis Estratégico
El Análisis Estratégico consiste en esencia en la identificación y tipificación de los
actores y las relaciones fuertes; se trata de una “reducción de la complejidad
conservando lo fundamental”.
La Vigilancia Estratégica Científica y Tecnológica es el conjunto de tareas que
buscan “proporcionar buena información a la persona idónea en el momento
adecuado” y en el lugar adecuado; buena información sobre el entorno científico
y tecnológico de la organización.
La Planificación Estratégica es el “principal instrumento para la gestión de una
organización a corto plazo, 2 ó 3 años”; es una herramienta para la mejora
continua y la innovación en la organización.
38. Sistemas de conocimiento
Knowledge-based systems
Système d'analyse d'information
Prof. Dr. José Pino Díaz
Departamento de Historia delArte
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
39. Sistemas de conocimiento
Los sistemas de conocimiento son sistemas expertos ideados para crear nuevo conocimiento a partir
del conocimiento explícito presente en los documentos de las bases de datos. Siguen el proceso KDD en sus
diferentes fases. Tienen su origen en los softwares cienciométricos desarrollados para facilitar el análisis de
grandes conjuntos documentales científicos o tecnológicos (artículos científicos, patentes, tesis doctorales, etc.).
Los sistemas de conocimiento son de gran utilidad para los equipos de inteligencia competitiva y de vigilancia
tecnológica de las organizaciones ya que proporcionan informes, diagramas, gráficos y mapas muy apreciados en
la toma de decisiones estratégicas. La evaluación de redes de conocimiento se beneficia de la existencia de
sistemas de conocimiento desarrollados para transformar la información en conocimiento, procesando de una
manera rápida y controlada ingentes conjuntos documentales y creando nuevo conocimiento a partir de ellos.
La ingeniería del conocimiento es la rama de la inteligencia artificial que tiene por objetivo la creación de
indicadores, métodos e instrumentos de naturaleza matemática, informática y lingüística, para el análisis y la
representación cartográfica de la información científica y técnica.
40. Henoch
French or English Lexicons or
text-data terminological
resources
Dataset or Corpus Clustering DBMS-R
Term Extraction
and
And
Bibliometric Mapping
Indexation
statistics WWW
Server
SDOC
MIRIAD ILC NEURODOC HENOCH
Mac PC WS
40
41. Stanalyst
Bases de datos Recursos terminológicos
1 2 3 4
CORPUS BIBLIOMETRIA INDIZACION INFOMETRIA
Interrogación Estadísticas Manual o Clasificación y
y Datos descriptivas Automática Cartografía
Proyecto
Acceso e identificación
Navigador – Interface usuario
Esquema del Sistema de Conocimiento Stanalyst (Polanco, 2006). El módulo
“Infometría” de Stanalyst es un sistema de clasificación automática basado en dos
programas alternativos, Neurodoc (redes neuronales) y Sdoc (análisis de palabras
asociadas). Tomado de:
http://www.cincel.cl/documentos/Recursos/STANALYST2006.ppt
42. CoPalRed
Copalred es un sistema de conocimiento (herramienta de Ingeniería del Conocimiento) creado en el año 2003
por Rafael Bailón-Moreno, basado en el análisis de palabras asociadas y que tiene su antecedente en Leximappe,
software desarrollado por Whittaker, Law, Courtial y Bauin. Leximappe se ha mostrado útil en el análisis
estratégico de las redes de conocimiento científico y técnico. Leximappe y Copalred han sido empleados en el
estudio de grandes conjuntos documentales de diferentes disciplinas académicas: Arqueología, Ingeniería
Química, Fisioterapia, Conjuntos Difusos o Espacios Naturales Protegidos.
43. Análisis de Palabras Asociadas
Co-Word Analysis (1)
• El investigador transmite conocimiento tácito en los textos; éstos se
constituyen en conocimiento explícito. Este nuevo conocimiento se
analiza mediante métodos matemáticos, informáticos y lingüísticos, entre
ellos el método del análisis de palabras asociadas o co-word analysis.
• Se utiliza para estudiar la estructura y la dinámica del conocimiento en un
dominio documental concreto.
• Puede ser empleado a modo retrospectivo, “a tiempo real” o de forma
prospectiva.
• Se basa en dos teorías sociológicas: la Teoría Actor-Red y la Teoría de la
Traducción.
• Es un Índice Relacional de 2ª generación en Evaluación de la Ciencia
• Método de Knowledge Discovery in Databases (KDD)
• Se utiliza para estudiar las Redes Tecnocientíficas.
44. Análisis de Palabras Asociadas (2)
• Matriz de coocurrencias o matriz de adyacencia. Matriz simétrica que
muestra en los puntos de corte entre filas y columnas, cij, las
coocurrencias de los valores que encabezan cada fila i y cada columna j.
• Índice de equivalencia o de asociación entre las palabras i y j.
donde: eij.- Indice de equivalencia o de asociación entre las palabras i y j
Cij.- Co-ocurrencia de las palabras i y j
Ci.- Ocurrencia de la palabra i
Cj.- Ocurrencia de la palabra j.
Los valores de eij oscilan entre 0 y 1. Cuando dos palabras no aparecen
nunca juntas, su coocurrencia es nula, el índice de equivalencia vale cero.
Este índice es independiente del tamaño de la muestra.
46. Sistema de conocimiento Redes 2005
(Text mining: Clustering + Information visualization)
Vídeo-captura de pantalla que muestra el funcionamiento del sistema de
conocimiento Redes 2005