1. Sociedad del Conocimiento
Prof. Dr. José Pino Díaz
Departamento de Historia del Arte
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
2. Trilogía DIC
Datos, Información y Conocimiento.
Los datos son expresiones mínimas de información que aisladas no tienen.
La información son datos elaborados con un significado para el receptor.
El conocimiento es la información interpretada, personalizada, que propicia la
toma adecuada de decisiones en el marco de una organización .
Ejemplo:
• La organización de las notas musicales (datos=objeto)
• En forma de partitura (información=contexto) constituyen
información que puede ser interpretada por muchos
músicos.
• La destreza particular de un músico
(conocimiento=acción) para interpretar la partitura se
refiere al concepto de conocimiento.
3. Sociedad de la Información y Sociedad del
Conocimiento
La Sociedad de la Información es un estado de desarrollo social
caracterizado por la capacidad de sus miembros para obtener, compartir y
procesar cualquier información por medios de las Tecnologías de
Información y Comunicación (TICs), desde cualquier lugar y en la forma
que se prefiera.
La “Sociedad del Conocimiento" es la situación social, económica y
tecnológica basada en la utilización del conocimiento. El motor central de la
sociedad actual es el conocimiento, las actividades relacionadas con la
producción de conocimiento.
En la actualidad las organizaciones se enfrentan a dos problemas
importantes relacionados con la información:
Infoxicación
• Por una parte, la sobreabundancia de información, ya que las
organizaciones acumulan gran cantidad de información de todo tipo.
• Por otra parte, la escasez de información útil para tomar decisiones,
4. Sociedad de la Información y Sociedad del
Conocimiento
¿Qué indican las cifras del gráfico?
Las cifras del gráfico reflejan el número de búsquedas de un término concreto que se han realizado, en
comparación con el total de búsquedas realizadas en Google a lo largo del tiempo. No representan cifras
de volumen de búsquedas absolutas, porque los datos están normalizados y presentados en una escala
de 0 a 100. Cada punto del gráfico está dividido entre el punto máximo, o 100. Si no disponemos de
datos suficientes, se mostrará el valor 0.
5. Proceso de creación del conocimiento
(Nonaka-Takeuchi, 1995)
Socialización, es el proceso de adquirir conocimiento tácito a través de
compartir experiencias y que añade el nuevo conocimiento a la base colectiva que
posee la organización.
Exteriorización, es el proceso de convertir conocimiento tácito en conocimiento
explícito; es la actividad esencial en la creación del conocimiento.
Combinación, es el proceso de crear conocimiento explícito al reunir
conocimiento explícito proveniente de cierto número de fuentes.
Interiorización, es un proceso de incorporación conocimiento explícito en
conocimiento tácito.
6. Gestión de la Información y
Gestión del Conocimiento.
La Gestión de la Información es la gestión de documentos de todo tipo (gestión del
conocimiento explícito).
La Gestión del Conocimiento engloba tanto la gestión de la información
(conocimiento explícito) como la gestión del conocimiento tácito (conocimiento
interno de las personas).
Las principales herramientas que apoyan a un programa de gestión del
conocimiento son:
1. Data warehousing (Almacén de datos)
2. Data mining (Minería de datos)
3. Sistemas de soporte a la toma de decisiones
4. Groupware (Software colaborativo)
5. Sistemas de información para la dirección, todas ellas han de ser apoyadas
adecuadamente por los sistemas de gestión documental
8. Minería de datos
Data mining
Exploration de données
Prof. Dr. José Pino Díaz
Departamento de Historia del Arte
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
9. Databases
Una base de datos es un conjunto de información estructurada en registros
y almacenada en un soporte electrónico legible por ordenador.
• Cada registro constituye una unidad autónoma de información que
puede a su vez estar estructurada en diferentes campos o tipos de
datos que se recogen en la base de datos
10. Creación de nuevo conocimiento a partir de bases
de datos bibliográficas
(Knowledge Discovery in Databases, KDD)
11. Data Mining, a KDD Process
Data mining: the core of
Knowledge Discovery Pattern Evaluation
Databases process.
Data Mining
Task-relevant Data
Data Selection
Data Preprocessing
Data Warehouse
Data Cleaning
Data Integration
Databases
12. Minería de datos
La Minería de Datos es la extracción dirigida de la información existente en las bases de
datos con el fin de descubrir patrones, relaciones o asociaciones para generar nuevo
conocimiento.
Algunos tipos de DM:
- Web mining
- Web content mining (minería de contenido web)
- Web structure mining (minería de estructura web)
- Web usage mining (minería de uso web)
- Text mining (minería de datos textuales)
- Spatial data mining (minería de datos espaciales)
13. Data Mining: Confluence of Multiple Disciplines
Database
Statistics
Technology
Machine
Data Mining Visualization
Learning
Information Other
Science Disciplines
14. Data mining and Making decisions
Increasing potential
to support
making decisions End User
Making
Decisions
Data Presentation Business
Analyst
Visualization Techniques
Data Mining Data
Knowledge Databases Discovery Analyst
Data Exploration
Statistical Analysis, Querying and Reporting
Data Warehouses / Data Marts
OLAP, MDA DBA
Data Sources
Paper, Files, Information Providers, Database Systems, OLTP
15. Minería de textos
Text mining
Fouille de textes
Prof. Dr. José Pino Díaz
Departamento de Historia del Arte
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
16. Text mining, a KDD Process
En 2001, Dow Chemicals se unió a Union Carbide Corporation (UCC). Esta unión requirió la
integración de 35.000 informes de UCC en el sistema de gestión del documentos de Dow. Dow
Chemicals eligió a la empresa ClearForest, líder en text-driven business solutions, para realizar la
integración de la colección de documentos. Usando tecnología ad-hoc se identificaron sustancias
químicas, productos, empresas, centros y personas. Esto permitió que Dow Chemicals agregara
más de 80 años de investigación de UCC a su sistema de gestión de información y
aproximadamente 100.000 nuevas sustancias químicas a su registro. Cuando el proyecto se
completó, se estimó que Dow Chemicals ahorró casi 3 millones de dólares y que el tiempo
empleado en clasificar los documentos se redujo un 50% y los errores de datos entre un 10-15%.
23. Text mining:
Concept linckage
Una aplicación muy popular del text mining es relatada en Hearst (Untangling Text Data Mining, 1999), Don Swanson intenta
extraer información derivada de coleccionesde texto. Teniendo en cuenta que los expertos sólo pueden leer una pequeña
parte de lo que se publica en su campo, por lo general no se dan cuenta de los nuevos desarrollos que se suceden en otros
campos.
Así, Swanson ha demostrado cómo cadenas de implicaciones causales dentro de la literatura médica pueden conducir a
hipótesis para enfermedades poco frecuentes, algunas de las cuales han recibido pruebas de soporte experimental.
Investigando las causas de la migraña, dicho investigador extrajo varias piezas de evidencia a partir de títulos de artículos
presentes en la literatura biomédica. Algunas de esas claves fueron:
• El estrés está asociado con la migraña.
• El estrés puede conducir a la pérdida de magnesio.
• Los bloqueadores de canales de calcio previenen algunas migrañas.
• El magnesio es un bloqueador natural del canal de calcio.
• La depresión cortical diseminada (DCD) está implicada en algunas migrañas.
• Los niveles altos de magnesio inhiben la DCD.
• Los pacientes con migraña tienen una alta agregación plaquetaria.
• El magnesio puede suprimir la agregación plaquetaria.
Estas claves sugieren que la deficiencia de magnesio podría representar un papel en algunos tipos de migraña, una hipótesis
que no existía en la literatura y que Swanson encontró mediante esas ligas. De acuerdo con Swanson (Swanson y otros,
1994), estudios posteriores han probado experimentalmente esta hipótesis obtenida por text mining con buenos
resultados.
“Data mining: torturando a los datos hasta que confiesen”.
http://www.uoc.edu/molina1102/esp/art/molina1102/molina1102.html
31. Teoría Actor-Red
Actor-network theory
Théorie de l’acteur-Réseau
Prof. Dr. José Pino Díaz
Departamento de Historia del Arte
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
32. Conocimiento Científico y Tecnológico
Teoría Actor-Red
• Filosofía de las Ciencias (Michel Serres)
• Sociología del Conocimiento (David Bloor)
• Sociología de la Ciencia y de la Técnica (Michel Callon, Bruno
Latour)
• Sociología de la Traducción
• Sociología de las Asociaciones
• Teoría Actor-Red (M. Callon, J.P. Courtial, B. Latour, etc.)
“ … en la construcción social de un hecho científico intervienen entidades humanas y no humanas y el
proceso continuo de transformación o traducción de las relaciones establecidas entre tales entidades
da como resultado una red en continuo cambio …”
33. Teoría Actor-Red
El desarrollo en los años ochenta de la
Sociología de las Ciencias y Técnicas, Sociología
de la Traducción o Sociología de las
Asociaciones por Michel Callon y Bruno Latour
(Centre de Sociologie de l’Innovation, Paris) a
partir de recursos conceptuales, entre otros, de
Michel Serres (Filosofía de las Ciencias) y de
David Bloor (Sociología del Conocimiento), tiene
su exponente en la Teoría Actor-Red (ANT en
inglés), según la cual en la construcción social
de un hecho científico intervienen entidades
humanas y no humanas y el proceso continuo
de transformación o traducción de las
relaciones establecidas entre tales entidades da
como resultado una red en continuo cambio;
entendida ésta como una malla formada por
nudos (actores) enlazados entre sí (relaciones
que establecen entre ellos).
34. Redes Tecnocientíficas
Se emplea el concepto de “red tecnocientífica” tal como fue planteado por
Latour en 1983, es decir como la forma abreviada de “red de ciencia y
tecnología”
La Teoría Actor-Red es útil para describir las complejas relaciones que se
establecen en las redes de la Ciencia y Tecnología, así como las de la Tecnociencia
(Echevarría y González, 2009), entendida ésta como una modalidad de la
actividad científica y tecnológica fruto de la hibridación entre Ciencia y
Tecnología.
Así cualquier red de la Tecnociencia (Latour, 1983) está formada por un conjunto
de actores y un conjunto de relaciones establecidas entre ellos en un periodo
temporal concreto. Con el tiempo los actores y las relaciones cambian y dan lugar
a nuevas redes y así se suceden unos a otros a lo largo del periodo de análisis.
Esta teoría también llamada Sociología de la Traducción (entendida traducción
como conversión, transformación, variación o cambio), estudia los cambios que
se producen en las redes de conocimiento tecnocientífico.
35. Análisis Estratégico
El Análisis Estratégico consiste en esencia en la identificación y tipificación de los
actores y las relaciones fuertes; se trata de una “reducción de la complejidad
conservando lo fundamental”.
La Vigilancia Estratégica Científica y Tecnológica es el conjunto de tareas que
buscan “proporcionar buena información a la persona idónea en el momento
adecuado” y en el lugar adecuado; buena información sobre el entorno científico
y tecnológico de la organización.
La Planificación Estratégica es el “principal instrumento para la gestión de una
organización a corto plazo, 2 ó 3 años”; es una herramienta para la mejora
continua y la innovación en la organización.
38. Sistemas de conocimiento
Knowledge-based systems
Système d'analyse d'information
Prof. Dr. José Pino Díaz
Departamento de Historia delArte
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
39. Sistemas de conocimiento
Los sistemas de conocimiento son sistemas expertos ideados para crear nuevo conocimiento a partir
del conocimiento explícito presente en los documentos de las bases de datos. Siguen el proceso KDD en sus
diferentes fases. Tienen su origen en los softwares cienciométricos desarrollados para facilitar el análisis de
grandes conjuntos documentales científicos o tecnológicos (artículos científicos, patentes, tesis doctorales, etc.).
Los sistemas de conocimiento son de gran utilidad para los equipos de inteligencia competitiva y de vigilancia
tecnológica de las organizaciones ya que proporcionan informes, diagramas, gráficos y mapas muy apreciados en
la toma de decisiones estratégicas. La evaluación de redes de conocimiento se beneficia de la existencia de
sistemas de conocimiento desarrollados para transformar la información en conocimiento, procesando de una
manera rápida y controlada ingentes conjuntos documentales y creando nuevo conocimiento a partir de ellos.
La ingeniería del conocimiento es la rama de la inteligencia artificial que tiene por objetivo la creación de
indicadores, métodos e instrumentos de naturaleza matemática, informática y lingüística, para el análisis y la
representación cartográfica de la información científica y técnica.
40. Henoch
French or English Lexicons or
text-data terminological
resources
Dataset or Corpus Clustering DBMS-R
Term Extraction
and
And
Bibliometric Mapping
Indexation
statistics WWW
Server
SDOC
MIRIAD ILC NEURODOC HENOCH
Mac PC WS
40
41. Stanalyst
Bases de datos Recursos terminológicos
1 2 3 4
CORPUS BIBLIOMETRIA INDIZACION INFOMETRIA
Interrogación Estadísticas Manual o Clasificación y
y Datos descriptivas Automática Cartografía
Proyecto
Acceso e identificación
Navigador – Interface usuario
Esquema del Sistema de Conocimiento Stanalyst (Polanco, 2006). El módulo
“Infometría” de Stanalyst es un sistema de clasificación automática basado en dos
programas alternativos, Neurodoc (redes neuronales) y Sdoc (análisis de palabras
asociadas). Tomado de:
http://www.cincel.cl/documentos/Recursos/STANALYST2006.ppt
42. CoPalRed
Copalred es un sistema de conocimiento (herramienta de Ingeniería del Conocimiento) creado en el año 2003
por Rafael Bailón-Moreno, basado en el análisis de palabras asociadas y que tiene su antecedente en Leximappe,
software desarrollado por Whittaker, Law, Courtial y Bauin. Leximappe se ha mostrado útil en el análisis
estratégico de las redes de conocimiento científico y técnico. Leximappe y Copalred han sido empleados en el
estudio de grandes conjuntos documentales de diferentes disciplinas académicas: Arqueología, Ingeniería
Química, Fisioterapia, Conjuntos Difusos o Espacios Naturales Protegidos.
43. Análisis de Palabras Asociadas
Co-Word Analysis (1)
• El investigador transmite conocimiento tácito en los textos; éstos se
constituyen en conocimiento explícito. Este nuevo conocimiento se
analiza mediante métodos matemáticos, informáticos y lingüísticos, entre
ellos el método del análisis de palabras asociadas o co-word analysis.
• Se utiliza para estudiar la estructura y la dinámica del conocimiento en un
dominio documental concreto.
• Puede ser empleado a modo retrospectivo, “a tiempo real” o de forma
prospectiva.
• Se basa en dos teorías sociológicas: la Teoría Actor-Red y la Teoría de la
Traducción.
• Es un Índice Relacional de 2ª generación en Evaluación de la Ciencia
• Método de Knowledge Discovery in Databases (KDD)
• Se utiliza para estudiar las Redes Tecnocientíficas.
44. Análisis de Palabras Asociadas (2)
• Matriz de coocurrencias o matriz de adyacencia. Matriz simétrica que
muestra en los puntos de corte entre filas y columnas, cij, las
coocurrencias de los valores que encabezan cada fila i y cada columna j.
• Índice de equivalencia o de asociación entre las palabras i y j.
donde: eij.- Indice de equivalencia o de asociación entre las palabras i y j
Cij.- Co-ocurrencia de las palabras i y j
Ci.- Ocurrencia de la palabra i
Cj.- Ocurrencia de la palabra j.
Los valores de eij oscilan entre 0 y 1. Cuando dos palabras no aparecen
nunca juntas, su coocurrencia es nula, el índice de equivalencia vale cero.
Este índice es independiente del tamaño de la muestra.
46. Sistema de conocimiento Redes 2005
(Text mining: Clustering + Information visualization)
Vídeo-captura de pantalla que muestra el funcionamiento del sistema de
conocimiento Redes 2005