Big Data para la Gestión del Conocimiento
Laurie V. García Rodríguez
Universidad Distrital, Ingeniería Industrial,
Bogotá, Colombia
laury-1997@hotmail.com
Eva E. Martínez Castillo
Universidad Distrital, Ingeniería Industrial,
Bogotá, Colombia
estefania.castillo212@gmail.com
RESUMEN
El Big Data se destaca por ser una tecnología revolucionaria para las ciencias de la información debido a que ha
facilitado el arte de manejar grandes cantidades de datos, provenientes de diferentes fuentes que hacen parte de la
rutina del hombre. Se ha convertido en una herramienta fundamental para las organizaciones por su arquitectura
diseñada para la manipulación y almacenamiento de grandes volúmenes de información, facilitando la extracción de
conocimiento, el proceso de toma de decisiones y creación de estrategias exitosas para las diferentes áreas de la
compañía. Su constante evolución, en conjunto con las ciencias y tecnologías para el tratamiento de datos, ha
ampliado su campo de aplicación en áreas como la salud, la Inteligencia Artificial, ingeniería, administración,
Marketing, Comercio Electrónico, la gestión del conocimiento, entre otros. Este último emplea los grandes datos,
proporcionados por las empresas, para facilitar el proceso de toma de decisiones dentro de las mismas, aprovechando
al máximo el capital intelectual para interpretar y generar conocimiento sobre la organización.
Palabras claves: ​Análisis, Big Data, Conocimiento, Datos, Gestión del conocimiento, Implementación, Modelo.
ABSTRACT
Big Data stands out for being a revolutionary technology for information science because it has facilitated the art of
handling large amounts of data, coming from different sources that are part of man´s routine. It has become a
fundamental tool for organizations because of its architecture designed for the manipulation and storage of large
volumes of information, facilitating the extraction of knowledge, the decision-making process and the creation of
successful strategies for the different areas of the company. Its constant evolution, with the sciences and technologies
for data processing, has expanded its field of application in areas such as health, Artificial Intelligence, engineering,
administration, Marketing, Electronic Commerce, knowledge management, among others. Last one uses the Big
Data, provided by the companies, to facilitate the process of making decisions within them, improving the most of
the intellectual capital to interpret and generate knowledge about the organization.
Keywords: ​Analysis, Big Data, Data, Knowledge, Knowledge Management, Implementation, Model.
1
1. INTRODUCCION
El hombre siempre ha tenido la necesidad de conocer su entorno, conocer a quienes lo rodean y conocerse a sí
mismo, lo cual ha incentivado su deseo de crear, modificar y optimizar métodos, técnicas e incluso ciencias para
facilitar la recolección, tratamiento, análisis y almacenamiento de las grandes cantidades de datos que se producen en
su cotidianidad. Su iniciativa ha dado como resultado la creación de diferentes tecnologías para la manipulación de la
información. Una de ellas es el Big Data, que permite el tratamiento de un gran volumen de datos, simplificando la
interpretación de los mismos y facilitando los procesos de toma de decisiones en diferentes disciplinas, ciencias y en
las organizaciones. Dicha tecnología ha evolucionado de forma progresiva como una herramienta para suplir aquellas
necesidades del ser humano relacionadas con la obtención, análisis y gestión de la información, que surgen a diario
como resultado del constante desarrollo de la sociedad.
Sus fundamentos se encuentran en la idea de Business Intelligence, utilizada para analizar la información y
solucionar los problemas que surgen en el entorno de las empresas y sus negocios. Posteriormente, con el
surgimiento de Internet en la década de los 90´s inició la acumulación de grandes volúmenes de datos, subidos a
diario por gran cantidad de usuarios interconectados en la red. En 1990 la popularidad de la “World Wide Web
(WWW)” hizo que se acumularan los datos provenientes de la Inteligencia de Negocios, utilizada en diferentes
compañías alrededor del mundo, creciendo así la cantidad de información y dificultando su tratamiento, análisis y
gestión, surgiendo el Big Data como una herramienta para facilitar las tareas mencionadas.
Actualmente, la Inteligencia de Datos es la base de una arquitectura diseñada para extraer conocimiento y valor de un
grupo de datos amplio y variado. Hace parte de la nueva generación, conocida como La Cuarta Revolución, en donde
el desarrollo económico y social se basa en el manejo de las Tecnologías de la Información y Comunicación (TIC’s),
las tecnologías 4G para la transmisión de datos a través de teléfonos inteligentes, el Internet de las cosas, cómputo en
la nube. Esta Revolución se caracteriza principalmente por la optimización de procesos, recursos mediante la
recolección y el aprovechamiento de los datos en campos como la medicina, administración, turismo, ingeniería,
estadística, Marketing, e-Commerce, la gestión del conocimiento, entre otros.
Cabe resaltar que el uso de grandes datos contribuye con los procedimientos y procesos llevados a cabo en las
organizaciones para el manejo y gestión de la información relevante, con el fin de generar conocimiento sobre cada
una de las áreas, departamentos, recursos y demás variables que influyen en la correcta operación de las compañías.
En el presente artículo de investigación se analizará y presentará la relación existente entre la gestión el
conocimiento y el Big Data. Para esto se diseña un modelo que represente adecuadamente dicha relación, y a su vez
sea aplicable en las organizaciones en sus procesos de generación de conocimiento a partir de los datos disponibles
en las mismas.
2. JUSTIFICACIÓN
El análisis e investigación sobre el Big Data en la gestión del conocimiento son realizados para identificar la relación
existente entre estos elementos y la importancia de los grandes volúmenes de datos para la generación, comunicación
y transformación de conocimiento en las organizaciones a partir de la identificación de patrones y tendencias, la
extracción de valor y análisis del comportamiento de las variables presentes en los datos, que impactan de alguna
forma el entorno organizacional.
Partiendo de dicha relación entre la Inteligencia de Datos y el campo estudiado, se diseña y sustenta un modelo, con
el fin de proporcionar un enfoque y una arquitectura sobre el manejo de cantidades masivas de información en las
organizaciones para generar conocimiento, es decir, se representa la aplicación del Big Data en los procesos llevados
a cabo en las empresas para la modificación y/o creación de conocimiento. Dicho modelo deberá ser universal, es
decir, aplicable a cualquier organización y además deberá facilitar la visualización de los nodos, indicadores y sus
relaciones, elementos que constituyen el proceso de captura de información y extracción de valor dentro de las
compañías para incrementar su recurso intelectual​.
2
3. ALGUNOS ASPECTOS SOBRE EL BIG DATA Y LA GESTIÓN DEL CONOCIMIENTO
Definición de Big Data
El ​Big Data, grandes datos o Inteligencia de Datos es una tecnología utilizada para la recopilación de un volumen
masivo de datos, estructurados, semi-estructurados y no estructurados, que no pueden ser procesados ni estudiados a
través de herramientas convencionales, como las bases de datos y el software de procesamiento de datos, debido a
que sus recursos son limitados para el manejo de dichas cantidades. En síntesis, la analítica de datos consiste en
recolectar, almacenar, limpiar, organizar y preparar grandes cantidades de datos para analizar tendencias o relaciones
entre ellos, lo cual dificulta la tarea de administrarlos a través de bases de datos tradicionales [1]
El concepto de Big Data se caracteriza a través de Las Siete V´s, que pueden clasificarse en cuatro magnitudes,
conocidas como las 4 V´s del Big Data, relacionadas con el volumen, variedad, velocidad y veracidad; agregando la
variabilidad, visualización y, la más importante en este estudio,​ el valor de los datos​.
Definición de Gestión del conocimiento
Por otra parte, la ​gestión del conocimiento hace referencia al proceso de captura, distribución y buen uso del
conocimiento en el entorno organizacional,el cual no sólo genera valor económico para la empresa, sino también es
el activo diferenciador, que en la era de la información le da valor capital intelectual de la compañía.
El aprovechamiento del conocimiento se ha convertido en una herramienta poderosa para explotar el potencial de las
organizaciones ya que proporciona una visión amplia sobre su cultura organizacional y su funcionamiento. La
consolidación de este tipo de cultura dentro de una compañía muestra que se tiene un conocimiento explícito sobre
su planeación estratégica y funcionamiento. [2] De igual manera, la gestión de la información y conocimiento genera
componentes novedosos, es decir, innovación, la cual proporciona un valor agregado a cada una de las funciones,
operaciones, recursos, productos y demás elementos propios de la organización.
Relación entre el Big Data y la Gestión del conocimiento.
En la Fig. 1 se pueden observar las fases del proceso de extracción de conocimiento, a partir de un gran conjunto de
datos provenientes de todas partes de la organización. En primera instancia es necesario realizar una exploración en
los datos, depurando o seleccionando aquellos que son significativos para la empresa, formando pequeños conjuntos
homogéneos que por lo general no se encuentran estructurados. Posteriormente, en la fase de pre-procesamiento se
realiza un alistamiento de los datos para pasar a la etapa de transformación, en donde se utilizan técnicas y métodos
propios de tecnologías complementarias, como por ejemplo el Machine Learning o Aprendizaje Automático, para
lograr definir una estructura y, a su vez, un ordenamiento de los datos, convirtiéndolos en información útil.
Los datos transformados son analizados con ayuda de la Minería de Datos, también denominada ​Data Mining, para
explorarlos y extraer valor de ellos, identificando patrones y tendencias, que posteriormente se convierten en
modelos. La interpretación y evaluación de dichos modelos conllevan a la extracción del elemento más valioso, en
este caso, ​el conocimiento, ​el cual debe ser de fácil acceso para cualquier miembro de la compañía, especialmente
para llevar a cabo el proceso de toma de decisiones, y debe incluirse entre los activos más valiosos de la misma​.
En síntesis, el Big Data constituye la base de la gestión del conocimiento debido a que conserva los datos disponibles
de la organización, facilitando su acceso, manipulación, ordenamiento y transformación en tiempo real para los
diferentes procesos llevados a cabo en la compañía con el fin de incrementar, aprovechar y transformar
positivamente su capital intelectual, a partir de la explotación del nuevo conocimiento que surge del proceso
mostrado. Cabe resaltar que para la correcta ejecución de dicho proceso es necesario contar con facilitadores e
indicadores que muestren el rendimiento, la eficiencia con la cual se manejan los recursos, en este caso la
información y tecnologías, y los resultados generados por las actividades y procesos de gestión, no sólo en materia
de conocimiento, sino también el valor económico obtenido por la organización al hacer uso adecuado de su
información para la creación de estrategias empresariales.
3
Fig. 1. Proceso de extracción de conocimiento a partir del Big Data. Fayyad, U., Piatetsky-Shapiro,G., Smyth, P. (1996). From Data Mining to
Knowledge Discovery in Databases.
4. METODOLOGÍA
En primera instancia se analizó la relación entre el Big Data y la gestión del conocimiento. Es importante resaltar que
la gestión del conocimiento es esencial para cualquier organización en la que el conocimiento sea un recurso clave.
Como se pudo observar el conocimiento nace del correcto procesamiento de los datos, y la clasificación de estos
puede ser menos tediosa cuando se cuenta con tecnología como Big Data. En primera instancia se debe tener la
recolección de los datos a analizar y clasificar, es aquí donde la Big Data cumple el papel principal, pues se encarga
de recolectar, almacenar, limpiar y preparar grandes cantidades de datos para su posterior procesamiento hasta que
finalmente logran convertirse en conocimiento.
Se puede afirmar que el Big Data conforma una arquitectura conformada por receptores de datos distribuidos en cada
una de las áreas de la empresa y en el sector externo a ella. Una vez se han transformado los datos en información y
posteriormente en conocimiento, la empresa debe hacer uso de las Tecnologías de la Información y Comunicación
(TIC), modelos, arquitecturas y una metodología especial para redistribuir dicho conocimiento a través de la
organización, como se muestra en el modelo propuesto.
A partir del establecimiento del Big Data en la gestión del conocimiento, se identificaron las variables fundamentales
del modelo, que son:
● Datos y su cantidad: Son las unidades básicas de información producidas a diario en cada una de las áreas
de la compañía en grandes cantidades.
● Fuentes de información: Son los diferentes receptores y generadores de datos e información distribuidos
dentro y fuera de la organización..
● Tecnología Big Data: Tecnología que reúne grandes volúmenes de datos para almacenarlos en caso de ser
requeridos por los miembros de la organización.
● Herramientas de captura datos y distribución del conocimiento: Hace referencia a las herramientas
utilizados por el Big Data para la captura de datos, información, los métodos y tecnologías complementarias
para la generación, tratamiento y distribución de conocimiento a través de la empresa.
● Capacidad de almacenamiento de datos: Capacidad de almacenamiento que posee la infraestructura
tecnológica de la organización.
4
Por último se realiza la validación del modelo mediante su implementación en un banco a manera de ejemplo. La
aplicación de la representación hecha permite evaluar si abarca adecuadamente las variables identificadas como
esenciales, así como su concordancia con la realidad.
5. MODELO
Fig.2. Modelo de Gestión del conocimiento aplicado a Big Data. Fuente propia.
En la Fig. 2. se puede apreciar que el modelo de gestión del conocimiento está centrado en la Big Data y se plantean
cinco nodos principales: Datos, Fuentes de información, Tecnología, Herramientas y Socialización, sabiendo de
antemano que los nodos son los recursos donde se genera o se transfiere el conocimiento, en este caso, estas son las
bases del conocimiento del Big Data. En el centro de cada uno de los conjuntos de nodos asociados se encuentran los
indicadores, encargados de medir el desempeño de dichos conjuntos.
Como se puede observar entre cada nodo se encuentran los facilitadores, que son los elementos que van a permitir
impulsar las acciones; se tiene, en medio de datos y fuentes de información, la “​Recolección primaria”, ​de aquí se
desprende el primer encuentro con los datos provenientes de diferentes fuentes en la compañía ; entre fuentes de
información y tecnología se tiene “​Modus operandi”​, una vez capturados los datos, los pilares del Big Data serán los
encargados de facilitar la recolección, limpieza y clasificación de los datos; entre tecnología y herramientas se
encuentra “​Facilitadores de procesos”, ​como se puede apreciar una vez que la tecnología Big Data ha elaborado la
correcta clasificación de los datos, se hace uso de las herramientas para facilitar el procedimiento que lleva los datos
a transformarse en información y posteriormente en conocimiento; por último, entre herramientas y socialización
está “​Posibles nuevos aportes a dar a conocer”​, es aquí donde ya los datos se han transformado en conocimiento y la
labor de la Big Data está completa, siendo el momento adecuado para que estos aportes se transmitan a través de la
Gestión del conocimiento y formen parte del capital intelectual y cultura organizacional.
Sin embargo, en una perspectiva más detallada se tiene que los nodos anteriormente mencionados desprenden entre
sí nuevos nodos de segundo grado, los cuales hacen parte fundamental de la correcta ejecución del modelo de gestión
5
del conocimiento. Por ejemplo, para el nodo “​Datos” ​se derivan las clases de datos que se pueden encontrar en la
Big Data, tales como simples, complejos, variables; las variables pueden ser cualitativas o cuantitativas. Esto mismo
ocurre con todos los nodos, se van desprendiendo conforme a su necesidad, y así en su totalidad conforman un
sistema de gestión del conocimiento beneficioso para cualquier compañía.
Fig. 3. Arquitectura de Ovum aplicada a la Big Data. Fuente propia.
Una organización inteligente es la que tiene la capacidad de detectar quién es el que tiene el mayor conocimiento
para desempeñar determinada actividad y así mismo, comparte ese conocimiento cuando y donde haga falta. Una
arquitectura es una manera estructural de desglosar desde las bases del conocimiento hasta cuando este conocimiento
se transmite entre los respectivos miembros de la organización.
La anterior arquitectura de ovum está aplicada a Big Data, esta parte del hecho de la primera recolección de datos
que se pueden dar por medio de datos históricos, redes sociales, rastreo electrónico, el portal de datos abiertos de la
Unión Europea, entre otros. Una vez obtenidos los datos se sigue al siguiente escalón, la infraestructura, en esta se
mencionan los principales componentes para una buena ejecución de Big Data como una memoria RAM con
suficiente capacidad de procesamiento, núcleo multiprocesos, entre otros. En la gestión de la información encierra la
manera correcta de ejecutar los datos anteriormente recolectados, se tienen bibliotecas especiales para Big Data,
además de múltiples lenguajes de programación como R y Python. La taxonomía corporativa se enfoca en los pilares
que se deben tener en cuenta para cumplir con los propósitos planteados, para Big Data se tienen las 7 V´s, que son
volumen de la información, velocidad de los datos, variabilidad de los datos, veracidad de los datos, visualización de
los datos y valor de los datos, este último, en este caso particular, es el más importante de todos.
Los servicios de gestión del conocimiento involucran a mayor potencial la gestión del conocimiento, ya que hace
énfasis en los modelos prácticos que esta puede implementar para alcanzar un nivel de optimización de los
conocimientos adquiridos. La interfaz en Big Data se adecua a la organización que planee usarla, no es lo mismo
6
usarla para transacciones en un banco, que usarla para la recolección de datos en una página web; este inciso tiene en
particular que se adapta al diseño de la organización. Por último, para el nivel de aplicación se puede optar por
cualquier organización que haga uso de grandes volúmenes de datos, como empresas comerciales, entidades
públicas, sitios web, entre muchos otros.
6. VALIDACIÓN DEL MODELO
Implementación del Modelo de Gestión del conocimiento de Big Data en una organización.(Banco)
Como se pudo observar anteriormente el Modelo de Gestión del conocimiento de Big Data y su Arquitectura de
Ovum correspondiente puede aplicarse a cualquier entidad que haga uso de grandes cantidades de datos. Como un
ejemplo práctico se tiene a continuación la Arquitectura de Ovum de la Big Data aplicada a un banco para la
validación del modelo.
Fig. 4. Arquitectura de Ovum Big Data aplicada a un banco. Fuente propia.
La implementación realizada para el banco nos revela que las fuentes de información son muy diversas, entre ellas
encontramos los datos personales que proporcionan los clientes, las redes sociales con las que se pueden interactuar,
rastreo electrónico por medio del correo electrónico y muy importante el historial de Datacrédito, esto ayuda a
analizar si el usuario es un cliente fiable o no. Para la infraestructura se encuentra que los bancos suelen tener
divisiones en su interior para poder clasificar el tipo de solicitud de los usuarios, es decir, los datos que estos
proporcionan, y así garantizar que los procesos sean más eficientes y rápidos. En la gestión de la información y
7
procesos se cuenta con formatos especializados para el correcto diligenciamiento de los datos según sea la necesidad
del cliente, esto también garantiza una correcta clasificación y optimización de tiempos y recursos. En la taxonomía
corporativa es de resaltar el papel del gerente general, él es quien se encarga de la correcta utilización de los datos
recolectados, es la fuente de “conocimiento” de la organización, así mismo es su deber asignar las tareas
correspondientes y velar por el buen uso de la información. En los servicios de Gestión del conocimiento se
encuentran los servicios de procesamiento en donde se efectúa el procesamiento de los datos en sus tres etapas, como
lo son su recopilación, posteriormente se transforman en información y por último en conocimiento, esto se ve
evidenciado en cualquier solicitud realizada por un usuario en el banco, primero se recopila sus datos, se verifican y
se crea una respuesta. Para la interfaz surge con gran auge la implementación de Big Data, la interfaz de un banco
debe contar con un gran procesador de datos, los cuales los recolecta, clasifica, limpia, organiza y depura para su
posterior análisis y uso, estas clasificaciones pueden ser en cuentas corrientes, cuentas de ahorro, préstamos,
certificados, entre muchos otros procesos. Por último, la aplicación como se describió recae en la Big Data y cómo
facilita este análisis, todo con el fin de Gestionar el conocimiento en la entidad a través de sus funcionarios y
clientes.
7. CONCLUSIONES
El modelo propuesto para la gestión del conocimiento, apoyada en la tecnología Big Data, representa la
infraestructura tecnológica ideal para las organizaciones que desean soportar sus diferentes procesos, especialmente
el de toma de decisiones, en el manejo y ordenamiento adecuado de sus datos para la generación de información y la
extracción de conocimiento útil. La aplicación de dicho modelo debe proporcionar una visión amplia sobre lo que
sucede dentro y fuera de la organización al identificarse en los datos patrones de comportamiento de las variables
fundamentales que constituyen la operación de la compañía.
Por otra parte, se representan las características que deben tener los grandes datos para que sean útiles para la Alta
Dirección, así como las diferentes herramientas estadísticas e informáticas que deberían ser utilizadas para que la
implementación del Big Data sea efectiva.
Un aspecto importante que se debe tener en cuenta es el proceso de socialización y distribución del conocimiento
generado mediante el uso de mecanismos de comunicación e implementación de recursos como las TIC´s. De igual
manera, es importante que exista un proceso de retroalimentación en el que los miembros de la organización
proporcionen ideas y opiniones sobre el capital intelectual resultante del tratamiento de datos, para con ello evaluar el
flujo de conocimiento, la confianza que pone la compañía en él, creándose así nueva información, formando un ciclo
continuo con conocimiento en movimiento para contribuir con la mejora continua del proceso de explotación de
datos y fortalecimiento de la cultura organizacional a través de la creación y/o transformación del conocimiento
contenido en ella.
REFERENCIAS
1. Armentia, G., Elcoro, I. Introducción al Big Data. ​Consultec. Empresa Digitala​, Vol. 1, (2017).
2. Nieves, Y., León, M. (2001). La gestión del conocimiento: una nueva perspectiva en la gerencia de las
organizaciones. ACIMED, pp. 121-126.
3. Fayyad, U., Piatetsky-Shapiro,G., Smyth, P. (1996). From Data Mining to Knowledge Discovery in Databases.
Al Magazine Vol. 17, No. 3.
8

Big Data en la gestión del conocimiento

  • 1.
    Big Data parala Gestión del Conocimiento Laurie V. García Rodríguez Universidad Distrital, Ingeniería Industrial, Bogotá, Colombia laury-1997@hotmail.com Eva E. Martínez Castillo Universidad Distrital, Ingeniería Industrial, Bogotá, Colombia estefania.castillo212@gmail.com RESUMEN El Big Data se destaca por ser una tecnología revolucionaria para las ciencias de la información debido a que ha facilitado el arte de manejar grandes cantidades de datos, provenientes de diferentes fuentes que hacen parte de la rutina del hombre. Se ha convertido en una herramienta fundamental para las organizaciones por su arquitectura diseñada para la manipulación y almacenamiento de grandes volúmenes de información, facilitando la extracción de conocimiento, el proceso de toma de decisiones y creación de estrategias exitosas para las diferentes áreas de la compañía. Su constante evolución, en conjunto con las ciencias y tecnologías para el tratamiento de datos, ha ampliado su campo de aplicación en áreas como la salud, la Inteligencia Artificial, ingeniería, administración, Marketing, Comercio Electrónico, la gestión del conocimiento, entre otros. Este último emplea los grandes datos, proporcionados por las empresas, para facilitar el proceso de toma de decisiones dentro de las mismas, aprovechando al máximo el capital intelectual para interpretar y generar conocimiento sobre la organización. Palabras claves: ​Análisis, Big Data, Conocimiento, Datos, Gestión del conocimiento, Implementación, Modelo. ABSTRACT Big Data stands out for being a revolutionary technology for information science because it has facilitated the art of handling large amounts of data, coming from different sources that are part of man´s routine. It has become a fundamental tool for organizations because of its architecture designed for the manipulation and storage of large volumes of information, facilitating the extraction of knowledge, the decision-making process and the creation of successful strategies for the different areas of the company. Its constant evolution, with the sciences and technologies for data processing, has expanded its field of application in areas such as health, Artificial Intelligence, engineering, administration, Marketing, Electronic Commerce, knowledge management, among others. Last one uses the Big Data, provided by the companies, to facilitate the process of making decisions within them, improving the most of the intellectual capital to interpret and generate knowledge about the organization. Keywords: ​Analysis, Big Data, Data, Knowledge, Knowledge Management, Implementation, Model. 1
  • 2.
    1. INTRODUCCION El hombresiempre ha tenido la necesidad de conocer su entorno, conocer a quienes lo rodean y conocerse a sí mismo, lo cual ha incentivado su deseo de crear, modificar y optimizar métodos, técnicas e incluso ciencias para facilitar la recolección, tratamiento, análisis y almacenamiento de las grandes cantidades de datos que se producen en su cotidianidad. Su iniciativa ha dado como resultado la creación de diferentes tecnologías para la manipulación de la información. Una de ellas es el Big Data, que permite el tratamiento de un gran volumen de datos, simplificando la interpretación de los mismos y facilitando los procesos de toma de decisiones en diferentes disciplinas, ciencias y en las organizaciones. Dicha tecnología ha evolucionado de forma progresiva como una herramienta para suplir aquellas necesidades del ser humano relacionadas con la obtención, análisis y gestión de la información, que surgen a diario como resultado del constante desarrollo de la sociedad. Sus fundamentos se encuentran en la idea de Business Intelligence, utilizada para analizar la información y solucionar los problemas que surgen en el entorno de las empresas y sus negocios. Posteriormente, con el surgimiento de Internet en la década de los 90´s inició la acumulación de grandes volúmenes de datos, subidos a diario por gran cantidad de usuarios interconectados en la red. En 1990 la popularidad de la “World Wide Web (WWW)” hizo que se acumularan los datos provenientes de la Inteligencia de Negocios, utilizada en diferentes compañías alrededor del mundo, creciendo así la cantidad de información y dificultando su tratamiento, análisis y gestión, surgiendo el Big Data como una herramienta para facilitar las tareas mencionadas. Actualmente, la Inteligencia de Datos es la base de una arquitectura diseñada para extraer conocimiento y valor de un grupo de datos amplio y variado. Hace parte de la nueva generación, conocida como La Cuarta Revolución, en donde el desarrollo económico y social se basa en el manejo de las Tecnologías de la Información y Comunicación (TIC’s), las tecnologías 4G para la transmisión de datos a través de teléfonos inteligentes, el Internet de las cosas, cómputo en la nube. Esta Revolución se caracteriza principalmente por la optimización de procesos, recursos mediante la recolección y el aprovechamiento de los datos en campos como la medicina, administración, turismo, ingeniería, estadística, Marketing, e-Commerce, la gestión del conocimiento, entre otros. Cabe resaltar que el uso de grandes datos contribuye con los procedimientos y procesos llevados a cabo en las organizaciones para el manejo y gestión de la información relevante, con el fin de generar conocimiento sobre cada una de las áreas, departamentos, recursos y demás variables que influyen en la correcta operación de las compañías. En el presente artículo de investigación se analizará y presentará la relación existente entre la gestión el conocimiento y el Big Data. Para esto se diseña un modelo que represente adecuadamente dicha relación, y a su vez sea aplicable en las organizaciones en sus procesos de generación de conocimiento a partir de los datos disponibles en las mismas. 2. JUSTIFICACIÓN El análisis e investigación sobre el Big Data en la gestión del conocimiento son realizados para identificar la relación existente entre estos elementos y la importancia de los grandes volúmenes de datos para la generación, comunicación y transformación de conocimiento en las organizaciones a partir de la identificación de patrones y tendencias, la extracción de valor y análisis del comportamiento de las variables presentes en los datos, que impactan de alguna forma el entorno organizacional. Partiendo de dicha relación entre la Inteligencia de Datos y el campo estudiado, se diseña y sustenta un modelo, con el fin de proporcionar un enfoque y una arquitectura sobre el manejo de cantidades masivas de información en las organizaciones para generar conocimiento, es decir, se representa la aplicación del Big Data en los procesos llevados a cabo en las empresas para la modificación y/o creación de conocimiento. Dicho modelo deberá ser universal, es decir, aplicable a cualquier organización y además deberá facilitar la visualización de los nodos, indicadores y sus relaciones, elementos que constituyen el proceso de captura de información y extracción de valor dentro de las compañías para incrementar su recurso intelectual​. 2
  • 3.
    3. ALGUNOS ASPECTOSSOBRE EL BIG DATA Y LA GESTIÓN DEL CONOCIMIENTO Definición de Big Data El ​Big Data, grandes datos o Inteligencia de Datos es una tecnología utilizada para la recopilación de un volumen masivo de datos, estructurados, semi-estructurados y no estructurados, que no pueden ser procesados ni estudiados a través de herramientas convencionales, como las bases de datos y el software de procesamiento de datos, debido a que sus recursos son limitados para el manejo de dichas cantidades. En síntesis, la analítica de datos consiste en recolectar, almacenar, limpiar, organizar y preparar grandes cantidades de datos para analizar tendencias o relaciones entre ellos, lo cual dificulta la tarea de administrarlos a través de bases de datos tradicionales [1] El concepto de Big Data se caracteriza a través de Las Siete V´s, que pueden clasificarse en cuatro magnitudes, conocidas como las 4 V´s del Big Data, relacionadas con el volumen, variedad, velocidad y veracidad; agregando la variabilidad, visualización y, la más importante en este estudio,​ el valor de los datos​. Definición de Gestión del conocimiento Por otra parte, la ​gestión del conocimiento hace referencia al proceso de captura, distribución y buen uso del conocimiento en el entorno organizacional,el cual no sólo genera valor económico para la empresa, sino también es el activo diferenciador, que en la era de la información le da valor capital intelectual de la compañía. El aprovechamiento del conocimiento se ha convertido en una herramienta poderosa para explotar el potencial de las organizaciones ya que proporciona una visión amplia sobre su cultura organizacional y su funcionamiento. La consolidación de este tipo de cultura dentro de una compañía muestra que se tiene un conocimiento explícito sobre su planeación estratégica y funcionamiento. [2] De igual manera, la gestión de la información y conocimiento genera componentes novedosos, es decir, innovación, la cual proporciona un valor agregado a cada una de las funciones, operaciones, recursos, productos y demás elementos propios de la organización. Relación entre el Big Data y la Gestión del conocimiento. En la Fig. 1 se pueden observar las fases del proceso de extracción de conocimiento, a partir de un gran conjunto de datos provenientes de todas partes de la organización. En primera instancia es necesario realizar una exploración en los datos, depurando o seleccionando aquellos que son significativos para la empresa, formando pequeños conjuntos homogéneos que por lo general no se encuentran estructurados. Posteriormente, en la fase de pre-procesamiento se realiza un alistamiento de los datos para pasar a la etapa de transformación, en donde se utilizan técnicas y métodos propios de tecnologías complementarias, como por ejemplo el Machine Learning o Aprendizaje Automático, para lograr definir una estructura y, a su vez, un ordenamiento de los datos, convirtiéndolos en información útil. Los datos transformados son analizados con ayuda de la Minería de Datos, también denominada ​Data Mining, para explorarlos y extraer valor de ellos, identificando patrones y tendencias, que posteriormente se convierten en modelos. La interpretación y evaluación de dichos modelos conllevan a la extracción del elemento más valioso, en este caso, ​el conocimiento, ​el cual debe ser de fácil acceso para cualquier miembro de la compañía, especialmente para llevar a cabo el proceso de toma de decisiones, y debe incluirse entre los activos más valiosos de la misma​. En síntesis, el Big Data constituye la base de la gestión del conocimiento debido a que conserva los datos disponibles de la organización, facilitando su acceso, manipulación, ordenamiento y transformación en tiempo real para los diferentes procesos llevados a cabo en la compañía con el fin de incrementar, aprovechar y transformar positivamente su capital intelectual, a partir de la explotación del nuevo conocimiento que surge del proceso mostrado. Cabe resaltar que para la correcta ejecución de dicho proceso es necesario contar con facilitadores e indicadores que muestren el rendimiento, la eficiencia con la cual se manejan los recursos, en este caso la información y tecnologías, y los resultados generados por las actividades y procesos de gestión, no sólo en materia de conocimiento, sino también el valor económico obtenido por la organización al hacer uso adecuado de su información para la creación de estrategias empresariales. 3
  • 4.
    Fig. 1. Procesode extracción de conocimiento a partir del Big Data. Fayyad, U., Piatetsky-Shapiro,G., Smyth, P. (1996). From Data Mining to Knowledge Discovery in Databases. 4. METODOLOGÍA En primera instancia se analizó la relación entre el Big Data y la gestión del conocimiento. Es importante resaltar que la gestión del conocimiento es esencial para cualquier organización en la que el conocimiento sea un recurso clave. Como se pudo observar el conocimiento nace del correcto procesamiento de los datos, y la clasificación de estos puede ser menos tediosa cuando se cuenta con tecnología como Big Data. En primera instancia se debe tener la recolección de los datos a analizar y clasificar, es aquí donde la Big Data cumple el papel principal, pues se encarga de recolectar, almacenar, limpiar y preparar grandes cantidades de datos para su posterior procesamiento hasta que finalmente logran convertirse en conocimiento. Se puede afirmar que el Big Data conforma una arquitectura conformada por receptores de datos distribuidos en cada una de las áreas de la empresa y en el sector externo a ella. Una vez se han transformado los datos en información y posteriormente en conocimiento, la empresa debe hacer uso de las Tecnologías de la Información y Comunicación (TIC), modelos, arquitecturas y una metodología especial para redistribuir dicho conocimiento a través de la organización, como se muestra en el modelo propuesto. A partir del establecimiento del Big Data en la gestión del conocimiento, se identificaron las variables fundamentales del modelo, que son: ● Datos y su cantidad: Son las unidades básicas de información producidas a diario en cada una de las áreas de la compañía en grandes cantidades. ● Fuentes de información: Son los diferentes receptores y generadores de datos e información distribuidos dentro y fuera de la organización.. ● Tecnología Big Data: Tecnología que reúne grandes volúmenes de datos para almacenarlos en caso de ser requeridos por los miembros de la organización. ● Herramientas de captura datos y distribución del conocimiento: Hace referencia a las herramientas utilizados por el Big Data para la captura de datos, información, los métodos y tecnologías complementarias para la generación, tratamiento y distribución de conocimiento a través de la empresa. ● Capacidad de almacenamiento de datos: Capacidad de almacenamiento que posee la infraestructura tecnológica de la organización. 4
  • 5.
    Por último serealiza la validación del modelo mediante su implementación en un banco a manera de ejemplo. La aplicación de la representación hecha permite evaluar si abarca adecuadamente las variables identificadas como esenciales, así como su concordancia con la realidad. 5. MODELO Fig.2. Modelo de Gestión del conocimiento aplicado a Big Data. Fuente propia. En la Fig. 2. se puede apreciar que el modelo de gestión del conocimiento está centrado en la Big Data y se plantean cinco nodos principales: Datos, Fuentes de información, Tecnología, Herramientas y Socialización, sabiendo de antemano que los nodos son los recursos donde se genera o se transfiere el conocimiento, en este caso, estas son las bases del conocimiento del Big Data. En el centro de cada uno de los conjuntos de nodos asociados se encuentran los indicadores, encargados de medir el desempeño de dichos conjuntos. Como se puede observar entre cada nodo se encuentran los facilitadores, que son los elementos que van a permitir impulsar las acciones; se tiene, en medio de datos y fuentes de información, la “​Recolección primaria”, ​de aquí se desprende el primer encuentro con los datos provenientes de diferentes fuentes en la compañía ; entre fuentes de información y tecnología se tiene “​Modus operandi”​, una vez capturados los datos, los pilares del Big Data serán los encargados de facilitar la recolección, limpieza y clasificación de los datos; entre tecnología y herramientas se encuentra “​Facilitadores de procesos”, ​como se puede apreciar una vez que la tecnología Big Data ha elaborado la correcta clasificación de los datos, se hace uso de las herramientas para facilitar el procedimiento que lleva los datos a transformarse en información y posteriormente en conocimiento; por último, entre herramientas y socialización está “​Posibles nuevos aportes a dar a conocer”​, es aquí donde ya los datos se han transformado en conocimiento y la labor de la Big Data está completa, siendo el momento adecuado para que estos aportes se transmitan a través de la Gestión del conocimiento y formen parte del capital intelectual y cultura organizacional. Sin embargo, en una perspectiva más detallada se tiene que los nodos anteriormente mencionados desprenden entre sí nuevos nodos de segundo grado, los cuales hacen parte fundamental de la correcta ejecución del modelo de gestión 5
  • 6.
    del conocimiento. Porejemplo, para el nodo “​Datos” ​se derivan las clases de datos que se pueden encontrar en la Big Data, tales como simples, complejos, variables; las variables pueden ser cualitativas o cuantitativas. Esto mismo ocurre con todos los nodos, se van desprendiendo conforme a su necesidad, y así en su totalidad conforman un sistema de gestión del conocimiento beneficioso para cualquier compañía. Fig. 3. Arquitectura de Ovum aplicada a la Big Data. Fuente propia. Una organización inteligente es la que tiene la capacidad de detectar quién es el que tiene el mayor conocimiento para desempeñar determinada actividad y así mismo, comparte ese conocimiento cuando y donde haga falta. Una arquitectura es una manera estructural de desglosar desde las bases del conocimiento hasta cuando este conocimiento se transmite entre los respectivos miembros de la organización. La anterior arquitectura de ovum está aplicada a Big Data, esta parte del hecho de la primera recolección de datos que se pueden dar por medio de datos históricos, redes sociales, rastreo electrónico, el portal de datos abiertos de la Unión Europea, entre otros. Una vez obtenidos los datos se sigue al siguiente escalón, la infraestructura, en esta se mencionan los principales componentes para una buena ejecución de Big Data como una memoria RAM con suficiente capacidad de procesamiento, núcleo multiprocesos, entre otros. En la gestión de la información encierra la manera correcta de ejecutar los datos anteriormente recolectados, se tienen bibliotecas especiales para Big Data, además de múltiples lenguajes de programación como R y Python. La taxonomía corporativa se enfoca en los pilares que se deben tener en cuenta para cumplir con los propósitos planteados, para Big Data se tienen las 7 V´s, que son volumen de la información, velocidad de los datos, variabilidad de los datos, veracidad de los datos, visualización de los datos y valor de los datos, este último, en este caso particular, es el más importante de todos. Los servicios de gestión del conocimiento involucran a mayor potencial la gestión del conocimiento, ya que hace énfasis en los modelos prácticos que esta puede implementar para alcanzar un nivel de optimización de los conocimientos adquiridos. La interfaz en Big Data se adecua a la organización que planee usarla, no es lo mismo 6
  • 7.
    usarla para transaccionesen un banco, que usarla para la recolección de datos en una página web; este inciso tiene en particular que se adapta al diseño de la organización. Por último, para el nivel de aplicación se puede optar por cualquier organización que haga uso de grandes volúmenes de datos, como empresas comerciales, entidades públicas, sitios web, entre muchos otros. 6. VALIDACIÓN DEL MODELO Implementación del Modelo de Gestión del conocimiento de Big Data en una organización.(Banco) Como se pudo observar anteriormente el Modelo de Gestión del conocimiento de Big Data y su Arquitectura de Ovum correspondiente puede aplicarse a cualquier entidad que haga uso de grandes cantidades de datos. Como un ejemplo práctico se tiene a continuación la Arquitectura de Ovum de la Big Data aplicada a un banco para la validación del modelo. Fig. 4. Arquitectura de Ovum Big Data aplicada a un banco. Fuente propia. La implementación realizada para el banco nos revela que las fuentes de información son muy diversas, entre ellas encontramos los datos personales que proporcionan los clientes, las redes sociales con las que se pueden interactuar, rastreo electrónico por medio del correo electrónico y muy importante el historial de Datacrédito, esto ayuda a analizar si el usuario es un cliente fiable o no. Para la infraestructura se encuentra que los bancos suelen tener divisiones en su interior para poder clasificar el tipo de solicitud de los usuarios, es decir, los datos que estos proporcionan, y así garantizar que los procesos sean más eficientes y rápidos. En la gestión de la información y 7
  • 8.
    procesos se cuentacon formatos especializados para el correcto diligenciamiento de los datos según sea la necesidad del cliente, esto también garantiza una correcta clasificación y optimización de tiempos y recursos. En la taxonomía corporativa es de resaltar el papel del gerente general, él es quien se encarga de la correcta utilización de los datos recolectados, es la fuente de “conocimiento” de la organización, así mismo es su deber asignar las tareas correspondientes y velar por el buen uso de la información. En los servicios de Gestión del conocimiento se encuentran los servicios de procesamiento en donde se efectúa el procesamiento de los datos en sus tres etapas, como lo son su recopilación, posteriormente se transforman en información y por último en conocimiento, esto se ve evidenciado en cualquier solicitud realizada por un usuario en el banco, primero se recopila sus datos, se verifican y se crea una respuesta. Para la interfaz surge con gran auge la implementación de Big Data, la interfaz de un banco debe contar con un gran procesador de datos, los cuales los recolecta, clasifica, limpia, organiza y depura para su posterior análisis y uso, estas clasificaciones pueden ser en cuentas corrientes, cuentas de ahorro, préstamos, certificados, entre muchos otros procesos. Por último, la aplicación como se describió recae en la Big Data y cómo facilita este análisis, todo con el fin de Gestionar el conocimiento en la entidad a través de sus funcionarios y clientes. 7. CONCLUSIONES El modelo propuesto para la gestión del conocimiento, apoyada en la tecnología Big Data, representa la infraestructura tecnológica ideal para las organizaciones que desean soportar sus diferentes procesos, especialmente el de toma de decisiones, en el manejo y ordenamiento adecuado de sus datos para la generación de información y la extracción de conocimiento útil. La aplicación de dicho modelo debe proporcionar una visión amplia sobre lo que sucede dentro y fuera de la organización al identificarse en los datos patrones de comportamiento de las variables fundamentales que constituyen la operación de la compañía. Por otra parte, se representan las características que deben tener los grandes datos para que sean útiles para la Alta Dirección, así como las diferentes herramientas estadísticas e informáticas que deberían ser utilizadas para que la implementación del Big Data sea efectiva. Un aspecto importante que se debe tener en cuenta es el proceso de socialización y distribución del conocimiento generado mediante el uso de mecanismos de comunicación e implementación de recursos como las TIC´s. De igual manera, es importante que exista un proceso de retroalimentación en el que los miembros de la organización proporcionen ideas y opiniones sobre el capital intelectual resultante del tratamiento de datos, para con ello evaluar el flujo de conocimiento, la confianza que pone la compañía en él, creándose así nueva información, formando un ciclo continuo con conocimiento en movimiento para contribuir con la mejora continua del proceso de explotación de datos y fortalecimiento de la cultura organizacional a través de la creación y/o transformación del conocimiento contenido en ella. REFERENCIAS 1. Armentia, G., Elcoro, I. Introducción al Big Data. ​Consultec. Empresa Digitala​, Vol. 1, (2017). 2. Nieves, Y., León, M. (2001). La gestión del conocimiento: una nueva perspectiva en la gerencia de las organizaciones. ACIMED, pp. 121-126. 3. Fayyad, U., Piatetsky-Shapiro,G., Smyth, P. (1996). From Data Mining to Knowledge Discovery in Databases. Al Magazine Vol. 17, No. 3. 8