Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Knime
1. Knime
Konstanz Information Miner
Introducción:
El presente documento se habla de la utilización de una herramienta Knime que
significa Konstanz Information Miner (en español Konstanz Información Minero),
esta herramienta es totalmente gratuita para el desarrollo y ejecución de técnicas
de minería de datos que permite el desarrollo de modelos en un entorno visual.
Knime está programada en Java y su entorno grafico está desarrollada sobre la
plataforma de Eclipse, fue desarrollado originalmente en el departamento
de bioinformática y minería de datos de la Universidad de Constanza, Alemania.
Knime es una plataforma modular de exploración de datos, que permite al usuario
crear flujos de datos, además, permite ejecutar de forma selectiva algunos de los
pasos creados, así como ejecutar todo el flujo desarrollado. Tras la ejecución, los
resultados se pueden investigar mediante vistas interactivas tanto de los datos
como de los modelos.
2. Knime
Konstanz Information Miner
Desarrollo:
Knime Konstanz Information Miner es una herramienta que es para el desarrollo y
ejecución de técnicas de minería de datos, esta herramienta está desarrollada
sobre la plataforma Eclipse y programado en Java, fue creada por el departamento
de bioinformática y minería de datos de la Universidad de Conztanza que se
encuentra en Alemania; esta herramienta fue supervisada por el profesor Michael
Berthold. Actualmente la empresa Knime continúa su desarrollo en Suiza.
Para poder hacer uso de la herramienta de Knime se tiene que descargar en la
página oficial http://knime.org/download donde se tiene que ver la versión
adecuada para su sistema operativo (Windows o Linux, 32 o 64 bits).
Una vez que ya está descargada la herramienta de Knime podran hacer uso de
cada uno de los apartados que contiene dicha herramienta como son: Explorador
de proyectos. Ventana editor de Windows, Descripción de los nodos, Consola de
eventos, Visor Macro de modelos, Repositorio de nodos.
El uso de Knime se basa en el diseño de un flujo de ejecución que plasme las
distintas etapas de un proyecto de minería de datos.
Para que esta herramienta pueda desarrollar y ejecutar una técnica de minería de
datos proporciona distintos nodos agrupados, ejemplo de ellos es: Entrada de
datos IO Read, Salida de datos IO Write, Preprocesamiento data manipulación:
que sirve para filtrar, normalizar, seleccionar variables entre otras, Minería de
datos Mining: que sirve para construir modelos, Salida de resultados Data Views:
que sirve para mostrar resultados en pantalla ya sea de forma textual o gráfica,
entre otros.
Para poder hacer un flujo de ejecución en la herramienta de Knime se tiene las
salidas de unos nodos donde se utiliza como entradas de otros donde transportan
datos; los nodos son básicamente unidades de procesamiento de un workflow.
Para que podamos hacer uso de un nodo hay que fijarnos en su estado si es de
color rojo el estado del nodo significa que no está listo para la ejecución, cuando el
estado del nodo está de color amarillo significa que está configurado y listo para
ejecutar, y el ultimo esta es el de color verde su estado del nodo este significa que
está ejecutado y de esta forma ya funciona correctamente el nodo.
Para poder construir un flujo de datos se tiene que arrastrar el nodo de Repositorio
de nodos y soltarlo en Ventana editor de Windows y conectarlos entre ellos, una
3. Knime
Konstanz Information Miner
vez conectados los nodos se transportan los datos a través de los puertos de
entrada y de salida, después ya que todos estén conectados y transportando
datos se arrastrara un nodo de color manager a la Ventana editador de Windows
donde este nodo se utiliza para colorear los resultados generados a partir de los
datos de entrada, este nodo color manager ayuda a diferenciar los datos ya que si
se inserta este nodo en el flujo los datos de entrada se codifican según un color
especifico o determinado por el nodo color manager.
Para poder ejecutar nuestros nodos primero se tienen que ejecutar de izquierda a
derecha ya que en un nodo solo puede ejecutarse si todos sus nodos
predecesores en el flujo han terminado su ejecutacion.
Una vez que nuestro flujo este totalmente conectado, si un nodo tiene su estado
de color rojo es que no está ejecutado correctamente y hay que darle una solución
estos deben de ser configurados.
Si algún nodo que presenta su estado su estado de color amarrillo a la hora de
que nuestro flujo este totalmente conectado significa que la configuración del nodo
se realizó utilizando los valores por defecto.
Para poder hacer la ejecución de flujo de datos tenemos que ejecutar el nodo
llamado Scatter Plot donde se elige la opción de Execute arrastrándolo a la
Ventana editor de Windows, una vez haciendo esto todos los demás nodos de
flujo se ejecutan automáticamente; además de que un nodo llamado Interactive
Table se ejecuta en paralelo con el Scatter Plot.
Para poder visualizar sus resultados computacionales que muestran algunos
nodos se le tiene que dar click derecho sobre el nodo y elegir la opción de View
donde se pueden abrir varias instancias de una vista para tener diferentes vistas
de los mismos datos, algunas de estas vistas solo se muestran si el nodo fue
ejecutado.
4. Knime
Konstanz Information Miner
Método utilizado para la herramienta Knime.
K-Means
Para poder hacer el flujo de datos en la herramienta Knime se utilizó el método
llamado K-Means (en inglés clustering), donde es un método de agrupación,
donde las técnicas de agrupamiento, en general, tiene por objetivo encontrar
grupos de observaciones con características semejantes, estas observaciones de
un grupo deben ser parecidas a las otras observaciones del grupo, pero deben ser
diferentes lo más diferente de las observaciones de otros grupos.
Técnicamente queremos maximizar la variación inter-cluster y minimizar la
variación intra-cluster.
5. Knime
Konstanz Information Miner
Ejemplo de uso:
En esta tabla se muestra todas las empresas que han hecho uso de la
herramienta Knime, al igual que podemos saber cuánto ha ayudado a las
empresas esta herramienta.
EMPRESAS QUE
UTILIZAN LA
HARRAMIENTA DE
KNIME
EN DONDE UTILIZAN LA HERREMIENTA KNIME
Schrödinger
Knime complementa capacidades existentes, proporcionando
la industria de ciencias biológicas con acceso a muchas
herramientas cheminformatics importantes, incluidas las
herramientas que se utilizan para visualizar y transformar las
estructuras moleculares, calcular propiedades moleculares, y
la búsqueda de grupos funcionales; también proporciona
opciones de soporte para la plataforma en sí Knime.
Infocom Corparation
Ofrece una amplia gama de servicios y soluciones para el
mercado de ciencias. La cual utiliza minería de datos, análisis
estadístico, y el análisis del genoma. Para ello el uso con la
plataforma de flujo de trabajo de código abierto Knime. En
febrero de 2008 faculta a los investigadores trabajar con datos
de la estructura química utilizando herramientas de software
de ChemAxon y la plataforma Knime
.
Tripos chemistry
extensions
Tripos introduce inteligencia química a la plataforma Knime,
proporcionando a los investigadores con la manipulación
química estructura, visualización y otras características de
análisis importantes.
Como complemento de las capacidades Knime existentes
facilita el acceso a muchos quimioinformática importantes y
herramientas de modelado, el paquete Tripos Extensiones
Química permite a los usuarios Knime a leer, escribir y las
estructuras químicas de proceso, para realizar tareas básicas
y avanzadas como computar propiedades moleculares y la
búsqueda de grupos funcionales, y para visualizar, transformar
e interpretar las estructuras moleculares.
6. Knime
Konstanz Information Miner
Symyx Technologies,
Inc
El software Symyx, utiliza herramientas como Knime y
servicios de investigación que permiten a los científicos a
diseñar, ejecutar, analizar y reportar los resultados
experimentales más rápido, más fácil y menos costoso.
Symyx Chemistry
Extensions
Knime mejora el código abierto. Permite a las organizaciones
de I + D para ofrecer a bajo costo, extensiones y servicios
químicos ágiles apoyo flujos de trabajo científico.
Wega Informatik AG
Es una empresa de servicios de TI donde sus principales
áreas de negocio son consultoría y desarrollo de software a
medida específica para las empresas internacionales,
principalmente los departamentos de ciencias biológicas
donde ofrece mantenimiento y soporte para productos Knime
así como el desarrollo personalizado basado en Knime.
Soluzione
Informatiche´s
Su misión es asociarse con sus clientes con el fin de llevar a
cabo proyectos específicos de investigación y desarrollo por
proporcionar a los profesionales del estado de la técnica de
soluciones de software y, aún más importante, bien
entrenados con una larga experiencia en quimioinformática,
Infometrics y bioinformática. Sus servicios incluyen:
consultoría, investigación contratada, formación, distribución
de software, desarrollo de software y hardware, es por ello que
hacen uso de la herramienta Knime.
ChemAxon
Es un líder en el suministro de plataformas de desarrollo de
software químicos para las industrias de biotecnología y
farmacéutica. Al centrarse en la interacción activa con los
usuarios y la portabilidad núcleo, ChemAxon es líder de
soluciones de plataforma cruzada de borde para alimentar
Quimioinformática modernas y la comunicación química,
donde mantienen la adopción de las nuevas tecnologías y
herramientas como Knime proporcionado el crecimiento y la
estabilidad continua de la empresa.
7. Knime
Konstanz Information Miner
Zementis, Inc
Es una compañía de software centrado en el análisis
predictivo y la avanzada tecnología de gestión de decisiones
empresariales, donde combinan la ciencia y software para
crear soluciones industriales de negocio superior y para los
clientes. Su experiencia científica incluye algoritmos
estadísticos, aprendizaje automático, redes neuronales,
sistemas inteligentes y la herramienta Knime, los científicos
tienen un historial probado en la producción de modelos de
predicción eficaces para extraer patrones ocultos de una gran
variedad de tipos de datos.
Treweren Consultants
Es una pequeña empresa de software especializada que se
centra en innovadoras capacidades de descubrimiento de
fármacos, principalmente utilizando la tecnología farmacóforo.
El software Think se puede utilizar independiente bajo
Windows y Linux o utilizando el entorno de flujo de trabajo
Knime, en donde se crean procedimientos de modelado o
informática moleculares, configurados y ejecutados por los
usuarios como un flujo de trabajo visual en Knime. Usando
Knime permite la integración con in-house otras herramientas
comerciales como los disponibles de Tripos y Schroedinger
desarrolló.
8. Knime
Konstanz Information Miner
Conclusión:
Knime es una herramienta totalmente gratuita, que es para el desarrollo y
ejecución de técnicas de minería de datos, además de que esta herramienta es
muy amigable, donde cuenta con un alta gama de algoritmos implementados para
las técnicas de clasificación, al igual de que esta herramienta genera graficas por
lo que ayuda a la interpretación de los modelos generados con mayor facilidad ya
que hay un nodo que lleva por nombre Color Manager donde nos permite
diferenciar los datos generados a partir de los datos de entrada dándoles un color
diferente. Knime es una herramienta que es para el desarrollo y ejecución de
técnicas de minería de datos.