SlideShare una empresa de Scribd logo
1 de 9
Descargar para leer sin conexión
Para hacer iniciativas valiosas de Inteligencia Artificial (IA) y Machine Learning
(ML) al interior de las organizaciones, es necesario entregar información a las
personas o al sistema en el momento justo y dentro del contexto correcto.
Con frecuencia las organizaciones son incapaces de hacer esto porque están
concentrados en los algoritmos. ¡Pero la ciencia de datos es más que redes
neuronales y aprendizaje profundo! Las organizaciones necesitan, en cambio,
aprovechar a las personas, los procesos y la tecnología para infundir IA y ML en
los procesos empresariales.
A continuación, una analogía que ayuda a explicar: hacer pan en casa es
bastante simple y solo requiere de cuatro ingredientes: harina, agua, levadura y
un poco de sal. Pones todo en un recipiente, lo revuelves, lo amasas, dejas que
la masa se agrande y luego lo horneas. Pero si tu no sigues la receta u olvidas
un ingrediente importante, terminaras con un pan incomible. Lo mismo sucede
con IA y ML, y muchas organizaciones necesitan ayuda para conseguirlo a la
perfección.
Si vas a tomar decisiones importantes acerca de tu negocio con IA y ML,
necesitas tener una completa y funcional pastelería, no solo una cocina de casa.
Eso significa mezcladores industriales, largas cantidades de ingredientes, más
hornos, una red de distribución, procesos de control de calidad, más pasteleros
y la lista continua.
En este documento, te daremos una receta fácil de seguir que te ayudará a
operacionalizar IA y ML y ganar una ventaja competitiva con la ciencia de datos.
TIBCO whitepaper | 1
Antes de empezar a cocinar
Antes de hacer cualquier receta, necesitas decidir qué vas a cocinar. Así mismo,
necesitas un problema que vas a atacar con IA y ML antes de que puedas
trabajar en una solución. Por lo tanto, las mejores practicas dicen que antes de
empezar, necesitas entender la meta final de tu iniciativa de ciencia de datos.
Necesitas preguntarte: ¿cuál es la decisión de negocios que hay que tomar?
Una vez entiendas esto, podrás trabajar en desarrollar un plan para tus
iniciativas IA/ML, ¿cómo tus procesos de negocios cambiarían como resultado
de esa previsión? Si el proceso de tu negocio es suficientemente ágil, y si ese
cambio es significativamente valioso para este, puedes moverte hacía adelante
con confianza sabiendo que tus modelos predictivos harán un impacto real en
la línea de fondo.
Los resultados de la
encuesta de Kaggle
muestran el top de retos
que las compañías
enfrentan en sus
iniciativas de IA y ML,
todas caen en tres
categorías: personas,
procesos y tecnología.
Ninguna está relacionada
a algoritmos.
TIBCO whitepaper | 2
Reúne los ingredientes
También, en la preparación, debes reunir todos los ingredientes necesarios
antes de empezar a trabajar. Para ampliar el análisis en una organización,
concéntrate en estos tres ingredientes clave: personas, procesos y tecnología.
Debe haber una inversión equilibrada en cada uno para asegurar un resultado
exitoso. Así como a ti no te gustaría añadir mucha sal u olvidar añadir la
levadura a tu pan, necesitas considerar cada ingrediente como esencial para el
resultado de tu proyecto de aprendizaje automático.
PERSONAS
Colaborar,
comunicar y utilizar
conocimientos
basados en datos
PROCESOS
Realizar las
preguntas correctas
e infundir algoritmos
en todos lados
TECNOLOGÍA
Reutilizar y
automatizar
La receta
Ahora que tienes una meta final en mente y todos tus ingredientes listos, es
momento de empezar a combinarlos en las proporciones correctas usando
mejores prácticas y métodos probados. Para asegurar una iniciativa IA/ML
exitosa tienes que seguir los siguientes nueve pasos cuidadosamente:
Personas
1. Empodera varios tipos de usuario
2. Colaborar entre equipos
3. Utilizar mejores prácticas y CoEs
Procesos
4. Apoyar el proceso ML de extremo a extremo
5. Establecer ML Ops para el despliegue y la puesta en funcionamiento
6. Auditabilidad, transparencia y gobernanza
Tecnología
7. Automatizar y reutilizar
8. Orquestar tecnología Open Source
9. Rendimiento de dirección, escalabilidad e IoT
No te preocupes, te guiaremos a través de cada paso y te daremos tips útiles
durante el camino.
TIBCO whitepaper | 3
Personas
Paso #1: Empodera varios tipos de usuario
En primer lugar, es importante pensar a través de las manos de las diferentes
personas que intervienen en una organización y cómo optimizar esas
interacciones. Pueden los científicos de datos desarrolladores, los científicos de
datos quienes no codifican y los científicos de datos ciudadanos; los cuales
tienen diferentes necesidades, ¿utilizar y ser productivos con la misma
plataforma?
Una transferencia cada vez más importante se produce entre los científicos de
datos y los científicos de datos ciudadanos. Un científico de datos ciudadanos
necesita ser capaz de ejecutar un flujo de trabajo que el científico de datos
cree, a pesar de que no supieran como hacer un flujo de trabajo, ellos
deberían saber como aplicarlo. Otra interacción clásica es la relación entre los
científicos de datos y los desarrolladores. En el pasado, después de que los
científicos de datos crearan un modelo, ellos se lo daban a IT, quien
recodificaba, validaba y evaluaba el modelo, lo que podía tomar seis meses o
más. Pero el negocio cambiaba a menudo en esos seis meses, haciendo el
modelo irrelevante. Las mejores plataformas científicas de datos de la
actualidad pueden producir modelos automáticamente en una variedad de
idiomas apropiados para el medio y pueden introducir modelos en los
sistemas operativos de su negocio sin demora.TIBCO whitepaper | 4
No todas las plataformas de ciencia de datos tienen esta funcionalidad.
Asegúrate de buscar una qué si lo tenga, o arriésgate a perder el valor
proporcionado por tus modelos de ciencia de datos. ¿Tu plataforma puede
exportar modelos en diferentes versiones de PMML, PFA, VB, SQL
procedimientos almacenados, C/C++, C#, Java, Java para MapReduce o UDFs?
A continuación, piensa de nuevo en la decisión de tu negocio que quieres
cumplir con tu iniciativa de IA o de ML. Para hacer certero que tus científicos
de datos están alineados con tus objetivos de negocio generales, debes
asegurarte que los principales interesados participen en los proyectos
pertinentes para ellos. Para que la iniciativa impacte las decisiones
empresariales, debe resolver un problema y ser consumible para aquellos que
lo necesitan. Necesitas pensar en la utilidad de la entrega, por ejemplo, un
CMO podría querer un dashboard, un trabajador de fabrica podría querer una
recomendación de qué hacer en tiempo real, y la lista continua.
Paso #2: Colaborar entre equipos
Las organizaciones necesitan ser capaces de colaborar en un equipo
interdisciplinario de ciencia de datos y entre los ingenieros de datos,
desarrolladores, científicos de datos ciudadanos y expertos en negocios. Las
mejores plataformas de ciencia de datos de la actualidad hacen que las
colaboraciones sean fáciles y permiten a todos compartir y contribuir al
proceso ML utilizando una interfaz de usuario intuitiva de autoservicio. De
cualquier manera, muchos de los científicos de datos aún les gusta escribir en
Python y en otros códigos. ¿Tu plataforma de ciencia de datos permite
integrar modelos desarrollados en Python e integrarlos directamente dentro
de la interfaz de usuario? Si desea aprovechar la creatividad de todo el equipo
y ampliar el Machine Learning, no puede limitar la participación en el proyecto
a unos pocos científicos de datos. En su lugar, democratiza y colabora en la
ciencia de datos y en machine learning con automatización, plantillas
reutilizables y marcos para la colaboración entre equipos.
Paso #3: Utilizar mejores prácticas y centros de
excelencia
Una razón por las que las organizaciones se les dificulta operacionalizar
completamente sus modelos de Machine Learning es por la falta de una
estructura interna que apoye un uso generalizado en toda la empresa. Sin una
estructura establecida y practicas claras a seguir, los equipos seguirán
reinventando la rueda, tratando de resolver el mismo problema de diferentes
maneras. Es por esto que, muchas organizaciones establecen un centro de
excelencia (CoE) para comunicar mejores prácticas, organizar programas de
entrenamiento y crear un mercado interno con plantillas y directrices
reutilizables. Aunque el término “estructura” suena restrictivo, de hecho, abre
un espacio de colaboración eliminado la confusión y dándole a los equipos un
propósito establecido. Los individuos creativos tomarán este propósito y lo
impulsarán hacia adelante con ideas innovadoras, se desharán de las tareas
mundanas y abordarán nuevos problemas.
TIBCO whitepaper | 5
Procesos
Paso # 4: Soporte proceso ML de extremo a extremo
Para operacionalizar tus iniciativas de Machine Learning, tu plataforma de
ciencia de datos debe apoyar procesos de extremo a extremo, desde la
ingestión y preparación de datos, hasta la construcción de modelos, la
implementación y la operacionalización. Es fundamental que emplee una sola
plataforma para manejar todo lo que sus equipos necesitan.
Los empleados deben tener herramientas que necesitan en cada paso del
proceso de Machine Learning, o te arriesgas a inhibir el trabajo de otros en el
futuro. Primero, los científicos e ingenieros de datos tienen que ser capaces de
conectar todos los datos de múltiples fuentes. Segundo, tu querrás asegurarte
de que puedes consolidar y optimizar sin problemas tu preparación de datos.
Luego, cuando venga la construcción de los modelos de Machine Learning, tu
plataforma debe soportar el diseño visual y los flujos de trabajo automatizados
al mismo tiempo que abarca lenguajes de código abierto. Por último, los
usuarios deben ser capaces de implementar y gestionar los modelos de
manera eficiente para devolver el mayor valor al negocio. Este es un paso
crucial porque la operacionalización de la ciencia de datos permite a las
organizaciones realizar y monetizar el valor de la ciencia de datos.
TIBCO whitepaper | 6
Paso #5: Establecer ML Ops para el despliegue y la
puesta en funcionamiento
Incluso en la actualidad muchos científicos de datos pasan la mayoría de su
tiempo refinando y refrescando modelos en sistemas de producción, leyendo
modelos de Machine Learning para la entrega y el despliegue. La habilidad de
tomar modelos, la capacidad de tomar modelos, implementarlos en la
producción, administrar y hacer actualizaciones después de la implementación
es fundamental para el éxito de cualquier iniciativa de Machine Learning.
Para acelerar este proceso de implementación, tu organización necesita una
tecnología que pueda generar un código apropiado para el entorno del
destino y desplegarlo sin la necesidad de recodificar. Adicionalmente, después
que los modelos sean desplegados, necesitas ser capaz de monitorear,
gestionar y refrescar miles de modelos. En el mundo real, los eventos están
constantemente cambiando, entonces tus modelos deben ser actualizados y
reciclados para que coincidan con estos cambios en los datos. Es imperativo
que pongas en marcha una estrategia de modelos de operación para que te
ayude a manejar cualquier cambio en los modelos de producción en tiempo
real.
Paso #6: Auditabilidad, transparencia y gobernanza
Una plataforma moderna de ciencia de datos debe tener control de versiones
y ser capaz de rastrear quién cambió qué, cuándo, por qué y cómo.
Comprender los datos y el linaje de los modelos, incluidos sus orígenes, los
cambios y el movimiento a lo largo del tiempo facilitará la detección de
errores en el proceso de la ciencia de datos y determinará sus causas
fundamentales. Una parte importante de este control es el soporte para firmas
electrónicas que permite la gestión de proyectos de diferentes versiones de
sus modelos de Machine Learning. Esta funcionalidad también hace que todo
el proceso sea más transparente, aumentando la colaboración cruzada y la
eficiencia.
Otra capacidad para buscar es la capacidad de desplegar flujos de trabajo en
un entorno de producción y migrar entre entornos. Esto significa que sus
modelos pueden ser fácilmente auditados e implementados más rápido. En la
misma línea, las cancelaciones automáticas para las implementaciones son
esenciales, asegurando que las implementaciones fallidas sean capturadas y
revertidas de manera segura.
Finalmente, una plataforma integral de ciencia de datos también debería
ayudar a las organizaciones a cumplir con las principales regulaciones del
gobierno como el Título 21 CFR Parte 11 de la U.S. Food and Drug
Administration con respecto a registros y firmas electrónicas, Ley Sarbanes-
Oxley para proteger a los accionistas de errores contables y prácticas
fraudulentas, y la Regla General de Protección de Datos (RGPD) sobre
protección de datos y privacidad. El cumplimiento, especialmente en torno a la
privacidad de datos, seguirá siendo una preocupación creciente, así que
asegúrese de que su organización esté preparada.
TIBCO whitepaper | 7
Tecnología
Paso #7: Automatizar y reutilizar
Deje de hacer girar sus ruedas y desperdiciar valiosos científicos de datos. Al
crear plantillas de Machine Learning reutilizables que se pueden compartir,
implementar, monitorear y controlar fácilmente en la producción, puede
ayudar a todos a colaborar y entender problemas complejos más rápido.
Con un conjunto de mejores prácticas y procesos estandarizados, puede
proporcionar la flexibilidad y la extensibilidad necesarias para llevar la ciencia
de datos de su empresa al siguiente nivel. Provistos de las herramientas para
soportar plantillas reutilizables, flujos de trabajo y recetas con parámetros,
todos, desde usuarios empresariales hasta científicos de datos ciudadanos,
hasta desarrolladores, pueden involucrarse e innovar en proyectos de ciencia
de datos.
Una forma en que las empresas están logrando esto es a través del
aprendizaje automático, o Auto ML, lo que significa un conjunto de procesos
que son automáticos y requieren poco o ningún código. Auto ML acelera el
proceso, permitiendo que los científicos de datos sean más productivos
automatizando la generación de características clave e iterando rápidamente a
través de modelos. El uso de recomendaciones automatizadas puede ayudar a
los científicos de datos ciudadanos a dar sentido a modelos complejos y
trabajar más rápido con perspectivas visuales.
Pasos clave para Auto ML:
1 Integración y adquisición de datos
2 Transformación de datos
3 Desarrollo de Machine Learning
4 Prueba de modelos de Machine Learning
5 Despliegue
Auto ML es más útil cuando se utiliza para identificar rápidamente qué áreas y
proyectos podrían ser más valiosos para una mayor exploración por un
científico de datos, y como una ayuda a los científicos de datos. Al final del día,
debería aumentar el trabajo de los científicos de datos, no reemplazarlo. Los
científicos de datos deben ser capaces de utilizar Auto ML para aumentar su
productividad y la precisión de sus soluciones finales, ayudándoles a
considerar rápidamente una amplia gama de enfoques analíticos.
Paso #8: Orquestar tecnología Open Source
Dado que hay numerosos lenguajes de codificación, marcos y servicios
disponibles, la plataforma que selecciones debe integrarse perfectamente con
estas tecnologías para que tu organización pueda ser productiva. Con esta
plataforma, puedes ampliar los flujos de trabajo analíticos integrando
perfectamente los scripts de código abierto R, Jupyter Notebooks, Python, C#,
y Scala directamente en la base de datos. Utilizando la tecnología de código
abierto, puedes crear rápidamente prototipos de soluciones nuevas y flexibles
mientras mantiene la gobernanza y la seguridad de tus datos.
TIBCO whitepaper | 8
Paso #9: Rendimiento de dirección, escalabilidad e
IoT
Al ejecutar tus procesos de preparación de datos y ciencia de datos en
ecosistemas híbridos y de big data como Spark y Hadoop, e incluso Data
Fabric, puedes simplificar el proceso de aprendizaje automático de extremo a
extremo. Puedes automatizar los flujos de trabajo analíticos de preparación y
predicción de datos para ejecutarlos y escalarlos directamente dentro de un
clúster. Automatizar el proceso de Machine Learning y acelerar proyectos le
ayuda a sacar más provecho de la ciencia de datos y aumenta la eficiencia y
productividad en toda la organización.
Además, los datos se pueden recopilar o analizar localmente en el más
pequeño de los dispositivos de IoT, por lo que se pueden tomar decisiones y
acciones en tiempo real. Mueve la verdadera inteligencia, incorporando
modelos de aprendizaje automático que se pueden implementar en
dispositivos.
Por qué TIBCO
Los algoritmos son sólo un componente de la ciencia de datos. Para obtener
una ventaja competitiva real, necesitas centrarte en la orquestación de
personas, procesos y tecnología dentro de tu organización.
Sigue las mejores prácticas que hemos establecido para encontrar una
plataforma de ciencia de datos que empodere a todos, desde científicos de
datos ciudadanos hasta usuarios empresariales; te permite infundir resultados
de IA/ML en el negocio y te ayuda a hacer el pan más delicioso.
Sólo la plataforma de TIBCO Data Science ofrece una cartera de análisis
completa y abierta con las últimas técnicas de aprendizaje automático y una
sencilla interfaz de usuario de autoservicio. Operacionaliza la ciencia de datos,
acelera la innovación y amplía el aprendizaje automático para ofrecer
resultados en toda tu organización.
TIBCO whitepaper | 9

Más contenido relacionado

Similar a 9 pasos para un exitoso machine learning

Los 7 hábitos para el éxito del erp
Los 7 hábitos para el  éxito del erpLos 7 hábitos para el  éxito del erp
Los 7 hábitos para el éxito del erpEvaluandoSoftware
 
Em bi errores comunues en su implementacion
Em bi errores comunues en su implementacionEm bi errores comunues en su implementacion
Em bi errores comunues en su implementacionGianpoolM
 
Em bi errores comunues en su implementacion
Em bi errores comunues en su implementacionEm bi errores comunues en su implementacion
Em bi errores comunues en su implementacionEdison_Medina
 
Tableau Drive, Una nueva metodología para implementaciones empresariales
Tableau Drive, Una nueva metodología para implementaciones empresarialesTableau Drive, Una nueva metodología para implementaciones empresariales
Tableau Drive, Una nueva metodología para implementaciones empresarialesTableau Software
 
Las 10 tendencias principales de BI para el 2018 - Carloz Díaz
Las 10 tendencias principales de BI para el 2018 - Carloz DíazLas 10 tendencias principales de BI para el 2018 - Carloz Díaz
Las 10 tendencias principales de BI para el 2018 - Carloz DíazBig-Data-Summit
 
Productividad empresarial
Productividad empresarialProductividad empresarial
Productividad empresarialDynamica
 
Innovación Digital Potenciada con Inteligencia Artificial
Innovación Digital Potenciada con Inteligencia ArtificialInnovación Digital Potenciada con Inteligencia Artificial
Innovación Digital Potenciada con Inteligencia ArtificialGustavo Cuervo
 
Ensayo Software SAP
Ensayo Software SAPEnsayo Software SAP
Ensayo Software SAPRonaldoR3
 
Integrar Erp Es Integrar Personas
Integrar Erp Es Integrar PersonasIntegrar Erp Es Integrar Personas
Integrar Erp Es Integrar PersonasMaria Lleo
 
cia2 charla arquitecturadesoftware ai
cia2 charla arquitecturadesoftware aicia2 charla arquitecturadesoftware ai
cia2 charla arquitecturadesoftware aiandres hurtado
 
Hacia ti capacitación virtual pasos 01, 02, 03
Hacia ti capacitación virtual pasos 01, 02, 03Hacia ti capacitación virtual pasos 01, 02, 03
Hacia ti capacitación virtual pasos 01, 02, 03sbmalambo
 
Como el uso de las TIC han hecho eficientes los procesos de negocios
Como el uso de las TIC han hecho eficientes los procesos de negociosComo el uso de las TIC han hecho eficientes los procesos de negocios
Como el uso de las TIC han hecho eficientes los procesos de negociosLEONARDOALANBURCIAGA
 
Computer world empresas big data & analytics
Computer world   empresas big data & analyticsComputer world   empresas big data & analytics
Computer world empresas big data & analyticsIgnacio Jimenez
 

Similar a 9 pasos para un exitoso machine learning (20)

Los 7 hábitos para el éxito del erp
Los 7 hábitos para el  éxito del erpLos 7 hábitos para el  éxito del erp
Los 7 hábitos para el éxito del erp
 
Em bi errores comunues en su implementacion
Em bi errores comunues en su implementacionEm bi errores comunues en su implementacion
Em bi errores comunues en su implementacion
 
Em bi errores comunues en su implementacion
Em bi errores comunues en su implementacionEm bi errores comunues en su implementacion
Em bi errores comunues en su implementacion
 
Construyendo Empresa Digital
Construyendo Empresa DigitalConstruyendo Empresa Digital
Construyendo Empresa Digital
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Tableau Drive, Una nueva metodología para implementaciones empresariales
Tableau Drive, Una nueva metodología para implementaciones empresarialesTableau Drive, Una nueva metodología para implementaciones empresariales
Tableau Drive, Una nueva metodología para implementaciones empresariales
 
Las 10 tendencias principales de BI para el 2018 - Carloz Díaz
Las 10 tendencias principales de BI para el 2018 - Carloz DíazLas 10 tendencias principales de BI para el 2018 - Carloz Díaz
Las 10 tendencias principales de BI para el 2018 - Carloz Díaz
 
Gestion del conocimiento
Gestion del conocimientoGestion del conocimiento
Gestion del conocimiento
 
Curriculum Vitae
Curriculum VitaeCurriculum Vitae
Curriculum Vitae
 
Productividad empresarial
Productividad empresarialProductividad empresarial
Productividad empresarial
 
Innovación Digital Potenciada con Inteligencia Artificial
Innovación Digital Potenciada con Inteligencia ArtificialInnovación Digital Potenciada con Inteligencia Artificial
Innovación Digital Potenciada con Inteligencia Artificial
 
Marketing digital.docx (1)
Marketing digital.docx (1)Marketing digital.docx (1)
Marketing digital.docx (1)
 
Ensayo Software SAP
Ensayo Software SAPEnsayo Software SAP
Ensayo Software SAP
 
Integrar Erp Es Integrar Personas
Integrar Erp Es Integrar PersonasIntegrar Erp Es Integrar Personas
Integrar Erp Es Integrar Personas
 
cia2 charla arquitecturadesoftware ai
cia2 charla arquitecturadesoftware aicia2 charla arquitecturadesoftware ai
cia2 charla arquitecturadesoftware ai
 
Hacia ti capacitación virtual pasos 01, 02, 03
Hacia ti capacitación virtual pasos 01, 02, 03Hacia ti capacitación virtual pasos 01, 02, 03
Hacia ti capacitación virtual pasos 01, 02, 03
 
Como el uso de las TIC han hecho eficientes los procesos de negocios
Como el uso de las TIC han hecho eficientes los procesos de negociosComo el uso de las TIC han hecho eficientes los procesos de negocios
Como el uso de las TIC han hecho eficientes los procesos de negocios
 
Big_Data
Big_DataBig_Data
Big_Data
 
GUIA_DE_CLASE_DE_C3_-_TEMA_1.pptx
GUIA_DE_CLASE_DE_C3_-_TEMA_1.pptxGUIA_DE_CLASE_DE_C3_-_TEMA_1.pptx
GUIA_DE_CLASE_DE_C3_-_TEMA_1.pptx
 
Computer world empresas big data & analytics
Computer world   empresas big data & analyticsComputer world   empresas big data & analytics
Computer world empresas big data & analytics
 

9 pasos para un exitoso machine learning

  • 1. Para hacer iniciativas valiosas de Inteligencia Artificial (IA) y Machine Learning (ML) al interior de las organizaciones, es necesario entregar información a las personas o al sistema en el momento justo y dentro del contexto correcto. Con frecuencia las organizaciones son incapaces de hacer esto porque están concentrados en los algoritmos. ¡Pero la ciencia de datos es más que redes neuronales y aprendizaje profundo! Las organizaciones necesitan, en cambio, aprovechar a las personas, los procesos y la tecnología para infundir IA y ML en los procesos empresariales. A continuación, una analogía que ayuda a explicar: hacer pan en casa es bastante simple y solo requiere de cuatro ingredientes: harina, agua, levadura y un poco de sal. Pones todo en un recipiente, lo revuelves, lo amasas, dejas que la masa se agrande y luego lo horneas. Pero si tu no sigues la receta u olvidas un ingrediente importante, terminaras con un pan incomible. Lo mismo sucede con IA y ML, y muchas organizaciones necesitan ayuda para conseguirlo a la perfección. Si vas a tomar decisiones importantes acerca de tu negocio con IA y ML, necesitas tener una completa y funcional pastelería, no solo una cocina de casa. Eso significa mezcladores industriales, largas cantidades de ingredientes, más hornos, una red de distribución, procesos de control de calidad, más pasteleros y la lista continua. En este documento, te daremos una receta fácil de seguir que te ayudará a operacionalizar IA y ML y ganar una ventaja competitiva con la ciencia de datos. TIBCO whitepaper | 1
  • 2. Antes de empezar a cocinar Antes de hacer cualquier receta, necesitas decidir qué vas a cocinar. Así mismo, necesitas un problema que vas a atacar con IA y ML antes de que puedas trabajar en una solución. Por lo tanto, las mejores practicas dicen que antes de empezar, necesitas entender la meta final de tu iniciativa de ciencia de datos. Necesitas preguntarte: ¿cuál es la decisión de negocios que hay que tomar? Una vez entiendas esto, podrás trabajar en desarrollar un plan para tus iniciativas IA/ML, ¿cómo tus procesos de negocios cambiarían como resultado de esa previsión? Si el proceso de tu negocio es suficientemente ágil, y si ese cambio es significativamente valioso para este, puedes moverte hacía adelante con confianza sabiendo que tus modelos predictivos harán un impacto real en la línea de fondo. Los resultados de la encuesta de Kaggle muestran el top de retos que las compañías enfrentan en sus iniciativas de IA y ML, todas caen en tres categorías: personas, procesos y tecnología. Ninguna está relacionada a algoritmos. TIBCO whitepaper | 2
  • 3. Reúne los ingredientes También, en la preparación, debes reunir todos los ingredientes necesarios antes de empezar a trabajar. Para ampliar el análisis en una organización, concéntrate en estos tres ingredientes clave: personas, procesos y tecnología. Debe haber una inversión equilibrada en cada uno para asegurar un resultado exitoso. Así como a ti no te gustaría añadir mucha sal u olvidar añadir la levadura a tu pan, necesitas considerar cada ingrediente como esencial para el resultado de tu proyecto de aprendizaje automático. PERSONAS Colaborar, comunicar y utilizar conocimientos basados en datos PROCESOS Realizar las preguntas correctas e infundir algoritmos en todos lados TECNOLOGÍA Reutilizar y automatizar La receta Ahora que tienes una meta final en mente y todos tus ingredientes listos, es momento de empezar a combinarlos en las proporciones correctas usando mejores prácticas y métodos probados. Para asegurar una iniciativa IA/ML exitosa tienes que seguir los siguientes nueve pasos cuidadosamente: Personas 1. Empodera varios tipos de usuario 2. Colaborar entre equipos 3. Utilizar mejores prácticas y CoEs Procesos 4. Apoyar el proceso ML de extremo a extremo 5. Establecer ML Ops para el despliegue y la puesta en funcionamiento 6. Auditabilidad, transparencia y gobernanza Tecnología 7. Automatizar y reutilizar 8. Orquestar tecnología Open Source 9. Rendimiento de dirección, escalabilidad e IoT No te preocupes, te guiaremos a través de cada paso y te daremos tips útiles durante el camino. TIBCO whitepaper | 3
  • 4. Personas Paso #1: Empodera varios tipos de usuario En primer lugar, es importante pensar a través de las manos de las diferentes personas que intervienen en una organización y cómo optimizar esas interacciones. Pueden los científicos de datos desarrolladores, los científicos de datos quienes no codifican y los científicos de datos ciudadanos; los cuales tienen diferentes necesidades, ¿utilizar y ser productivos con la misma plataforma? Una transferencia cada vez más importante se produce entre los científicos de datos y los científicos de datos ciudadanos. Un científico de datos ciudadanos necesita ser capaz de ejecutar un flujo de trabajo que el científico de datos cree, a pesar de que no supieran como hacer un flujo de trabajo, ellos deberían saber como aplicarlo. Otra interacción clásica es la relación entre los científicos de datos y los desarrolladores. En el pasado, después de que los científicos de datos crearan un modelo, ellos se lo daban a IT, quien recodificaba, validaba y evaluaba el modelo, lo que podía tomar seis meses o más. Pero el negocio cambiaba a menudo en esos seis meses, haciendo el modelo irrelevante. Las mejores plataformas científicas de datos de la actualidad pueden producir modelos automáticamente en una variedad de idiomas apropiados para el medio y pueden introducir modelos en los sistemas operativos de su negocio sin demora.TIBCO whitepaper | 4
  • 5. No todas las plataformas de ciencia de datos tienen esta funcionalidad. Asegúrate de buscar una qué si lo tenga, o arriésgate a perder el valor proporcionado por tus modelos de ciencia de datos. ¿Tu plataforma puede exportar modelos en diferentes versiones de PMML, PFA, VB, SQL procedimientos almacenados, C/C++, C#, Java, Java para MapReduce o UDFs? A continuación, piensa de nuevo en la decisión de tu negocio que quieres cumplir con tu iniciativa de IA o de ML. Para hacer certero que tus científicos de datos están alineados con tus objetivos de negocio generales, debes asegurarte que los principales interesados participen en los proyectos pertinentes para ellos. Para que la iniciativa impacte las decisiones empresariales, debe resolver un problema y ser consumible para aquellos que lo necesitan. Necesitas pensar en la utilidad de la entrega, por ejemplo, un CMO podría querer un dashboard, un trabajador de fabrica podría querer una recomendación de qué hacer en tiempo real, y la lista continua. Paso #2: Colaborar entre equipos Las organizaciones necesitan ser capaces de colaborar en un equipo interdisciplinario de ciencia de datos y entre los ingenieros de datos, desarrolladores, científicos de datos ciudadanos y expertos en negocios. Las mejores plataformas de ciencia de datos de la actualidad hacen que las colaboraciones sean fáciles y permiten a todos compartir y contribuir al proceso ML utilizando una interfaz de usuario intuitiva de autoservicio. De cualquier manera, muchos de los científicos de datos aún les gusta escribir en Python y en otros códigos. ¿Tu plataforma de ciencia de datos permite integrar modelos desarrollados en Python e integrarlos directamente dentro de la interfaz de usuario? Si desea aprovechar la creatividad de todo el equipo y ampliar el Machine Learning, no puede limitar la participación en el proyecto a unos pocos científicos de datos. En su lugar, democratiza y colabora en la ciencia de datos y en machine learning con automatización, plantillas reutilizables y marcos para la colaboración entre equipos. Paso #3: Utilizar mejores prácticas y centros de excelencia Una razón por las que las organizaciones se les dificulta operacionalizar completamente sus modelos de Machine Learning es por la falta de una estructura interna que apoye un uso generalizado en toda la empresa. Sin una estructura establecida y practicas claras a seguir, los equipos seguirán reinventando la rueda, tratando de resolver el mismo problema de diferentes maneras. Es por esto que, muchas organizaciones establecen un centro de excelencia (CoE) para comunicar mejores prácticas, organizar programas de entrenamiento y crear un mercado interno con plantillas y directrices reutilizables. Aunque el término “estructura” suena restrictivo, de hecho, abre un espacio de colaboración eliminado la confusión y dándole a los equipos un propósito establecido. Los individuos creativos tomarán este propósito y lo impulsarán hacia adelante con ideas innovadoras, se desharán de las tareas mundanas y abordarán nuevos problemas. TIBCO whitepaper | 5
  • 6. Procesos Paso # 4: Soporte proceso ML de extremo a extremo Para operacionalizar tus iniciativas de Machine Learning, tu plataforma de ciencia de datos debe apoyar procesos de extremo a extremo, desde la ingestión y preparación de datos, hasta la construcción de modelos, la implementación y la operacionalización. Es fundamental que emplee una sola plataforma para manejar todo lo que sus equipos necesitan. Los empleados deben tener herramientas que necesitan en cada paso del proceso de Machine Learning, o te arriesgas a inhibir el trabajo de otros en el futuro. Primero, los científicos e ingenieros de datos tienen que ser capaces de conectar todos los datos de múltiples fuentes. Segundo, tu querrás asegurarte de que puedes consolidar y optimizar sin problemas tu preparación de datos. Luego, cuando venga la construcción de los modelos de Machine Learning, tu plataforma debe soportar el diseño visual y los flujos de trabajo automatizados al mismo tiempo que abarca lenguajes de código abierto. Por último, los usuarios deben ser capaces de implementar y gestionar los modelos de manera eficiente para devolver el mayor valor al negocio. Este es un paso crucial porque la operacionalización de la ciencia de datos permite a las organizaciones realizar y monetizar el valor de la ciencia de datos. TIBCO whitepaper | 6
  • 7. Paso #5: Establecer ML Ops para el despliegue y la puesta en funcionamiento Incluso en la actualidad muchos científicos de datos pasan la mayoría de su tiempo refinando y refrescando modelos en sistemas de producción, leyendo modelos de Machine Learning para la entrega y el despliegue. La habilidad de tomar modelos, la capacidad de tomar modelos, implementarlos en la producción, administrar y hacer actualizaciones después de la implementación es fundamental para el éxito de cualquier iniciativa de Machine Learning. Para acelerar este proceso de implementación, tu organización necesita una tecnología que pueda generar un código apropiado para el entorno del destino y desplegarlo sin la necesidad de recodificar. Adicionalmente, después que los modelos sean desplegados, necesitas ser capaz de monitorear, gestionar y refrescar miles de modelos. En el mundo real, los eventos están constantemente cambiando, entonces tus modelos deben ser actualizados y reciclados para que coincidan con estos cambios en los datos. Es imperativo que pongas en marcha una estrategia de modelos de operación para que te ayude a manejar cualquier cambio en los modelos de producción en tiempo real. Paso #6: Auditabilidad, transparencia y gobernanza Una plataforma moderna de ciencia de datos debe tener control de versiones y ser capaz de rastrear quién cambió qué, cuándo, por qué y cómo. Comprender los datos y el linaje de los modelos, incluidos sus orígenes, los cambios y el movimiento a lo largo del tiempo facilitará la detección de errores en el proceso de la ciencia de datos y determinará sus causas fundamentales. Una parte importante de este control es el soporte para firmas electrónicas que permite la gestión de proyectos de diferentes versiones de sus modelos de Machine Learning. Esta funcionalidad también hace que todo el proceso sea más transparente, aumentando la colaboración cruzada y la eficiencia. Otra capacidad para buscar es la capacidad de desplegar flujos de trabajo en un entorno de producción y migrar entre entornos. Esto significa que sus modelos pueden ser fácilmente auditados e implementados más rápido. En la misma línea, las cancelaciones automáticas para las implementaciones son esenciales, asegurando que las implementaciones fallidas sean capturadas y revertidas de manera segura. Finalmente, una plataforma integral de ciencia de datos también debería ayudar a las organizaciones a cumplir con las principales regulaciones del gobierno como el Título 21 CFR Parte 11 de la U.S. Food and Drug Administration con respecto a registros y firmas electrónicas, Ley Sarbanes- Oxley para proteger a los accionistas de errores contables y prácticas fraudulentas, y la Regla General de Protección de Datos (RGPD) sobre protección de datos y privacidad. El cumplimiento, especialmente en torno a la privacidad de datos, seguirá siendo una preocupación creciente, así que asegúrese de que su organización esté preparada. TIBCO whitepaper | 7
  • 8. Tecnología Paso #7: Automatizar y reutilizar Deje de hacer girar sus ruedas y desperdiciar valiosos científicos de datos. Al crear plantillas de Machine Learning reutilizables que se pueden compartir, implementar, monitorear y controlar fácilmente en la producción, puede ayudar a todos a colaborar y entender problemas complejos más rápido. Con un conjunto de mejores prácticas y procesos estandarizados, puede proporcionar la flexibilidad y la extensibilidad necesarias para llevar la ciencia de datos de su empresa al siguiente nivel. Provistos de las herramientas para soportar plantillas reutilizables, flujos de trabajo y recetas con parámetros, todos, desde usuarios empresariales hasta científicos de datos ciudadanos, hasta desarrolladores, pueden involucrarse e innovar en proyectos de ciencia de datos. Una forma en que las empresas están logrando esto es a través del aprendizaje automático, o Auto ML, lo que significa un conjunto de procesos que son automáticos y requieren poco o ningún código. Auto ML acelera el proceso, permitiendo que los científicos de datos sean más productivos automatizando la generación de características clave e iterando rápidamente a través de modelos. El uso de recomendaciones automatizadas puede ayudar a los científicos de datos ciudadanos a dar sentido a modelos complejos y trabajar más rápido con perspectivas visuales. Pasos clave para Auto ML: 1 Integración y adquisición de datos 2 Transformación de datos 3 Desarrollo de Machine Learning 4 Prueba de modelos de Machine Learning 5 Despliegue Auto ML es más útil cuando se utiliza para identificar rápidamente qué áreas y proyectos podrían ser más valiosos para una mayor exploración por un científico de datos, y como una ayuda a los científicos de datos. Al final del día, debería aumentar el trabajo de los científicos de datos, no reemplazarlo. Los científicos de datos deben ser capaces de utilizar Auto ML para aumentar su productividad y la precisión de sus soluciones finales, ayudándoles a considerar rápidamente una amplia gama de enfoques analíticos. Paso #8: Orquestar tecnología Open Source Dado que hay numerosos lenguajes de codificación, marcos y servicios disponibles, la plataforma que selecciones debe integrarse perfectamente con estas tecnologías para que tu organización pueda ser productiva. Con esta plataforma, puedes ampliar los flujos de trabajo analíticos integrando perfectamente los scripts de código abierto R, Jupyter Notebooks, Python, C#, y Scala directamente en la base de datos. Utilizando la tecnología de código abierto, puedes crear rápidamente prototipos de soluciones nuevas y flexibles mientras mantiene la gobernanza y la seguridad de tus datos. TIBCO whitepaper | 8
  • 9. Paso #9: Rendimiento de dirección, escalabilidad e IoT Al ejecutar tus procesos de preparación de datos y ciencia de datos en ecosistemas híbridos y de big data como Spark y Hadoop, e incluso Data Fabric, puedes simplificar el proceso de aprendizaje automático de extremo a extremo. Puedes automatizar los flujos de trabajo analíticos de preparación y predicción de datos para ejecutarlos y escalarlos directamente dentro de un clúster. Automatizar el proceso de Machine Learning y acelerar proyectos le ayuda a sacar más provecho de la ciencia de datos y aumenta la eficiencia y productividad en toda la organización. Además, los datos se pueden recopilar o analizar localmente en el más pequeño de los dispositivos de IoT, por lo que se pueden tomar decisiones y acciones en tiempo real. Mueve la verdadera inteligencia, incorporando modelos de aprendizaje automático que se pueden implementar en dispositivos. Por qué TIBCO Los algoritmos son sólo un componente de la ciencia de datos. Para obtener una ventaja competitiva real, necesitas centrarte en la orquestación de personas, procesos y tecnología dentro de tu organización. Sigue las mejores prácticas que hemos establecido para encontrar una plataforma de ciencia de datos que empodere a todos, desde científicos de datos ciudadanos hasta usuarios empresariales; te permite infundir resultados de IA/ML en el negocio y te ayuda a hacer el pan más delicioso. Sólo la plataforma de TIBCO Data Science ofrece una cartera de análisis completa y abierta con las últimas técnicas de aprendizaje automático y una sencilla interfaz de usuario de autoservicio. Operacionaliza la ciencia de datos, acelera la innovación y amplía el aprendizaje automático para ofrecer resultados en toda tu organización. TIBCO whitepaper | 9