SlideShare una empresa de Scribd logo
1 de 40
Ya eres parte de la evolución
Solid Day
#MachineLearning para
Organizaciones
Jesus Ramos
@xuxoramos
ramos.cardona@gmail.com
linkedin.com/in/xuxoramos
#sgnext
Y éste qué?
- Ingeniero de Software de nacimiento (ITESM).
- Econometrista Financiero por azar (Unottingham +
UWashington).
- Estadístico Computacional por convicción (Coursera, a mucha
honra).
- Consultado con 6 firmas (BMV, GBM, ConCredito, Movistar, etc)
para levantar sus capacidades analíticas.
- Co fundador de @TheDataPub, comunidad dedicada a reventar
la burbuja y detener el tren del m*** del ML y del Pig Data.
- Gamer los sábados (PSN: xuxoramos).
- Foodie los domingos.
En qué ando?
Lo feo del
#MachineLearning…
#MachineLearning Bubble
Machine
Learning
Montaña rusa sin freno…
$232mmdd
Gran Inversión
4%
Stats/Maths/Prog
Poco skill Mala cultura
Governance:
Datos rehenes
de cabal de IT
…y sin cinturón!
El freno para esta montaña
rusa…
Roadmap+Riesgos para la
banda
Skill
Si eres dev,
métele a stats+maths.
Si eres de maths+stats,
métele a dev.
Biz Intimacy
Olvídate de la
Herramienta.
Enfócate en el
lenguaje de negocio.
Operational
No entregues reportes,
entrega APIs.
Sin contexto
==
Hacer la pregunta
equivocada
No hay
escalamiento
Mala predicción +
Alto sesgo
==
Perder dinero/
lastimar personas
Etapa
Riesgo
Roadmap+Riesgos para orgs
Etapa
Riesgo
DWH
Todos los datos
en 1 solo lugar.
Gov’nance
Total apertura y
con conexiones
SelfServ-BI
Que gente de negocio
se sirva reportes sola.
Mayor sesgo
+
sin
observer
effect
DataScience
==
Reporteo/BI
Correlación
==
Causalidad
Cómo desaceleramos?
Con definiciones (ni peiper).
#MachineLearning para todos
SW Dev
Máquina
(de estados, no la
compu)
Datos
Función/
Programa
Salida
Machine/Statistical Learning Supervisado
Máquina
(de estados, no la
compu)
Salida*
Datos
Función/
Programa**
Contexto
Contexto
* No Supervisado = Sin Salida, ** Reinforcement = Función regresa a datos
#MachineLearning para todos
Objetivo 1: identificar patrones
Error Total
#MachineLearning para todos
Objetivo 2: reducir el error de la función
Error de Predicción
Error del Fenómeno
(Varianza)
Sesgo/Bias
Reducción: más/menos
variables
Reducción: más datos/
observaciones.
Reducción:
CONTEXTO!
#MachineLearning para todos
Varianza vs Sesgo
#MachineLearning para todos
Varianza vs Sesgo
#MachineLearning para todos
Tipos: Clasificación
#MachineLearning para todos
Tipos: Regresión
#MachineLearning para todos
Tipos: Clustering == Clasificación Sin Output
#MachineLearning para todos
Tipos: Dimensionality Redux/Feature Engineering
#MachineLearning para todos
Y cuál uso?
(Los que me den menos varianza y menos bias)
#MachineLearning para todos
Metodología
Describir
Qué me parece
interesante de
mi dataset?
Explorar
Qué research
question quiero
Hacerle a mi
dataset?
Inferir
La respuesta
puede
generalizarse?
Predecir
La respuesta
aplica a nuevas
observaciones?
- Distribuciones
- Media
- Moda
- Kurtosis
- Clustering
- Kohonen
- DBSCAN
- Multidim
Scaling
- Hypo Test
- GLM
- ANOVA
- MSE
- Random
Forest
- Boosting
- Bagging
- Deep
Learning
ML ML
Cross Validation
Data
Training Test Validation
70% 20% 10%
N veces: TestValidation TestValidation TestValidation
Ya le quitamos el m*me al
tren. Ahora...?
Aplicaciones!
B*n*m*x
• Conversión de cliente de nómina a TC en 29%.
• $2.7mmdp en revenue al año desde 2010.
• Cómo lo hizo?
• Clasificación!
f(edad, género, monto, antigüedad, …) = tiene TC
Predictores / variables independientes variable respuesta /
dependiente
UPS
• Ahorro de combustible haciendo que camiones
sólo den vuelta a la derecha.
• Ahorro de $47mdd al año.
• Cómo lo hicieron?
• Diseño de experimentos!
Exploratorio -> Recolección de datos -> Hypothesis
Testing -> GLMs -> Clasificación
T*lc*l
• Identificación de usrs consumiendo $7K MXN
semanales de tiempo aire en prepago.
• Creación de producto de crédito de tiempo aire
de hasta $2K.
• $4mmdp al año de revenue.
• Cómo lo hicieron?
• Clustering!
Multidimensional Scaling + K-means/DBSCAN
Western Union
• Prevención de fraude en remesas en
automático y personalizado.
• $32mdd en ahorro operativo en 2012. $21mdd
son de transacciones detenidas al momento.
• Cómo le hicieron?
• Clasificación!
• Similar a algoritmos de spam/ham.
Gr*p* *xp*ns**n
• Bajar bounce rate y mantener al visitante en
sitios de las marcas del grupo.
• Aumentar ad impressions.
• Cómo lo están haciendo?
• Recommender Systems!
Clasif 1 + Clasif 2 + … + Clasif N
Qué
música
prefiere?
Qué
comida
prefiere?
Qué
pelis
ha visto?
Y las startups?
En la delantera!
• Konfio, Kueski, Prestadero + ensemble
learning = credit scoring.
• Piggo + multidimensional scaling + DBSCAN =
recomendación de inversiones.
• Klustera + Filtros Kalman (un tipo de
regresión) = ubicación exacta de gente en
centros comerciales.
• HolaGus + deep convolutional neural networks
= clasificación de texto.
Caso interesante: FullHarvest
• Time Series de granjas y huertos en tiempo de
cosecha.
• Clasificación para planeación de recolecciones.
• Optimización heurística para trazo de rutas.
• Regresión múltiple para planeación de demanda y
pricing.
• Ensemble para transformación y saber qué
producir.
• Optimización para ruta de entrega.
Bottomline:
El ML ayuda a escalar
servicios para el 99%!
Qué puede salir mal?
Todo!
#MachineLearning Flops
• Google Flu Trends – Contexto = predicción
fallida de AH1N1 en Francia.
• Google Image Classifier – Contexto = 2
afroamericanos taggeados como ‘gorilas’.
• Walmart + Modelo complejo de alta varianza =
productos en mal estado vendidos a clientes.
• Wall Street + Model simple de alto bias = crisis
hipotecaria de 2008
• T*lc*l – Contexto = Préstamos a sospechosos.
Concluyendo…
Soy dev…cómo le entro al
ML?
• Comienza por prepararte en mates y estadística. Leete
“Think Stats” de Allen Downey.
• Acércate al depto de mates de tu universidad. Seguro
encuentras diplomados en mates.
• MOOCs: “Data Science Specialization” de Coursera es la
opción.
• Síguele con el de Andrew Ng de Stanford. Piérdele el miedo
a la notación formal.
• No te cases ni con Python ni con R. Usa ambos.
• No te cases con ningún algoritmo. Primero pregunta “qué
quiero lograr?”
• Context is KING!
Y si ya le se al ML?
• Platícanos tu proyecto en ramos.cardona@gmail.com
para que lo presentes en @thedatapub.
• Mándame un correo. Andamos reclutando!
• Sé humilde ante lo que te falta por aprender.
• Acércate a disciplinas complementarias de la ciencia
de datos: topología, diseño de experimentos,
optimización, visualización y storytelling.
• Comparte tu conocimiento. Ojalá seas tú el próximo
acá arriba!
¿Preguntas?
Grax!
@xuxoramos
ramos.cardona@gmail.com
linkedin.com/in/xuxoramos

Más contenido relacionado

Destacado

Big Data, Big Disappointment
Big Data, Big DisappointmentBig Data, Big Disappointment
Big Data, Big DisappointmentJesus Ramos
 
Big Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithmsBig Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithmsJesus Ramos
 
Mexican Landscape of DS & AI
Mexican Landscape of DS & AIMexican Landscape of DS & AI
Mexican Landscape of DS & AIJesus Ramos
 
Wonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis ApplicationsWonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis ApplicationsJesus Ramos
 
Patrones del Modelo de Dominio en el Paradigma Orientado a Objetos
Patrones del Modelo de Dominio en el Paradigma Orientado a ObjetosPatrones del Modelo de Dominio en el Paradigma Orientado a Objetos
Patrones del Modelo de Dominio en el Paradigma Orientado a ObjetosHector Cuesta Arvizu
 
Dana Clinic Management System (DCMS)
Dana Clinic Management System (DCMS)Dana Clinic Management System (DCMS)
Dana Clinic Management System (DCMS)zaherdouri
 
A CTO's Guide to Scaling Organizations
A CTO's Guide to Scaling OrganizationsA CTO's Guide to Scaling Organizations
A CTO's Guide to Scaling OrganizationsRandy Shoup
 
Leading the Data Asset Management Team: CDO or Top Data Job?
Leading the Data Asset Management Team: CDO or Top Data Job?Leading the Data Asset Management Team: CDO or Top Data Job?
Leading the Data Asset Management Team: CDO or Top Data Job?Data Blueprint
 

Destacado (10)

Big Data, Big Disappointment
Big Data, Big DisappointmentBig Data, Big Disappointment
Big Data, Big Disappointment
 
Big Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithmsBig Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithms
 
Mexican Landscape of DS & AI
Mexican Landscape of DS & AIMexican Landscape of DS & AI
Mexican Landscape of DS & AI
 
Wonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis ApplicationsWonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis Applications
 
Coursera_MachineLearning
Coursera_MachineLearningCoursera_MachineLearning
Coursera_MachineLearning
 
Articulo de cuda
Articulo de cudaArticulo de cuda
Articulo de cuda
 
Patrones del Modelo de Dominio en el Paradigma Orientado a Objetos
Patrones del Modelo de Dominio en el Paradigma Orientado a ObjetosPatrones del Modelo de Dominio en el Paradigma Orientado a Objetos
Patrones del Modelo de Dominio en el Paradigma Orientado a Objetos
 
Dana Clinic Management System (DCMS)
Dana Clinic Management System (DCMS)Dana Clinic Management System (DCMS)
Dana Clinic Management System (DCMS)
 
A CTO's Guide to Scaling Organizations
A CTO's Guide to Scaling OrganizationsA CTO's Guide to Scaling Organizations
A CTO's Guide to Scaling Organizations
 
Leading the Data Asset Management Team: CDO or Top Data Job?
Leading the Data Asset Management Team: CDO or Top Data Job?Leading the Data Asset Management Team: CDO or Top Data Job?
Leading the Data Asset Management Team: CDO or Top Data Job?
 

Similar a ML para organizaciones: Cómo desacelerar la montaña rusa y aplicarlo de forma responsable

Machine Learning para Organizaciones
Machine Learning para OrganizacionesMachine Learning para Organizaciones
Machine Learning para OrganizacionesSoftware Guru
 
Solid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizacionesSolid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizacionesSoftware Guru
 
Emprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AIEmprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AISoftware Guru
 
Ultrapersonalización en la Web
Ultrapersonalización en la WebUltrapersonalización en la Web
Ultrapersonalización en la Webamdia
 
El futuro de marketing an america latina (16 9)
El futuro de marketing an america latina (16 9)El futuro de marketing an america latina (16 9)
El futuro de marketing an america latina (16 9)Esteban Kolsky
 
With Big Data comes Great Power
With Big Data comes Great PowerWith Big Data comes Great Power
With Big Data comes Great PowerMarco Casalino
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónErnesto Mislej
 
Alex Sanchez - eRetail Day México Blended [Professional] Experience - Web 3 ...
Alex Sanchez  - eRetail Day México Blended [Professional] Experience - Web 3 ...Alex Sanchez  - eRetail Day México Blended [Professional] Experience - Web 3 ...
Alex Sanchez - eRetail Day México Blended [Professional] Experience - Web 3 ...eCommerce Institute
 
Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018Gerard Alba
 
Globalstar simplex services (logistic summit)
Globalstar   simplex services (logistic summit)Globalstar   simplex services (logistic summit)
Globalstar simplex services (logistic summit)Carlos Veracoechea
 
El Big Data en la dirección comercial: market(ing) intelligence
El Big Data en la dirección comercial: market(ing) intelligenceEl Big Data en la dirección comercial: market(ing) intelligence
El Big Data en la dirección comercial: market(ing) intelligenceAlex Rayón Jerez
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouseEduardo Castro
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azureEduardo Castro
 
Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414Gerard Alba
 

Similar a ML para organizaciones: Cómo desacelerar la montaña rusa y aplicarlo de forma responsable (20)

Machine Learning para Organizaciones
Machine Learning para OrganizacionesMachine Learning para Organizaciones
Machine Learning para Organizaciones
 
Solid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizacionesSolid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizaciones
 
Fundamentos Minería Datos
Fundamentos Minería DatosFundamentos Minería Datos
Fundamentos Minería Datos
 
Emprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AIEmprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AI
 
EMBD2018 | Autotuning en modelos de Machine Learning
EMBD2018 | Autotuning en modelos de Machine LearningEMBD2018 | Autotuning en modelos de Machine Learning
EMBD2018 | Autotuning en modelos de Machine Learning
 
Data Mining
Data MiningData Mining
Data Mining
 
Ultrapersonalización en la Web
Ultrapersonalización en la WebUltrapersonalización en la Web
Ultrapersonalización en la Web
 
Intl
IntlIntl
Intl
 
Big data centrologic 2016
Big data centrologic 2016Big data centrologic 2016
Big data centrologic 2016
 
El futuro de marketing an america latina (16 9)
El futuro de marketing an america latina (16 9)El futuro de marketing an america latina (16 9)
El futuro de marketing an america latina (16 9)
 
With Big Data comes Great Power
With Big Data comes Great PowerWith Big Data comes Great Power
With Big Data comes Great Power
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
Alex Sanchez - eRetail Day México Blended [Professional] Experience - Web 3 ...
Alex Sanchez  - eRetail Day México Blended [Professional] Experience - Web 3 ...Alex Sanchez  - eRetail Day México Blended [Professional] Experience - Web 3 ...
Alex Sanchez - eRetail Day México Blended [Professional] Experience - Web 3 ...
 
Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018
 
Globalstar simplex services (logistic summit)
Globalstar   simplex services (logistic summit)Globalstar   simplex services (logistic summit)
Globalstar simplex services (logistic summit)
 
El Big Data en la dirección comercial: market(ing) intelligence
El Big Data en la dirección comercial: market(ing) intelligenceEl Big Data en la dirección comercial: market(ing) intelligence
El Big Data en la dirección comercial: market(ing) intelligence
 
Transformación de datos_RaulSao - MaratónVirtualPP.pptx
Transformación de datos_RaulSao - MaratónVirtualPP.pptxTransformación de datos_RaulSao - MaratónVirtualPP.pptx
Transformación de datos_RaulSao - MaratónVirtualPP.pptx
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414
 

Último

La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfJC Díaz Herrera
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfJC Díaz Herrera
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfJC Díaz Herrera
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfJC Díaz Herrera
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfJC Díaz Herrera
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdfFamilias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdfJC Díaz Herrera
 
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...JC Díaz Herrera
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,juberrodasflores
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfRodrigoBenitez38
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 

Último (20)

La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdf
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdfFamilias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdf
 
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 

ML para organizaciones: Cómo desacelerar la montaña rusa y aplicarlo de forma responsable

  • 1. Ya eres parte de la evolución Solid Day #MachineLearning para Organizaciones Jesus Ramos @xuxoramos ramos.cardona@gmail.com linkedin.com/in/xuxoramos #sgnext
  • 2. Y éste qué? - Ingeniero de Software de nacimiento (ITESM). - Econometrista Financiero por azar (Unottingham + UWashington). - Estadístico Computacional por convicción (Coursera, a mucha honra). - Consultado con 6 firmas (BMV, GBM, ConCredito, Movistar, etc) para levantar sus capacidades analíticas. - Co fundador de @TheDataPub, comunidad dedicada a reventar la burbuja y detener el tren del m*** del ML y del Pig Data. - Gamer los sábados (PSN: xuxoramos). - Foodie los domingos.
  • 6. Montaña rusa sin freno… $232mmdd Gran Inversión 4% Stats/Maths/Prog Poco skill Mala cultura Governance: Datos rehenes de cabal de IT
  • 8. El freno para esta montaña rusa…
  • 9. Roadmap+Riesgos para la banda Skill Si eres dev, métele a stats+maths. Si eres de maths+stats, métele a dev. Biz Intimacy Olvídate de la Herramienta. Enfócate en el lenguaje de negocio. Operational No entregues reportes, entrega APIs. Sin contexto == Hacer la pregunta equivocada No hay escalamiento Mala predicción + Alto sesgo == Perder dinero/ lastimar personas Etapa Riesgo
  • 10. Roadmap+Riesgos para orgs Etapa Riesgo DWH Todos los datos en 1 solo lugar. Gov’nance Total apertura y con conexiones SelfServ-BI Que gente de negocio se sirva reportes sola. Mayor sesgo + sin observer effect DataScience == Reporteo/BI Correlación == Causalidad
  • 12. #MachineLearning para todos SW Dev Máquina (de estados, no la compu) Datos Función/ Programa Salida Machine/Statistical Learning Supervisado Máquina (de estados, no la compu) Salida* Datos Función/ Programa** Contexto Contexto * No Supervisado = Sin Salida, ** Reinforcement = Función regresa a datos
  • 13. #MachineLearning para todos Objetivo 1: identificar patrones
  • 14. Error Total #MachineLearning para todos Objetivo 2: reducir el error de la función Error de Predicción Error del Fenómeno (Varianza) Sesgo/Bias Reducción: más/menos variables Reducción: más datos/ observaciones. Reducción: CONTEXTO!
  • 19. #MachineLearning para todos Tipos: Clustering == Clasificación Sin Output
  • 20. #MachineLearning para todos Tipos: Dimensionality Redux/Feature Engineering
  • 21. #MachineLearning para todos Y cuál uso? (Los que me den menos varianza y menos bias)
  • 22. #MachineLearning para todos Metodología Describir Qué me parece interesante de mi dataset? Explorar Qué research question quiero Hacerle a mi dataset? Inferir La respuesta puede generalizarse? Predecir La respuesta aplica a nuevas observaciones? - Distribuciones - Media - Moda - Kurtosis - Clustering - Kohonen - DBSCAN - Multidim Scaling - Hypo Test - GLM - ANOVA - MSE - Random Forest - Boosting - Bagging - Deep Learning ML ML
  • 23. Cross Validation Data Training Test Validation 70% 20% 10% N veces: TestValidation TestValidation TestValidation
  • 24. Ya le quitamos el m*me al tren. Ahora...? Aplicaciones!
  • 25. B*n*m*x • Conversión de cliente de nómina a TC en 29%. • $2.7mmdp en revenue al año desde 2010. • Cómo lo hizo? • Clasificación! f(edad, género, monto, antigüedad, …) = tiene TC Predictores / variables independientes variable respuesta / dependiente
  • 26. UPS • Ahorro de combustible haciendo que camiones sólo den vuelta a la derecha. • Ahorro de $47mdd al año. • Cómo lo hicieron? • Diseño de experimentos! Exploratorio -> Recolección de datos -> Hypothesis Testing -> GLMs -> Clasificación
  • 27. T*lc*l • Identificación de usrs consumiendo $7K MXN semanales de tiempo aire en prepago. • Creación de producto de crédito de tiempo aire de hasta $2K. • $4mmdp al año de revenue. • Cómo lo hicieron? • Clustering! Multidimensional Scaling + K-means/DBSCAN
  • 28. Western Union • Prevención de fraude en remesas en automático y personalizado. • $32mdd en ahorro operativo en 2012. $21mdd son de transacciones detenidas al momento. • Cómo le hicieron? • Clasificación! • Similar a algoritmos de spam/ham.
  • 29. Gr*p* *xp*ns**n • Bajar bounce rate y mantener al visitante en sitios de las marcas del grupo. • Aumentar ad impressions. • Cómo lo están haciendo? • Recommender Systems! Clasif 1 + Clasif 2 + … + Clasif N Qué música prefiere? Qué comida prefiere? Qué pelis ha visto?
  • 31. En la delantera! • Konfio, Kueski, Prestadero + ensemble learning = credit scoring. • Piggo + multidimensional scaling + DBSCAN = recomendación de inversiones. • Klustera + Filtros Kalman (un tipo de regresión) = ubicación exacta de gente en centros comerciales. • HolaGus + deep convolutional neural networks = clasificación de texto.
  • 32. Caso interesante: FullHarvest • Time Series de granjas y huertos en tiempo de cosecha. • Clasificación para planeación de recolecciones. • Optimización heurística para trazo de rutas. • Regresión múltiple para planeación de demanda y pricing. • Ensemble para transformación y saber qué producir. • Optimización para ruta de entrega.
  • 33. Bottomline: El ML ayuda a escalar servicios para el 99%!
  • 34. Qué puede salir mal? Todo!
  • 35. #MachineLearning Flops • Google Flu Trends – Contexto = predicción fallida de AH1N1 en Francia. • Google Image Classifier – Contexto = 2 afroamericanos taggeados como ‘gorilas’. • Walmart + Modelo complejo de alta varianza = productos en mal estado vendidos a clientes. • Wall Street + Model simple de alto bias = crisis hipotecaria de 2008 • T*lc*l – Contexto = Préstamos a sospechosos.
  • 37. Soy dev…cómo le entro al ML? • Comienza por prepararte en mates y estadística. Leete “Think Stats” de Allen Downey. • Acércate al depto de mates de tu universidad. Seguro encuentras diplomados en mates. • MOOCs: “Data Science Specialization” de Coursera es la opción. • Síguele con el de Andrew Ng de Stanford. Piérdele el miedo a la notación formal. • No te cases ni con Python ni con R. Usa ambos. • No te cases con ningún algoritmo. Primero pregunta “qué quiero lograr?” • Context is KING!
  • 38. Y si ya le se al ML? • Platícanos tu proyecto en ramos.cardona@gmail.com para que lo presentes en @thedatapub. • Mándame un correo. Andamos reclutando! • Sé humilde ante lo que te falta por aprender. • Acércate a disciplinas complementarias de la ciencia de datos: topología, diseño de experimentos, optimización, visualización y storytelling. • Comparte tu conocimiento. Ojalá seas tú el próximo acá arriba!

Notas del editor

  1. fdsfds