En esta plática hablo sobre lo que es el Machine Learning y cómo puede ayudarnos para resolver problemas de clasificación, predicción y detección de anomalías en función de los datos que tenemos. Además, hablamos de Azure Machine Learning como plataforma para simplificar la creación de experimentos de ML, así como su consumo en una app móvil.
Video de la charla: https://youtu.be/zC-18rxvOpY
Código fuente en GitHub: https://github.com/icebeam7/CalificacionesApp
Introducción a machine learning con JavaScriptManuel Zapata
Hoy por hoy, Python es el lenguaje de programación por excelencia para machine learning. Sin embargo, cada vez toma más fuerza JavaScript como una alternativa.
JavaScript es especialmente útil en casos en que se requiera hacer entrenamiento y uso de modelos del lado del cliente, en el navegador. Por tal razón, el equipo detrás de TensorFlow, decidió implementar su versión en JavaScript, TensorFlow.js. Al momento de realizar esta presentación, TensorFlow.js se encuentra en una etapa temprana, pero con un gran potencial para acercar el machine learning a las aplicaciones web.
El Aprendizaje Automático (AA), conocido en inglés como Machine Learning, es una rama de la Inteligencia Artificial en la cual su principal objetivo es desarrollar técnicas que permitan a las computadoras aprender, es decir, se considera como un proceso de inducción del conocimiento. Dentro de las aplicaciones de aprendizaje automático están diversas aplicaciones de negocio como motores de búsqueda, diagnósticos médicos, detección de fraude en el uso de tarjetas de crédito, análisis del mercado de valores, clasificación de secuencias de ADN, reconocimiento del habla entre otros. En esta sesión presentaremos alguno de los conceptos fundamentales del AA y mostraremos cómo crear este tipo de soluciones usando Azure Machine Learning, el nuevo servicio de Azure completamente administrado en la nube y que puede ser integrado en nuestras aplicaciones tradicionales de negocio.
Internet, Big Data e Inteligencia ArtificialCleverTask
Vídeo de la charla: https://www.youtube.com/watch?v=9BrIwVbZZ7c
Revisar la evolución de Internet nos sirve para ver en qué punto estamos, cómo ha surgido el concepto Big Data y por qué la Inteligencia Artificial está evolucionando rápidamente en los últimos años, cuando en realidad las primeras experiencias se dieron a mediados del siglo pasado.
El Machine Learning es una disciplina de la Inteligencia Artificial que crea sistemas (a veces llamados "robots") que aprenden de los datos. Deep Learning es una rama del Machine Learning que pretende simular el funcionamiento del cerebro humano.
Slides de la charla "Machine learning a lo berserker". Una charla que consiste en explicar Machine Learning a lo bruto y con un poco de irresponsabilidad :P Nada de mates y un poco de sentido práctico.
Más información: http://berserker.science
Conceptos basicos de aprendizaje de maquina, asi como sus aplicaciones e implementaciones en Java, presentación realizada en el Oracle Develooper Tour 2016.
Machine Learning: ¿Caminos? A donde vamos, no necesitamos caminosEgdares Futch H.
Presentación sobre la evolución de la investigación en Inteligencia Artificial hacia el Machine Learning para la ceremonia de entrega de distintivos de Ingeniería de Sistemas UNITEC
En esta plática hablo sobre lo que es el Machine Learning y cómo puede ayudarnos para resolver problemas de clasificación, predicción y detección de anomalías en función de los datos que tenemos. Además, hablamos de Azure Machine Learning como plataforma para simplificar la creación de experimentos de ML, así como su consumo en una app móvil.
Video de la charla: https://youtu.be/zC-18rxvOpY
Código fuente en GitHub: https://github.com/icebeam7/CalificacionesApp
Introducción a machine learning con JavaScriptManuel Zapata
Hoy por hoy, Python es el lenguaje de programación por excelencia para machine learning. Sin embargo, cada vez toma más fuerza JavaScript como una alternativa.
JavaScript es especialmente útil en casos en que se requiera hacer entrenamiento y uso de modelos del lado del cliente, en el navegador. Por tal razón, el equipo detrás de TensorFlow, decidió implementar su versión en JavaScript, TensorFlow.js. Al momento de realizar esta presentación, TensorFlow.js se encuentra en una etapa temprana, pero con un gran potencial para acercar el machine learning a las aplicaciones web.
El Aprendizaje Automático (AA), conocido en inglés como Machine Learning, es una rama de la Inteligencia Artificial en la cual su principal objetivo es desarrollar técnicas que permitan a las computadoras aprender, es decir, se considera como un proceso de inducción del conocimiento. Dentro de las aplicaciones de aprendizaje automático están diversas aplicaciones de negocio como motores de búsqueda, diagnósticos médicos, detección de fraude en el uso de tarjetas de crédito, análisis del mercado de valores, clasificación de secuencias de ADN, reconocimiento del habla entre otros. En esta sesión presentaremos alguno de los conceptos fundamentales del AA y mostraremos cómo crear este tipo de soluciones usando Azure Machine Learning, el nuevo servicio de Azure completamente administrado en la nube y que puede ser integrado en nuestras aplicaciones tradicionales de negocio.
Internet, Big Data e Inteligencia ArtificialCleverTask
Vídeo de la charla: https://www.youtube.com/watch?v=9BrIwVbZZ7c
Revisar la evolución de Internet nos sirve para ver en qué punto estamos, cómo ha surgido el concepto Big Data y por qué la Inteligencia Artificial está evolucionando rápidamente en los últimos años, cuando en realidad las primeras experiencias se dieron a mediados del siglo pasado.
El Machine Learning es una disciplina de la Inteligencia Artificial que crea sistemas (a veces llamados "robots") que aprenden de los datos. Deep Learning es una rama del Machine Learning que pretende simular el funcionamiento del cerebro humano.
Slides de la charla "Machine learning a lo berserker". Una charla que consiste en explicar Machine Learning a lo bruto y con un poco de irresponsabilidad :P Nada de mates y un poco de sentido práctico.
Más información: http://berserker.science
Conceptos basicos de aprendizaje de maquina, asi como sus aplicaciones e implementaciones en Java, presentación realizada en el Oracle Develooper Tour 2016.
Machine Learning: ¿Caminos? A donde vamos, no necesitamos caminosEgdares Futch H.
Presentación sobre la evolución de la investigación en Inteligencia Artificial hacia el Machine Learning para la ceremonia de entrega de distintivos de Ingeniería de Sistemas UNITEC
La Práctica de Machine Learning en la empresaSoftware Guru
En esta sesión expondremos el impacto que machine learning tendra en la competividad de las empresas, así como revisar casos concretos del tipo de problemas que machine learning resuelve hoy en día. Así mismo, compartiremos un modelo de adopción de machine learning que los asistentes puedan utilizar para introducir esta práctica en sus organizaciones.
Semblanza del conferencista:
Manuel Reyes es investigador y consultor en análisis de datos. Cuenta con un doctorado en Ingeniería Eléctrica por la Universidad de Columbia y durante 7 años colaboró como investigador para el grupo de Bing en el corporativo de Microsoft en Redmond, Washington.
Emilio Osorio es Consultor Principal en Sistemas Humanos, un colectivo de profesionistas especializados en procesos de adopción y apropiación en tecnologías. Cuenta con una larga trayectoria en la industria de TI, habiendo fundado empresas como NexusNet, Nexusware y el mismo Sistemas Humanos. Emilio también gusta de participar como voluntario en una gama de proyectos y organizaciones sin fines de lucro en proyectos relacionados con educación, tecnología y cultura libres. http://mx.linkedin.com/in/minoruosorio
Empieza a utilizar Big Data en tus análisis
Vivimos en un mundo “Big Data”. Este término está relacionado con la tecnología para manejar inmensas cantidades de datos, recogidas en diferentes formatos y a partir de una gran variedad de orígenes cada segundo. Estos datos hablan de nosotros, de nuestra vida diaria y son recogidos tanto de fuentes nuevas como tradicionales, constituyendo una gran oportunidad de mejorar el conocimiento de los clientes.
Uno de los principales factores de éxito en las empresas de hoy es convertir esos grandes volúmenes de datos, siempre cambiantes y de orígenes diversos, en información válida para la toma de decisiones.
En este curso de big data aprenderás, desde un punto de vista práctico y realista, a abordar y resolver problemáticas analíticas desde entornos big data, dando respuestas a través de soluciones tecnológicas tanto en tiempo real como en diferido. Recorreremos contigo el camino desde el área de análisis de cliente, CRM o B.I. tradicionales hacia los nuevos retos en proyectos Big Data.
¿Quieres convertirte en un experto en Big Data?
¿Se puede estimar adecuadamente los proyectos de software?Software Guru
El objetivo de este webinar es presentar a los asistentes la problemática actual de la estimación de los proyectos de software y plantear alternativas de solución. Siendo la estimación de proyectos de software un factor crítico para el aprovechamiento de recursos, asegurar la rentabilidad y satisfacer a los clientes y usuarios, es un tema sumamente importante para todo aquel Líder de Proyecto, Ejecutivo(a) comercial de TI y Desarrolladores de software.
Crear un Simulador de Comercio Exterior Relacionado con los Incoterms Christian Mina Villalba
Crear un Simulador de Comercio Exterior relacionado con los Incoterms para que los estudiantes de comercio exterior o personas que estén interesadas en estos temas puedan aprenderlos de forma práctica y sencilla, teniendo una experiencia personal y propia con cada uno de los parámetros a estudiar.
Metodologia de un proyecto seo, metodología básica para implantar un nuevo proyecto SEO:
1- Introducción.
2- Objetivos del proyecto y estudio previo.
3- Planificación e implementación.
4- Medición, informes, KPIs.
7º Webinar - 3ª Ed. EXIN en Castellano: 6 maneras de crear valor con Lean ITEXIN
En este webinar se explicará y definirán 6 maneras de cómo generar valor a nuestros clientes a través de la entrega de nuestros servicios, optimizando recursos, eliminando lo innecesario de sus procesos, y orientándonos a la calidad, para finalmente lograr una mayor satisfacción de nuestros clientes, y esto se puede conseguir implementando e inculcando el pensamiento LEAN, el que a través de sus principios claves lo puede lograr evaluando la percepción que existe de parte del cliente en la cadena de valor, creando flujos continuos y fluidos, enfocándose en la demanda justa sin caer en excesos y orientarse a la perfección de sus procesos, para esto se debe tener un especial cuidado en estas cinco dimensiones: el cliente, los procesos, el rendimiento, la organización y el comportamiento y actitud de las personas.
La charla tiene como objetivo repasar la experiencia de introducir el Agilismo aprovechando las oportunidades de Mejora Continua producidas por el interés en acreditarse en niveles de madurez CMMI, en una organización veterna, con muchos años de historia.
La experiencia está basada en la sucedida en Tecsidel Valladolid, partiendo de su departamento de Proyectos Cerrados -como centro puntero en la compañía en nuevos modelos de servicio a clientes- hacia el resto de la organización.
Creando tendencias a través del planeamiento estratégicoStraTgia
“Estrategia” es lo que hacen las empresas para lograr algo; sin embargo, el 80% de lo que hacen para conseguir sus metas es lo mismo. Todas generan sinergias, captan y retienen talento, expanden su distribución o desarrollan nuevos productos, entre otros. Entonces, ¿por qué compraría un consumidor? Sencillo, por el precio, por lo que las empresas, poco a poco, irán desapareciendo. Entonces falta algo en la definición de “estrategia” -lo más importante-, y es que “estrategia” es lo que hace la empresa para diferenciarse del resto.
Manuel Ramos Topham, Ph.D.
Director General de StraTgia
#manuelramostopham #manueladolforamostopham
Haz realidad tu proyecto, Cómo hacer una app movil en 30 díasDavid Muñoz Gaete
Una guía/charla casi motivacional de como generar un proyecto de emprendimiento , de acuerdo a mi experiencia personal ;)!.
El desafio: Hacer una app para ios y android en 30 días
En la primera sesión para Comunidad Platzi, Alysson enseña acerca de como aplicar la metodología de Design Thinking y LEAN UX para crear Experiencias en un MVP en 2 meses.
La Práctica de Machine Learning en la empresaSoftware Guru
En esta sesión expondremos el impacto que machine learning tendra en la competividad de las empresas, así como revisar casos concretos del tipo de problemas que machine learning resuelve hoy en día. Así mismo, compartiremos un modelo de adopción de machine learning que los asistentes puedan utilizar para introducir esta práctica en sus organizaciones.
Semblanza del conferencista:
Manuel Reyes es investigador y consultor en análisis de datos. Cuenta con un doctorado en Ingeniería Eléctrica por la Universidad de Columbia y durante 7 años colaboró como investigador para el grupo de Bing en el corporativo de Microsoft en Redmond, Washington.
Emilio Osorio es Consultor Principal en Sistemas Humanos, un colectivo de profesionistas especializados en procesos de adopción y apropiación en tecnologías. Cuenta con una larga trayectoria en la industria de TI, habiendo fundado empresas como NexusNet, Nexusware y el mismo Sistemas Humanos. Emilio también gusta de participar como voluntario en una gama de proyectos y organizaciones sin fines de lucro en proyectos relacionados con educación, tecnología y cultura libres. http://mx.linkedin.com/in/minoruosorio
Empieza a utilizar Big Data en tus análisis
Vivimos en un mundo “Big Data”. Este término está relacionado con la tecnología para manejar inmensas cantidades de datos, recogidas en diferentes formatos y a partir de una gran variedad de orígenes cada segundo. Estos datos hablan de nosotros, de nuestra vida diaria y son recogidos tanto de fuentes nuevas como tradicionales, constituyendo una gran oportunidad de mejorar el conocimiento de los clientes.
Uno de los principales factores de éxito en las empresas de hoy es convertir esos grandes volúmenes de datos, siempre cambiantes y de orígenes diversos, en información válida para la toma de decisiones.
En este curso de big data aprenderás, desde un punto de vista práctico y realista, a abordar y resolver problemáticas analíticas desde entornos big data, dando respuestas a través de soluciones tecnológicas tanto en tiempo real como en diferido. Recorreremos contigo el camino desde el área de análisis de cliente, CRM o B.I. tradicionales hacia los nuevos retos en proyectos Big Data.
¿Quieres convertirte en un experto en Big Data?
¿Se puede estimar adecuadamente los proyectos de software?Software Guru
El objetivo de este webinar es presentar a los asistentes la problemática actual de la estimación de los proyectos de software y plantear alternativas de solución. Siendo la estimación de proyectos de software un factor crítico para el aprovechamiento de recursos, asegurar la rentabilidad y satisfacer a los clientes y usuarios, es un tema sumamente importante para todo aquel Líder de Proyecto, Ejecutivo(a) comercial de TI y Desarrolladores de software.
Crear un Simulador de Comercio Exterior Relacionado con los Incoterms Christian Mina Villalba
Crear un Simulador de Comercio Exterior relacionado con los Incoterms para que los estudiantes de comercio exterior o personas que estén interesadas en estos temas puedan aprenderlos de forma práctica y sencilla, teniendo una experiencia personal y propia con cada uno de los parámetros a estudiar.
Metodologia de un proyecto seo, metodología básica para implantar un nuevo proyecto SEO:
1- Introducción.
2- Objetivos del proyecto y estudio previo.
3- Planificación e implementación.
4- Medición, informes, KPIs.
7º Webinar - 3ª Ed. EXIN en Castellano: 6 maneras de crear valor con Lean ITEXIN
En este webinar se explicará y definirán 6 maneras de cómo generar valor a nuestros clientes a través de la entrega de nuestros servicios, optimizando recursos, eliminando lo innecesario de sus procesos, y orientándonos a la calidad, para finalmente lograr una mayor satisfacción de nuestros clientes, y esto se puede conseguir implementando e inculcando el pensamiento LEAN, el que a través de sus principios claves lo puede lograr evaluando la percepción que existe de parte del cliente en la cadena de valor, creando flujos continuos y fluidos, enfocándose en la demanda justa sin caer en excesos y orientarse a la perfección de sus procesos, para esto se debe tener un especial cuidado en estas cinco dimensiones: el cliente, los procesos, el rendimiento, la organización y el comportamiento y actitud de las personas.
La charla tiene como objetivo repasar la experiencia de introducir el Agilismo aprovechando las oportunidades de Mejora Continua producidas por el interés en acreditarse en niveles de madurez CMMI, en una organización veterna, con muchos años de historia.
La experiencia está basada en la sucedida en Tecsidel Valladolid, partiendo de su departamento de Proyectos Cerrados -como centro puntero en la compañía en nuevos modelos de servicio a clientes- hacia el resto de la organización.
Creando tendencias a través del planeamiento estratégicoStraTgia
“Estrategia” es lo que hacen las empresas para lograr algo; sin embargo, el 80% de lo que hacen para conseguir sus metas es lo mismo. Todas generan sinergias, captan y retienen talento, expanden su distribución o desarrollan nuevos productos, entre otros. Entonces, ¿por qué compraría un consumidor? Sencillo, por el precio, por lo que las empresas, poco a poco, irán desapareciendo. Entonces falta algo en la definición de “estrategia” -lo más importante-, y es que “estrategia” es lo que hace la empresa para diferenciarse del resto.
Manuel Ramos Topham, Ph.D.
Director General de StraTgia
#manuelramostopham #manueladolforamostopham
Haz realidad tu proyecto, Cómo hacer una app movil en 30 díasDavid Muñoz Gaete
Una guía/charla casi motivacional de como generar un proyecto de emprendimiento , de acuerdo a mi experiencia personal ;)!.
El desafio: Hacer una app para ios y android en 30 días
En la primera sesión para Comunidad Platzi, Alysson enseña acerca de como aplicar la metodología de Design Thinking y LEAN UX para crear Experiencias en un MVP en 2 meses.
Mi presentación en el #SFDMX sobre el software libre, el papel de la tecnología en la evolución del hombre, el consumo, la apropiación y la innovación.
El Impacto Social del Software Libre como un Sistema EvolutivoEmilio Osorio Garcia
Mi ponencia se titula "El impacto social del Software Libre como un Sistema Evolutivo", en la cual tratare temas relacionados de la observación de campo de como la cultura, los mecanismos de participación y la gestión distribuida del proceso de Software Libre están ofreciendo nuevos modelos de participación que tienen un impacto en la sociedad.
Mas que un trabajo de investigación, compartiré una experiencia personal de trabajo en los procesos de apropiación de software libre y en movimientos de activismo social creados o influenciados por este.
Presentación para la Conferencia Virtual SGVirtual. 1ro de Septiembre de 2010
Mucho se ha dicho de Lean-Agile para reducir el Time-to-Market e incrementar la productividad. Presentamos un punto de vista diferente, al proponer la Innovación como la razón de fondo para implementar Lean-Agile.
Lean Development en México: El cambio en la organización y la psicologia labo...Emilio Osorio Garcia
Exposición de Software Guru 07 sobre algunos aspectos de adopción de LSD en la psicologia laboral del México. Producto del trabajo de implementación de Lean-Agile en organizaciones de diferentes tamaños en México
Patrones de Cambio Organizacional en la Adopción de Métodos ÁgilesEmilio Osorio Garcia
Ponencia de patrones de cambio organizacional que pueden ser aplicados para la adopción de metodos Lean-Agile en organizaciones. Es una referencia de las estrategias que los tecnicos podemos hacer para realizar un cambio en la organización aun sin tener poder jerarquico para hacerlo.
Ipsos, empresa de investigación de mercados y opinión pública, divulgó su informe N°29 “Claves Ipsos” correspondiente al mes de abril, que encuestó a 800 personas con el fin de identificar las principales opiniones y comportamientos de las y los ciudadanos respecto de temas de interés para el país. En esta edición se abordó la a Carabineros de Chile, su evaluación, legitimidad en su actuar y el asesinato de tres funcionarios en Cañete. Además, se consultó sobre el Ejército y la opinión respecto de la marcha en Putre.
Este documento ha sido elaborado por el Observatorio Ciudadano de Seguridad Justicia y Legalidad de Irapuato siendo nuestro propósito conocer datos sociodemográficos en conjunto con información de incidencia delictiva de las 10 colonias y/o comunidades que del año 2020 a la fecha han tenido mayor incidencia.
Existen muchas más colonias que presentan cifras y datos en materia de seguridad, sin embargo, en este primer acercamiento lo que se prevées darle al lector una idea de como se encuentran las colonias analizadas, tomando como referencia los datos del INEGI 2020, datos del Secretariado Ejecutivo del Sistema Nacional de Seguridad Pública del 2020 al 2023 y las bases de datos propias que desde el 2017 el Observatorio Ciudadano ha recopilado de manera puntual con datos de las vıć timas de homicidio doloso, accidentes de tránsito, personas lesionadas por arma de fuego, entre otros indicadores.
Reporte homicidio doloso descripción
Reporte que contiene información de las víctimas de homicidio doloso registradas en el municipio de Irapuato Guanajuato durante el periodo señalado, comprende información cualitativa y cuantitativa que hace referencia a las características principales de cada uno de los homicidios.
La información proviene tanto de medios de comunicación digitales e impresos como de los boletines que la propia Fiscalía del Estado de Guanajuato emite de manera diaria a los medios de comunicación quienes publican estas incidencias en sus distintos canales.
Podemos observar cantidad de personas fallecidas, lugar donde se registraron los eventos, colonia y calle así como un comparativo con el mismo periodo pero del año anterior.
Edades y género de las víctimas es parte de la información que incluye el reporte.
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOAaronPleitez
linea de tiempo del antiguo testamento donde se detalla la cronología de todos los eventos, personas, sucesos, etc. Además se incluye una parte del periodo intertestamentario en orden cronológico donde se detalla todo lo que sucede en los 400 años del periodo del silencio. Basicamente es un resumen de todos los sucesos desde Abraham hasta Cristo
1. La práctica de Machine Learning
en la Empresa
Emilio Osorio García
Chief Technology Officer
Predictive Technologies
minoru@predictivecorp.com
Dr. Manuel Reyez Gomez
Chief Data Scientist
Predictive Technologies
manuel@predictivecorp.com
2. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
¿Qué imaginábamos hace 30 años?
3. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
El presente...
* Traducción Liberal
“Las mejores mentes de mi generación están
pensando en como hacer que la gente haga
click en un anuncio. Eso no esta chido”*
-Jeff Hammerback
Cofundador de Cloudera
4. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
¿Donde estaremos en 30 años?
5. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
El estado del arte
• No existen soluciones que
sean “llave en mano”
• Los datos estructurados
crecen exponencialmente
• Se requiere investigación
de los problemas
específicos de negocio
• Baja utilización de los
sistemas analíticos
existentes
• Lidiar con el cambio
constante en los datos
6. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
¿Qué es “Machine Learning”?
• Es una rama de la Inteligencia artificial
• Aprender de los datos
• Descubrir, codificar y modelar patrones
encontrados en los datos (historicos) que
después permitan estimar variables
desconocidas, mediante el uso del contexto
• Representación de los datos (Arte)
• Modelo probabilístico
• Genéricos: Neural Networks, SVMs, Decision Trees, etc
• A la medida usando la infraestructura de modelos
gráficos “Graphical Models Framework”
7. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Detección de fuentes de sonido
F
R
E
C
U
E
N
C
I
A
8. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Prediciendo usando el contexto
9. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Usando el modelo para hallar anomalías
Puntos donde los datos no siguen el modelo
11. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Bing Local
12. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Bing Local
13. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Bing Local
14. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Recomendación de Películas
? ? ? ?
15. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Caracterización de Variables
Es Romántica : (0,1)
Es infantil: [0,1]
Es animada: (0,1)
Tiene director famoso: (0,1)
Tiene actores famosos: (0,1)
Grado de violencia: (0,1,2,3,4,5)
Edad promedio de actores: (Continua)
Año de publicación: (Discreta)
…..
…..
…..
x0
x1
x2
x3
x4
x5
x6
x7
.
.
.
Clasificación : (0,1,2,3,4,5) y
X
16. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Estimación del modelo
X1 = [0, 1, 0, 1, 0, 3, 23.6, 1981]; y1 = 3
X2 = [1, 1, 0, 1, 1, 4, 43.3, 2013]; y2 = 5
X3 = [0, 1, 1, 1, 1, 5, 14.4, 1999]; y3 = 2
X4 = [1, 1, 1, 1, 0, 4, 35.3, 1954]; y4 = 3
X5 = [0, 1, 0, 1, 0, 3, 23.6, 2001]; y5 = 3
X6 = [0, 1, 0, 1, 0, 3, 23.6, 2001]; y6 = 1
….
f(W,X) = y’
w0+w1x1+w2x2+w3x3+…= y’
Estimar el modelo consiste
en estimar W usando los
valores de los ejemplos Xi,
yi de tal manera que
minimice:
(𝑦′𝑖 − 𝑦𝑖)2=
𝑁
𝑖=1
(𝑓(𝑊, 𝑋𝑖) − 𝑦𝑖)2
𝑁
𝑖=1
17. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
En producción
• Para nuevos elementos y sus representaciones X,
se estima sus y’usando el modelo estimado
?
x0
x1
x2
x3
x4
x5
x6
x7
.
.
.
X
w0+w1x1+w2x2+w3x3+…= y’
y’=
18. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Otras soluciones
• Estimación de riesgo crediticio
• Estimación optima de abasto de suministros
• Estimación de probabilidad de perdida del cliente
• Estimación optima de cantidades de mercancía por tipo
y locación (datos no estructurados)
• Selección automática de mejores candidatos para
puestos disponibles
19. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
No se necesita descubrir el hilo negro
• Modelos genéricos accesibles en el mercado
• Lineal Regression
• Neural Networks
• Logistic Regression
• Support Vector Machines
• Decision Trees
• Software Libre
– R Studio
– Mahout
– Weka
– MLib
• Software Licenciado
– Oracle Data Mining
– SAS Advance Analytics
– IBM Predictive
Analytics
– Matlab
20. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
60% Arte – 40% Ciencia
• Representación (Arte)
• Representación que generalice correctamente
• Representación que induzca transferencia
• Limpieza de datos
• Normalización de valores
• Ajustar representación a las limitaciones del modelo
• Fecha de Publicación: Decision Tree-> Continua
• Logistic Regression: discretizada binaria. [1985-1990]
• Ciencia
• Selección o diseño del modelo
• Prevención de “overfitting”
• Regularización de parámetros
• Análisis de errores (experto de dominio)
• Estar consciente de las limitaciones del modelo
21. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Modelos genéricos vs. a la medida
• Modelos genéricos
• Modelos a la medida
Información
del
sistema Modelo
Información del sistema se debe transformar/adaptar al modelo
Información
del
sistema Modelo
Modelo
Modelo se diseña dada la Información del sistema
22. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Modelos genéricos vs. a la medida
• Modelos genéricos
• Pros
• Sus propiedades y características han sido ampliamente estudiadas
• Muchas implementaciones optimas disponibles
• Fáciles de entrenar y probar
• Cons
• La información del sistema requiere de un proceso adecuado de los
valores en sus variables para ajustarlas a las predisposiciones y
limitaciones de cada modelo
• Tienen Limitaciones, al ser genéricos no son los suficientemente
ricos para modelar sistemas complejos
• No son apropiadas para problemas con mas de una variable de
salida que interactúan entre si
23. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Modelos genéricos vs. a la medida
• Modelos a la medida
• Pros
• Como se diseñan para modelar el sistema sin las limitaciones de los
modelos genéricos tienen mejor desempeño
• Se pueden patentar
• Dan ventajas competitivas
• Apropiados para sistemas donde se requiere estimar varias variables
de salida que interactúan entre si. (Predicción de Trafico)
• Cons
• Requieren diseño especializado por lo tanto las soluciones son mas
caras que cuando usando modelos genéricos
• Soluciones
• Soluciones basadas en modelos a la medida requieren mas testeo
que las basadas en modelos genéricos
• Soluciones requieren mas tiempo de implementación
24. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Pasos para implementar en relación al
data scientist
• Fase 1
• Análisis de factibilidad en datos históricos disponibles.
Determinar si se tienen suficientes y diversos datos que cubran
las diferentes condiciones del sistema
• Fase 2 con modelos genéricos
• Diseño e implementación de la representación de variables
• Selección del modelo
• Estimación del modelo (con regularización y “tunning” para
evitar “overfitting”)
• Análisis de errores
• Recalibración del modelo
25. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Machine Learning como Práctica
• En esencia es
investigación y
desarrollo
• El reto es como crear
una práctica que tenga
resultados de negocio
• ¿Como operacionalizar
la inteligencia artificial?
26. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Las fases de la metodología CRISP-DM
27. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Lean Machine Learning
• Eliminar el derroche
• Construir con Calidad
Incluida
• Respetar a las Personas
• Crear conocimiento
• Diferir los compromisos
• Entregar Rápido
• Optimizar el Todo
28. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Los roles de equipo en Machine Learning
• Business Product Owner
• Business Domain Expert
• Data Scientist
• Data Analyst
• Machine Learning
Engineer
• Data Engineer
29. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Nuevas habilidades requeridas
• Formulación correcta de problemas
• Cultura de Prototipaje
• Intuición para tomar realizar asunciones a
problemas no muy bien definidos
• Diseñar experimentos para probar hipótesis
• Analizar resultados y plantear mejoras
continuamente
30. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Tecnología: Software Libre para aprender
31. Manuel Reyes / manuel@predictivecorp.com SGCE 2014 Emilio Osorio / minoru@predictivecorp.com
Tecnología: Proveedores para escalar
32. Preguntas y Respuestas
Emilio Osorio García
Chief Technology Officer
Predictive Technologies
minoru@predictivecorp.com
Dr. Manuel Reyez Gomez
Chief Data Scientist
Predictive Technologies
manuel@predictivecorp.com