Luis Beltrán
• Microsoft MVP en Tecnologías de Desarrollador
• Investigador y estudiante de doctorado en la
Universidad Tomás Bata en Zlín, República Checa.
• Docente en el Tecnológico Nacional de México en
Celaya.
Email: luis@luisbeltran.mx
Twitter: darkicebeam
LinkedIn: /in/luisantoniobeltran
Blog: https://luisbeltran.mx
CONTACTO
• Vivimos en un mundo globalizado y conectado a Internet.
• Se realizan millones de operaciones electrónicas por minuto.
• ¿Cuántas de esas operaciones son fraudulentas?
• Seguridad, integridad, autenticidad y validez de las operaciones y de
la información
¿Qué es Machine Learning?
• Sistemas, aplicaciones, software que se hacen más inteligentes
gracias a la experiencia.
• Experiencia = datos históricos + información humana
• Utiliza minería de datos y técnicas de aprendizaje para entrenar
modelos utilizando datos históricos para predecir resultados
futuros.
Información humana
Es el dominio del Científico de Datos y el Experto en el Tema
que determinan si los datos cumplen con los siguientes
criterios:
• Relevancia
• Conexión
• Precisión
• Abundante
Problemas de Machine Learning
• Predicción
• Clasificación
• Anomalías
• Agrupación (Clustering)
 Ejercicio: Determinando un patrón para detección de operaciones fraudulentas
 Patrón observado: Una transacción es fraudulenta si el propietario tiene entre 20 y 30 años,
la tarjeta fue expedida en Estados Unidos pero utilizada en Rusia y el monto de la operación
es superior a $1,000.
• Entre más información se tenga al inicio, más confiable será el modelo
construido.
• Las características de los datos a analizar tienen que ser seleccionadas
cuidadosamente.
• Normalmente los datos se pre-procesan a fin de tener datos preparados
(limpios).
• Los algoritmos de ML aplican análisis estadístico sobre los datos a fin de
generar un modelo que los describa.
• El modelo es utilizado en alguna aplicación a fin de resolver un problema u
analizar datos nuevos.
• El modelo generado tiene un nivel de confiabilidad que depende de varios
factores.
• El trabajo en ML es en dos modos básicamente: Entrenamiento y
Puntuación.
• En el modo de entrenamiento, se proporcionan datos de entrada a un
modelo de ML y entonces un modelo de ML es aplicado a los datos. Por
ejemplo, tal vez se desee entrenar a un modelo con una gran cantidad de
datos sobre las formas, tamaños y colores de una caja lleno de fruta.
• En el modo de puntuación, el modelo se aplica a nuevos datos y se obtiene
un score. Regresando al ejemplo, podría usarse este modo para frutas
anómalas que no tienen combinaciones de características como las de la
caja de entrenamiento, o si etiquetó las frutas en la caja original, podría
usar el modelo para etiquetar nuevas frutas basándose en forma y tamaño.
Aplicaciones del Machine Learning
• http://www-03.ibm.com/ibm/history/ibm100/us/en/icons/deepblue/
Deep-Blue
https://studio.azureml.net/
https://azure.microsoft.com/es-mx/services/machine-learning-studio/
• Un servicio completamente administrado desde la nube que facilita la
construcción e implementación de soluciones analíticas en 4 áreas:
• Predicción
• Clasificación
• Clustering (Agrupación)
• Detección de fraudes.
Azure Machine Learning
Carga de
Datos desde
diferentes
fuentes
Limpieza
de Datos
Algoritmos
de Machine
Learning
Lenguajes
R y Python
Web
services
• Implementación
• Acceso
Demo
Conclusiones
• Machine Learning es un área de gran importancia y utilidad en un mundo donde a cada instante
se generan millones de datos. Es la era del Big Data.
• El análisis de Big Data permite crear soluciones a problemas y construir mejores aplicaciones.
• Azure Machine Learning afronta el reto de simplificar el proceso de implementación de
soluciones que utilizan aprendizaje automático.
• Los científicos de datos siempre serán importantes en el análisis de datos.
• Este servicio de la nube puede ayudar a que personas menos especializadas en las ciencias de los
datos jueguen un rol importante en la aplicación de aprendizaje automático en problemas de la
vida real.
¿Preguntas?
¡Gracias por su atención!
@darkicebeam
luis@luisbeltran.mx
Comunidad Xamarin en Español:
https://www.facebook.com/groups/xamarindiplomadoitc/
Blog:
https://luisbeltran.mx
GitHub:
https://github.com/icebeam7
LinkedIn:
https://linkedin.com/in/luisantoniobeltran
SlideShare:
https://linkedin.com/in/luisantoniobeltran
YouTube:
https://youtube.com/user/darkicebeam
About Me:
https://about.me/luis-beltran

Implementando machine learning con c# y .net

  • 2.
    Luis Beltrán • MicrosoftMVP en Tecnologías de Desarrollador • Investigador y estudiante de doctorado en la Universidad Tomás Bata en Zlín, República Checa. • Docente en el Tecnológico Nacional de México en Celaya. Email: luis@luisbeltran.mx Twitter: darkicebeam LinkedIn: /in/luisantoniobeltran Blog: https://luisbeltran.mx CONTACTO
  • 4.
    • Vivimos enun mundo globalizado y conectado a Internet. • Se realizan millones de operaciones electrónicas por minuto. • ¿Cuántas de esas operaciones son fraudulentas? • Seguridad, integridad, autenticidad y validez de las operaciones y de la información
  • 5.
    ¿Qué es MachineLearning? • Sistemas, aplicaciones, software que se hacen más inteligentes gracias a la experiencia. • Experiencia = datos históricos + información humana • Utiliza minería de datos y técnicas de aprendizaje para entrenar modelos utilizando datos históricos para predecir resultados futuros.
  • 6.
    Información humana Es eldominio del Científico de Datos y el Experto en el Tema que determinan si los datos cumplen con los siguientes criterios: • Relevancia • Conexión • Precisión • Abundante
  • 8.
    Problemas de MachineLearning • Predicción • Clasificación • Anomalías • Agrupación (Clustering)
  • 12.
     Ejercicio: Determinandoun patrón para detección de operaciones fraudulentas
  • 13.
     Patrón observado:Una transacción es fraudulenta si el propietario tiene entre 20 y 30 años, la tarjeta fue expedida en Estados Unidos pero utilizada en Rusia y el monto de la operación es superior a $1,000.
  • 15.
    • Entre másinformación se tenga al inicio, más confiable será el modelo construido. • Las características de los datos a analizar tienen que ser seleccionadas cuidadosamente. • Normalmente los datos se pre-procesan a fin de tener datos preparados (limpios). • Los algoritmos de ML aplican análisis estadístico sobre los datos a fin de generar un modelo que los describa. • El modelo es utilizado en alguna aplicación a fin de resolver un problema u analizar datos nuevos. • El modelo generado tiene un nivel de confiabilidad que depende de varios factores.
  • 16.
    • El trabajoen ML es en dos modos básicamente: Entrenamiento y Puntuación. • En el modo de entrenamiento, se proporcionan datos de entrada a un modelo de ML y entonces un modelo de ML es aplicado a los datos. Por ejemplo, tal vez se desee entrenar a un modelo con una gran cantidad de datos sobre las formas, tamaños y colores de una caja lleno de fruta. • En el modo de puntuación, el modelo se aplica a nuevos datos y se obtiene un score. Regresando al ejemplo, podría usarse este modo para frutas anómalas que no tienen combinaciones de características como las de la caja de entrenamiento, o si etiquetó las frutas en la caja original, podría usar el modelo para etiquetar nuevas frutas basándose en forma y tamaño.
  • 18.
  • 19.
  • 20.
  • 21.
    • Un serviciocompletamente administrado desde la nube que facilita la construcción e implementación de soluciones analíticas en 4 áreas: • Predicción • Clasificación • Clustering (Agrupación) • Detección de fraudes. Azure Machine Learning
  • 22.
    Carga de Datos desde diferentes fuentes Limpieza deDatos Algoritmos de Machine Learning Lenguajes R y Python Web services
  • 24.
  • 28.
  • 29.
    Conclusiones • Machine Learninges un área de gran importancia y utilidad en un mundo donde a cada instante se generan millones de datos. Es la era del Big Data. • El análisis de Big Data permite crear soluciones a problemas y construir mejores aplicaciones. • Azure Machine Learning afronta el reto de simplificar el proceso de implementación de soluciones que utilizan aprendizaje automático. • Los científicos de datos siempre serán importantes en el análisis de datos. • Este servicio de la nube puede ayudar a que personas menos especializadas en las ciencias de los datos jueguen un rol importante en la aplicación de aprendizaje automático en problemas de la vida real.
  • 30.
  • 31.
    ¡Gracias por suatención! @darkicebeam luis@luisbeltran.mx Comunidad Xamarin en Español: https://www.facebook.com/groups/xamarindiplomadoitc/ Blog: https://luisbeltran.mx GitHub: https://github.com/icebeam7 LinkedIn: https://linkedin.com/in/luisantoniobeltran SlideShare: https://linkedin.com/in/luisantoniobeltran YouTube: https://youtube.com/user/darkicebeam About Me: https://about.me/luis-beltran