SlideShare una empresa de Scribd logo
1 de 33
Descargar para leer sin conexión
Aprendizaje Automático
con Tensorflow y R
Edgar Ruiz
edgararuiz
theotheredgar
edgararuiz
Tensorflow
❏ Aprendizaje automático y profundo.
❏ Computación de alto desempeño
❏ Librería de código abierto
❏ Variedad de plataformas y dispositivos
Fuente: https://www.tensorflow.org/
Keras
❏ Facilita el desarrollo de modelos
❏ Se integra con Tensorflow y otros
❏ El mismo código funciona en CPU o GPU
❏ Redes convolucionales y recurrentes
Fuente: https://github.com/rstudio/keras
AccesarTF
Fácil integración de R, Tensorflow y Keras
Accesar
Keras
Pero, por que...
+ ?¿
Aprendizaje Automático es de varios pasos
Leér
datos
Pre-procesar
datos
Entrenar
modelo
Validar
modelo
Compartir
resultados
Entrenar el modelo es solo un paso...
Leér
datos
Pre-procesar
datos
Entrenar
modelo
Validar
modelo
Compartir
resultados
R se especializa en todos los pasos
Leér
datos
Pre-procesar
datos
Entrenar
modelo
Validar
modelo
Compartir
resultados
Pre-procesar
datos
Entrenar
modelo
Validar
modelo
Compartir
resultados
Leér
datos
13 mil paquetes especializados de R
Demostración
Prediciendo pérdida de
clientes
Análisis original
Ejemplo basado en el artículo: “Deep Learning With Keras To Predict
Customer Churn”, publicado por Matt Dancho.
https://blogs.rstudio.com/tensorflow/posts/2018-01-11-keras-customer-churn/
Objetivo
Analizar datos de pérdida de clientes de una compañía de
telecomunicaciones con R, Keras y Tensorflow.
Instale TF y Keras desde R
install.packages("tensorflow")
install.packages("keras")
library(keras)
install_tensorflow()
install_keras()
Instale los paquetes de R
Cargue el paquete keras
Instalar TF y Keras
Paquetes de R para cada paso
Progreso
Leér
datos
Pre-procesar
datos
Entrenar
modelo
Validar
modelo
Compartir
resultados
Leér datos
# A tibble: 7,043 x 21
customerID gender SeniorCitizen Partner Dependents tenure PhoneService
<chr> <chr> <dbl> <chr> <chr> <dbl> <chr>
1 7590-VHVEG Female 0 Yes No 1 No
2 5575-GNVDE Male 0 No No 34 Yes
3 3668-QPYBK Male 0 No No 2 Yes
4 7795-CFOCW Male 0 No No 45 No
5 9237-HQITU Female 0 No No 2 Yes
6 9305-CDSKC Female 0 No No 8 Yes
7 1452-KIOVK Male 0 No Yes 22 Yes
8 6713-OKOMC Female 0 No No 10 No
9 7892-POOKP Female 0 Yes No 28 Yes
10 6388-TABGU Male 0 No Yes 62 Yes
# ... with 7,033 more rows, and 14 more variables: MultipleLines <chr>
datos_perdimiento <- read_csv("customer_churn.csv")
Progreso
Leér
datos
Pre-procesar
datos
Entrenar
modelo
Validar
modelo
Compartir
resultados
Pre-procesar - Muestra de datos
separa_datos <- initial_split(
datos_perdimiento,
prop = 0.3
)
tbl_entrenar <- training(separa_datos)
tbl_prueba <- testing(separa_datos)Prueba
70%
Entrenar
30%
Datos
Pre-procesar - La receta!
receta <- tbl_entrenar %>%
recipe(Churn ~ .) %>%
step_rm(customerID) %>%
step_naomit(all_outcomes(), all_predictors()) %>%
step_discretize(tenure,options = list(cuts = 6)) %>%
step_log(TotalCharges) %>%
step_mutate(Churn = ifelse(Churn=="Yes", 1, 0)) %>%
step_dummy(all_nominal(), -all_outcomes()) %>%
step_center(all_predictors(), -all_outcomes()) %>%
step_scale(all_predictors(), -all_outcomes()) %>%
prep()
Remueve columnas
Omitir NAs
Partir en categorías
Conversión logarítmica
Conversión lógica
Variables ficticias
Centrar valores
Escalar valores
Pre-procesar - “Cocinar” receta
baked_test <- bake(receta, tbl_prueba)
x_tbl_prueba <- baked_test %>%
select(-Churn) %>%
as.matrix()
y_vec_prueba <- baked_test %>%
select(Churn) %>%
pull()
x_tbl_entrenar <- receta %>%
juice(all_predictors(),
composition = "matrix")
y_vec_entrenar <- receta %>%
juice(all_outcomes()) %>%
pull()
La muestra de entrenamiento es extraída La porción para prueba is procesada
Progreso
Leér
datos
Pre-procesar
datos
Entrenar
modelo
Validar
modelo
Compartir
resultados
Entrenar el modelo - Preparación
model_keras <- keras_model_sequential() %>%
layer_dense(units = 16,
kernel_initializer = "uniform",
activation = "relu",
input_shape = ncol(x_tbl_entrenar)) %>%
layer_dropout(rate = 0.1) %>%
layer_dense(units = 16,
kernel_initializer = "
uniform", activation = "relu") %>%
layer_dropout(rate = 0.1) %>%
layer_dense(units = 1,
kernel_initializer = "uniform",
activation = "sigmoid") %>%
compile(optimizer = 'adam',
loss = 'binary_crossentropy',
metrics = c('accuracy'))
Capa densa
Capa de pérdida
Capa densa
Capa de pérdida
Capa densa
Compilar
Entrenar el modelo - Entrenar el modelo
history <- fit(
object = model_keras,
x = x_tbl_entrenar,
y = y_vec_entrenar,
batch_size = 50,
epochs = 35,
validation_split = 0.30,
verbose = 0
)
yhat_keras_class_vec <- model_keras %>%
predict_classes(x_tbl_prueba) %>%
as.factor() %>%
fct_recode(yes = "1", no = "0")
yhat_keras_prob_vec <- model_keras %>%
predict_proba(x_tbl_prueba) %>%
as.vector()
test_truth <- y_vec_prueba %>%
as.factor() %>%
fct_recode(yes = "1", no = "0")
estimates_keras_tbl <- tibble(
truth = test_truth,
estimate = yhat_keras_class_vec,
class_prob = yhat_keras_prob_vec)
estimates_keras_tbl
Entrenar el modelo - Predicciones
# A tibble: 4,920 x 3
truth estimate class_prob
<fct> <fct> <dbl>
1 no yes 0.765
2 yes no 0.368
3 yes yes 0.749
4 yes yes 0.782
5 no yes 0.565
6 no no 0.106
7 yes yes 0.579
8 no no 0.00366
9 no no 0.221
10 no no 0.0118
# ... with 4,910 more rows
Progreso
Leér
datos
Pre-procesar
datos
Entrenar
modelo
Validar
modelo
Compartir
resultados
Validar modelo - Mediciones
conf_mat(estimates_keras_tbl,
truth, estimate)
metrics(estimates_keras_tbl,
truth, estimate)
roc_auc(estimates_keras_tbl,
truth, class_prob)
estimates_keras_tbl %>%
precision(truth, estimate) %>%
bind_rows(estimates_keras_tbl %>%
recall(truth, estimate))
f_meas(estimates_keras_tbl,
truth, estimate, beta = 1)
Truth
Prediction no yes
no 3205 547
yes 420 748
# A tibble: 2 x 3
.metric .estimator .estimate
<chr> <chr> <dbl>
1 accuracy binary 0.803
2 kap binary 0.477
# A tibble: 1 x 3
.metric .estimator .estimate
<chr> <chr> <dbl>
1 roc_auc binary 0.843
# A tibble: 2 x 3
.metric .estimator .estimate
<chr> <chr> <dbl>
1 precision binary 0.640
2 recall binary 0.578
# A tibble: 1 x 3
.metric .estimator .estimate
<chr> <chr> <dbl>
1 f_meas binary 0.607
Validar modelo - Valores significativos
explainer <- x_tbl_entrenar %>%
as_tibble() %>%
lime(model_keras, bin_continuous = FALSE)
explanation <- x_tbl_entrenar %>%
as.data.frame() %>%
head(40) %>%
lime::explain(
explainer = explainer, n_labels = 1,
N_features = 4, kernel_width = 0.5)
Progreso
Leér
datos
Pre-procesar
datos
Entrenar
modelo
Validar
modelo
Compartir
resultados
Compartir resultados - Reportes
Compartir resultados - Aplicación
Demostración
¡Pruébalo en tu teléfono!
rstd.io/clientes
rstd.io/datadaymx
¡Gracias por su atención!

Más contenido relacionado

La actualidad más candente

Fm con ruido
Fm con ruidoFm con ruido
Fm con ruido
gbermeo
 
communication system Chapter 6
communication system Chapter 6communication system Chapter 6
communication system Chapter 6
moeen khan afridi
 

La actualidad más candente (20)

Lecture 3 analisis radioprop p1
Lecture 3 analisis radioprop   p1Lecture 3 analisis radioprop   p1
Lecture 3 analisis radioprop p1
 
Evaluation of multilabel multi class classification
Evaluation of multilabel multi class classificationEvaluation of multilabel multi class classification
Evaluation of multilabel multi class classification
 
Fm con ruido
Fm con ruidoFm con ruido
Fm con ruido
 
Feature Selection
Feature Selection Feature Selection
Feature Selection
 
Biomedical signal processing syllabus
Biomedical signal processing syllabusBiomedical signal processing syllabus
Biomedical signal processing syllabus
 
Digital Signal Processing-Digital Filters
Digital Signal Processing-Digital FiltersDigital Signal Processing-Digital Filters
Digital Signal Processing-Digital Filters
 
Vblast
VblastVblast
Vblast
 
2 fundamentos enlaces_radioelectricos
2 fundamentos enlaces_radioelectricos2 fundamentos enlaces_radioelectricos
2 fundamentos enlaces_radioelectricos
 
Tem mode 1st 2
Tem mode 1st 2Tem mode 1st 2
Tem mode 1st 2
 
Ospedale di Biella 3 anni dopo
Ospedale di Biella 3 anni dopoOspedale di Biella 3 anni dopo
Ospedale di Biella 3 anni dopo
 
Machine Learning Performance metrics for classification
Machine Learning Performance metrics for classificationMachine Learning Performance metrics for classification
Machine Learning Performance metrics for classification
 
Bag the model with bagging
Bag the model with baggingBag the model with bagging
Bag the model with bagging
 
05 unidades de medida
05 unidades de medida05 unidades de medida
05 unidades de medida
 
Televisión satelital
Televisión satelitalTelevisión satelital
Televisión satelital
 
Cheatsheet unsupervised-learning
Cheatsheet unsupervised-learningCheatsheet unsupervised-learning
Cheatsheet unsupervised-learning
 
Communication Systems_B.P. Lathi and Zhi Ding (Lecture No 1-3)
Communication Systems_B.P. Lathi and Zhi Ding (Lecture No 1-3)Communication Systems_B.P. Lathi and Zhi Ding (Lecture No 1-3)
Communication Systems_B.P. Lathi and Zhi Ding (Lecture No 1-3)
 
Isi
IsiIsi
Isi
 
Credit Card Fraud Detection - Anomaly Detection
Credit Card Fraud Detection - Anomaly DetectionCredit Card Fraud Detection - Anomaly Detection
Credit Card Fraud Detection - Anomaly Detection
 
communication system Chapter 6
communication system Chapter 6communication system Chapter 6
communication system Chapter 6
 
FFT and DFT algorithm
FFT and DFT algorithmFFT and DFT algorithm
FFT and DFT algorithm
 

Similar a Machine Learning con Tensorflow y R, presentado por RStudio

Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultados
Sergio Valenzuela Mayer
 
Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultados
Sergio Valenzuela Mayer
 
Matlab
MatlabMatlab
Matlab
ford81
 
Argentesting 2019 - Machine learning en testing priorizacion de casos de pr...
Argentesting 2019 - Machine learning en testing   priorizacion de casos de pr...Argentesting 2019 - Machine learning en testing   priorizacion de casos de pr...
Argentesting 2019 - Machine learning en testing priorizacion de casos de pr...
Argentesting
 

Similar a Machine Learning con Tensorflow y R, presentado por RStudio (20)

Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultados
 
Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultados
 
Capítulo 01 conceptos de simulación
Capítulo 01 conceptos de simulaciónCapítulo 01 conceptos de simulación
Capítulo 01 conceptos de simulación
 
TestingAR Meetup VIII - Luis Argerich - Una Breve Introducción a Machine Lear...
TestingAR Meetup VIII - Luis Argerich - Una Breve Introducción a Machine Lear...TestingAR Meetup VIII - Luis Argerich - Una Breve Introducción a Machine Lear...
TestingAR Meetup VIII - Luis Argerich - Una Breve Introducción a Machine Lear...
 
Tuning fondo-negro-2
Tuning fondo-negro-2Tuning fondo-negro-2
Tuning fondo-negro-2
 
5.instrucciones de control en java parte2
5.instrucciones de control en java parte25.instrucciones de control en java parte2
5.instrucciones de control en java parte2
 
10.-Raptor.pdf
10.-Raptor.pdf10.-Raptor.pdf
10.-Raptor.pdf
 
¿Cómo mantener tu javascript?: Buenas prácticas
¿Cómo mantener tu javascript?: Buenas prácticas¿Cómo mantener tu javascript?: Buenas prácticas
¿Cómo mantener tu javascript?: Buenas prácticas
 
Javascript
JavascriptJavascript
Javascript
 
Bases de Datos en Java - Intro a JDBC
Bases de Datos en Java - Intro a JDBCBases de Datos en Java - Intro a JDBC
Bases de Datos en Java - Intro a JDBC
 
Microsoft Reactor - Creando un modelo de Regresión con Azure Machine Learnin...
Microsoft Reactor - Creando un modelo de Regresión con Azure Machine Learnin...Microsoft Reactor - Creando un modelo de Regresión con Azure Machine Learnin...
Microsoft Reactor - Creando un modelo de Regresión con Azure Machine Learnin...
 
Texto Paralelo.pptx
Texto Paralelo.pptxTexto Paralelo.pptx
Texto Paralelo.pptx
 
Ciclos Java - NetsBeans - Algoritmia
Ciclos Java - NetsBeans - AlgoritmiaCiclos Java - NetsBeans - Algoritmia
Ciclos Java - NetsBeans - Algoritmia
 
MyBatis como alternativa a Hibernate
MyBatis como alternativa a HibernateMyBatis como alternativa a Hibernate
MyBatis como alternativa a Hibernate
 
Matlab
MatlabMatlab
Matlab
 
Matlab (1)
Matlab (1)Matlab (1)
Matlab (1)
 
5.instrucciones de control en c++ parte 2
5.instrucciones de control en c++  parte 25.instrucciones de control en c++  parte 2
5.instrucciones de control en c++ parte 2
 
¿En qué la estamos regando en pruebas de software?
¿En qué la estamos regando en pruebas de software?¿En qué la estamos regando en pruebas de software?
¿En qué la estamos regando en pruebas de software?
 
Argentesting 2019 - Machine learning en testing priorizacion de casos de pr...
Argentesting 2019 - Machine learning en testing   priorizacion de casos de pr...Argentesting 2019 - Machine learning en testing   priorizacion de casos de pr...
Argentesting 2019 - Machine learning en testing priorizacion de casos de pr...
 
Insight Brou 2009 11 Encuentro Usr Rational Gur07
Insight Brou 2009 11   Encuentro Usr Rational Gur07Insight Brou 2009 11   Encuentro Usr Rational Gur07
Insight Brou 2009 11 Encuentro Usr Rational Gur07
 

Más de Software Guru

Más de Software Guru (20)

Hola Mundo del Internet de las Cosas
Hola Mundo del Internet de las CosasHola Mundo del Internet de las Cosas
Hola Mundo del Internet de las Cosas
 
Estructuras de datos avanzadas: Casos de uso reales
Estructuras de datos avanzadas: Casos de uso realesEstructuras de datos avanzadas: Casos de uso reales
Estructuras de datos avanzadas: Casos de uso reales
 
Building bias-aware environments
Building bias-aware environmentsBuilding bias-aware environments
Building bias-aware environments
 
El secreto para ser un desarrollador Senior
El secreto para ser un desarrollador SeniorEl secreto para ser un desarrollador Senior
El secreto para ser un desarrollador Senior
 
Cómo encontrar el trabajo remoto ideal
Cómo encontrar el trabajo remoto idealCómo encontrar el trabajo remoto ideal
Cómo encontrar el trabajo remoto ideal
 
Automatizando ideas con Apache Airflow
Automatizando ideas con Apache AirflowAutomatizando ideas con Apache Airflow
Automatizando ideas con Apache Airflow
 
How thick data can improve big data analysis for business:
How thick data can improve big data analysis for business:How thick data can improve big data analysis for business:
How thick data can improve big data analysis for business:
 
Introducción al machine learning
Introducción al machine learningIntroducción al machine learning
Introducción al machine learning
 
Democratizando el uso de CoDi
Democratizando el uso de CoDiDemocratizando el uso de CoDi
Democratizando el uso de CoDi
 
Gestionando la felicidad de los equipos con Management 3.0
Gestionando la felicidad de los equipos con Management 3.0Gestionando la felicidad de los equipos con Management 3.0
Gestionando la felicidad de los equipos con Management 3.0
 
Taller: Creación de Componentes Web re-usables con StencilJS
Taller: Creación de Componentes Web re-usables con StencilJSTaller: Creación de Componentes Web re-usables con StencilJS
Taller: Creación de Componentes Web re-usables con StencilJS
 
El camino del full stack developer (o como hacemos en SERTI para que no solo ...
El camino del full stack developer (o como hacemos en SERTI para que no solo ...El camino del full stack developer (o como hacemos en SERTI para que no solo ...
El camino del full stack developer (o como hacemos en SERTI para que no solo ...
 
¿Qué significa ser un programador en Bitso?
¿Qué significa ser un programador en Bitso?¿Qué significa ser un programador en Bitso?
¿Qué significa ser un programador en Bitso?
 
Colaboración efectiva entre desarrolladores del cliente y tu equipo.
Colaboración efectiva entre desarrolladores del cliente y tu equipo.Colaboración efectiva entre desarrolladores del cliente y tu equipo.
Colaboración efectiva entre desarrolladores del cliente y tu equipo.
 
Pruebas de integración con Docker en Azure DevOps
Pruebas de integración con Docker en Azure DevOpsPruebas de integración con Docker en Azure DevOps
Pruebas de integración con Docker en Azure DevOps
 
Elixir + Elm: Usando lenguajes funcionales en servicios productivos
Elixir + Elm: Usando lenguajes funcionales en servicios productivosElixir + Elm: Usando lenguajes funcionales en servicios productivos
Elixir + Elm: Usando lenguajes funcionales en servicios productivos
 
Así publicamos las apps de Spotify sin stress
Así publicamos las apps de Spotify sin stressAsí publicamos las apps de Spotify sin stress
Así publicamos las apps de Spotify sin stress
 
Achieving Your Goals: 5 Tips to successfully achieve your goals
Achieving Your Goals: 5 Tips to successfully achieve your goalsAchieving Your Goals: 5 Tips to successfully achieve your goals
Achieving Your Goals: 5 Tips to successfully achieve your goals
 
Acciones de comunidades tech en tiempos del Covid19
Acciones de comunidades tech en tiempos del Covid19Acciones de comunidades tech en tiempos del Covid19
Acciones de comunidades tech en tiempos del Covid19
 
De lo operativo a lo estratégico: un modelo de management de diseño
De lo operativo a lo estratégico: un modelo de management de diseñoDe lo operativo a lo estratégico: un modelo de management de diseño
De lo operativo a lo estratégico: un modelo de management de diseño
 

Último

redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
nicho110
 

Último (11)

Guia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosGuia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos Basicos
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXI
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptx
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 

Machine Learning con Tensorflow y R, presentado por RStudio

  • 1. Aprendizaje Automático con Tensorflow y R Edgar Ruiz edgararuiz theotheredgar edgararuiz
  • 2. Tensorflow ❏ Aprendizaje automático y profundo. ❏ Computación de alto desempeño ❏ Librería de código abierto ❏ Variedad de plataformas y dispositivos Fuente: https://www.tensorflow.org/
  • 3. Keras ❏ Facilita el desarrollo de modelos ❏ Se integra con Tensorflow y otros ❏ El mismo código funciona en CPU o GPU ❏ Redes convolucionales y recurrentes Fuente: https://github.com/rstudio/keras
  • 4. AccesarTF Fácil integración de R, Tensorflow y Keras Accesar Keras
  • 6. Aprendizaje Automático es de varios pasos Leér datos Pre-procesar datos Entrenar modelo Validar modelo Compartir resultados
  • 7. Entrenar el modelo es solo un paso... Leér datos Pre-procesar datos Entrenar modelo Validar modelo Compartir resultados
  • 8. R se especializa en todos los pasos Leér datos Pre-procesar datos Entrenar modelo Validar modelo Compartir resultados
  • 11. Análisis original Ejemplo basado en el artículo: “Deep Learning With Keras To Predict Customer Churn”, publicado por Matt Dancho. https://blogs.rstudio.com/tensorflow/posts/2018-01-11-keras-customer-churn/
  • 12. Objetivo Analizar datos de pérdida de clientes de una compañía de telecomunicaciones con R, Keras y Tensorflow.
  • 13. Instale TF y Keras desde R install.packages("tensorflow") install.packages("keras") library(keras) install_tensorflow() install_keras() Instale los paquetes de R Cargue el paquete keras Instalar TF y Keras
  • 14. Paquetes de R para cada paso
  • 16. Leér datos # A tibble: 7,043 x 21 customerID gender SeniorCitizen Partner Dependents tenure PhoneService <chr> <chr> <dbl> <chr> <chr> <dbl> <chr> 1 7590-VHVEG Female 0 Yes No 1 No 2 5575-GNVDE Male 0 No No 34 Yes 3 3668-QPYBK Male 0 No No 2 Yes 4 7795-CFOCW Male 0 No No 45 No 5 9237-HQITU Female 0 No No 2 Yes 6 9305-CDSKC Female 0 No No 8 Yes 7 1452-KIOVK Male 0 No Yes 22 Yes 8 6713-OKOMC Female 0 No No 10 No 9 7892-POOKP Female 0 Yes No 28 Yes 10 6388-TABGU Male 0 No Yes 62 Yes # ... with 7,033 more rows, and 14 more variables: MultipleLines <chr> datos_perdimiento <- read_csv("customer_churn.csv")
  • 18. Pre-procesar - Muestra de datos separa_datos <- initial_split( datos_perdimiento, prop = 0.3 ) tbl_entrenar <- training(separa_datos) tbl_prueba <- testing(separa_datos)Prueba 70% Entrenar 30% Datos
  • 19. Pre-procesar - La receta! receta <- tbl_entrenar %>% recipe(Churn ~ .) %>% step_rm(customerID) %>% step_naomit(all_outcomes(), all_predictors()) %>% step_discretize(tenure,options = list(cuts = 6)) %>% step_log(TotalCharges) %>% step_mutate(Churn = ifelse(Churn=="Yes", 1, 0)) %>% step_dummy(all_nominal(), -all_outcomes()) %>% step_center(all_predictors(), -all_outcomes()) %>% step_scale(all_predictors(), -all_outcomes()) %>% prep() Remueve columnas Omitir NAs Partir en categorías Conversión logarítmica Conversión lógica Variables ficticias Centrar valores Escalar valores
  • 20. Pre-procesar - “Cocinar” receta baked_test <- bake(receta, tbl_prueba) x_tbl_prueba <- baked_test %>% select(-Churn) %>% as.matrix() y_vec_prueba <- baked_test %>% select(Churn) %>% pull() x_tbl_entrenar <- receta %>% juice(all_predictors(), composition = "matrix") y_vec_entrenar <- receta %>% juice(all_outcomes()) %>% pull() La muestra de entrenamiento es extraída La porción para prueba is procesada
  • 22. Entrenar el modelo - Preparación model_keras <- keras_model_sequential() %>% layer_dense(units = 16, kernel_initializer = "uniform", activation = "relu", input_shape = ncol(x_tbl_entrenar)) %>% layer_dropout(rate = 0.1) %>% layer_dense(units = 16, kernel_initializer = " uniform", activation = "relu") %>% layer_dropout(rate = 0.1) %>% layer_dense(units = 1, kernel_initializer = "uniform", activation = "sigmoid") %>% compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = c('accuracy')) Capa densa Capa de pérdida Capa densa Capa de pérdida Capa densa Compilar
  • 23. Entrenar el modelo - Entrenar el modelo history <- fit( object = model_keras, x = x_tbl_entrenar, y = y_vec_entrenar, batch_size = 50, epochs = 35, validation_split = 0.30, verbose = 0 )
  • 24. yhat_keras_class_vec <- model_keras %>% predict_classes(x_tbl_prueba) %>% as.factor() %>% fct_recode(yes = "1", no = "0") yhat_keras_prob_vec <- model_keras %>% predict_proba(x_tbl_prueba) %>% as.vector() test_truth <- y_vec_prueba %>% as.factor() %>% fct_recode(yes = "1", no = "0") estimates_keras_tbl <- tibble( truth = test_truth, estimate = yhat_keras_class_vec, class_prob = yhat_keras_prob_vec) estimates_keras_tbl Entrenar el modelo - Predicciones # A tibble: 4,920 x 3 truth estimate class_prob <fct> <fct> <dbl> 1 no yes 0.765 2 yes no 0.368 3 yes yes 0.749 4 yes yes 0.782 5 no yes 0.565 6 no no 0.106 7 yes yes 0.579 8 no no 0.00366 9 no no 0.221 10 no no 0.0118 # ... with 4,910 more rows
  • 26. Validar modelo - Mediciones conf_mat(estimates_keras_tbl, truth, estimate) metrics(estimates_keras_tbl, truth, estimate) roc_auc(estimates_keras_tbl, truth, class_prob) estimates_keras_tbl %>% precision(truth, estimate) %>% bind_rows(estimates_keras_tbl %>% recall(truth, estimate)) f_meas(estimates_keras_tbl, truth, estimate, beta = 1) Truth Prediction no yes no 3205 547 yes 420 748 # A tibble: 2 x 3 .metric .estimator .estimate <chr> <chr> <dbl> 1 accuracy binary 0.803 2 kap binary 0.477 # A tibble: 1 x 3 .metric .estimator .estimate <chr> <chr> <dbl> 1 roc_auc binary 0.843 # A tibble: 2 x 3 .metric .estimator .estimate <chr> <chr> <dbl> 1 precision binary 0.640 2 recall binary 0.578 # A tibble: 1 x 3 .metric .estimator .estimate <chr> <chr> <dbl> 1 f_meas binary 0.607
  • 27. Validar modelo - Valores significativos explainer <- x_tbl_entrenar %>% as_tibble() %>% lime(model_keras, bin_continuous = FALSE) explanation <- x_tbl_entrenar %>% as.data.frame() %>% head(40) %>% lime::explain( explainer = explainer, n_labels = 1, N_features = 4, kernel_width = 0.5)
  • 30. Compartir resultados - Aplicación
  • 32. ¡Pruébalo en tu teléfono! rstd.io/clientes