SlideShare una empresa de Scribd logo
1 de 34
Descargar para leer sin conexión
© GMV, 2018 Propiedad de GMV
Todos los derechos reservados
GMV-LIMITED
El presente documento está clasificado como "GMV-CONFIDENTIAL". Esta clasificación habilita a su receptor al uso de la información contenida en el documento para los fines para los que
la empresa la ha facilitado o, en su caso, a lo acordado contractualmente en relación al intercambio de información entre las partes, y ello sin perjuicio del cumplimiento de la normativa
sobre propiedad intelectual y sobre protección de datos de carácter personal.
Inteligencia Artificial y Discriminación
José Carlos Baquero Triguero
Madrid | November 30 - December 1, 2018
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !2
MEQUIERO
PRESENTAR
MLEQUITATIVO
SECURITY DATA SCIENCE
GMV-LIMITED
24/10/2018 !3
MI BIO
• Me llamo José Carlos Baquero y soy
licenciado en Matemáticas con algún
máster pero con más de 20 años de
experiencia en el sector de las
Tecnologías de la Información.
• Actualmente lidero la division de
Inteligencia Artificial y Big Data en GMV
• Aplicando Inteligencia Artificial en
Ciberseguridad, Prevención de Fraude,
Optimización de Procesos Industriales,
Asistentes Conversaciones, etc.
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !4
AFRONTANDO
UNNUEVO
ESCENARIO
MLEQUITATIVO
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !5
SIEMPRE NOS HAN CLASIFICADO
MACHINE LEARNING & DISCRIMINACIÓN
GMV-LIMITED
2018/12/01 !6
UN ALGORITMO TE PUEDE CONDICIONAR
TU FUTURO
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !7
CONFIANZA CIEGA EN LA TECNOLOGÍA
“Hiring could become faster and less
expensive, and […] lead recruiters to more
highly skilled people who are better matches
for their companies. Another potential
result: a more diverse workplace. The
software relies on data to surface
candidates from a wide variety of places and
match their skills to the job requirements,
free of human biases.”
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !8
O NO?
“But software is not free of human
influence. Algorithms are written and
maintained by people, and machine learning
algorithms adjust what they do based on
people’s behavior. As a result […]
algorithms can reinforce human
prejudices.”
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !9
ALGUNOS CASOS RECIENTES
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !10
“Latest White House report on Big Data
charts pathways for fairness and opportunity
but also cautions against re-encoding
bias and discrimination into algorithmic
systems”
INQUIETUD EN LOS GOBIERNOS
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !11
INQUIETUD EN LOS GOBIERNOS – GDPR
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !12
Y LAS ORGANIZACIONES?
“While algorithmic decision-making aids
have been used for decades, machine
learning is posing new challenges due to its
greater complexity, opaqueness,
ubiquity, and exclusiveness.”
“Governments and international
organizations have a role to play, but
regulations tend not to keep pace with
technological development.“
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !13
MACHINE LEARNING PARA LA TOMA DE
DECISIONES
Desde las solicitudes de crédito hasta las citas
on-line, día a día el machine learning está
automatizando la toma de decisiones.
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !14
CRECIENTE IMPACTO EN LA SOCIEDAD
Cada vez más surgen inquietudes sobre la
pérdida de transparencia, responsabilidad y
equidad de los algoritmos.
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !15
MACHINE LEARNING & DISCRIMINACIÓN
Necesitamos intensificar y buscar nuevas formas
para mitigar la discriminación emergente en
nuestros modelos
.
.
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !16
MACHINE LEARNING & DISCRIMINACIÓN
Tenemos que estar seguros que nuestras
predicciones no perjudiquen injustamente a
la gente con ciertas características sensibles
(e.j. género, etnia, etc.)
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !17
REACCIÓN
DELA
COMUNIDAD
CIENTÍFICA
MLEQUITATIVO
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !18
ÁREA ACTIVA DE INVESTIGACIÓN
Cómo realizar modelos predictivos equitativos es
un ámbito de investigación activa.
Finalmente nos lo estamos tomando en serio.
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !19
ALGUNAS APROXIMACIONES
1. Foco en la interpretabilidad y
transparencia: Permitir interrogar a los
modelos complejos.
2. Hacer modelos más robustos y justos en
sus predicciones: Modificar la optimización
de las funciones objetivos y añadir
restricciones.
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !20
EJEMPLO:
PREDICCIÓN
DEINGRESOS
MLEQUITATIVO
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !21
EJEMPLO: PREDICCIÓN DE INGRESOS
Entrenaremos un clasificador básico que pueda
predecir si los ingresos de una persona es
mayor de 50K$ al año
Usaremos el data set Adult UCI: : https://
archive.ics.uci.edu/ml/datasets/Adult
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !22
VEAMOS UNA IMPLEMENTACIÓN
https://github.com/jbaquerot/
Fairer_ML/blob/master/
notebooks/Fairer_ML.ipynb
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !23
RESULTADOS
MLEQUITATIVO
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !24
RESULTADOS
• Una vez ajustados la imparcialidad vs la exactitud de
las predicciones, establecemos λrace= 130 y λgender=
30.
• Aparentemente es un poco más complicado hacer
cumplir la imparcialidad para atributos raciales
frente por género
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !25
RESULTADOS
• Sacrificando sólo un 5% de la exactitud, tenemos
un clasificador que realiza predicciones más
imparciales frente raza y género
• Un resultado bastante decente!
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !26
CONCLUSIONES
MLEQUITATIVO
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !27
CONCLUSIONES
• Construir modelos predictivos imparciales no es tan
sencillo como quitar algunos atributos sensibles
de los datos de entrenamiento.
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !28
CONCLUSIONES
• Se requieren técnicas ingeniosas para corregir el
profundo sesgo de los datos y forzar a los modelos
a realizar predicciones más imparciales
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !29
CONCLUSIONES
• Realizar predicciones imparciales conllevan un coste:
reduce el desempeño de nuestro modelo
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !30
CONCLUSIONES
• Es un pequeño precio a pagar para dejar atrás el
mundo sesgado de ayer y construir un mañana más
justo
© GMV, 2018 Propiedad de GMV
Todos los derechos reservados
GMV-LIMITED
El presente documento está clasificado como "GMV-CONFIDENTIAL". Esta clasificación habilita a su receptor al uso de la información contenida en el documento para los fines para los que
la empresa la ha facilitado o, en su caso, a lo acordado contractualmente en relación al intercambio de información entre las partes, y ello sin perjuicio del cumplimiento de la normativa
sobre propiedad intelectual y sobre protección de datos de carácter personal.
!31
ELRETO
CONTINÚA
MLEQUITATIVO
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/10/30 !32
EL RETO CONTINÚA
www.gmv.es
GMV-LIMITED
GRACIAS
@jbaquerot
jcbaquero@gmv.com
GMV-LIMITED
MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !34
REFERENCES
• https://blog.godatadriven.com/fairness-in-ml
• https://work.qz.com/1227982/ai-and-discrimination-what-tech-companies-can-do/
• https://research.google.com/bigpicture/attacking-discrimination-in-ml/
• https://obamawhitehouse.archives.gov/blog/2016/05/04/big-risks-big-opportunities-
intersection-big-data-and-civil-rights
• http://mrtz.org/nips17/#/
• http://www3.weforum.org/docs/
WEF_40065_White_Paper_How_to_Prevent_Discriminatory_Outcomes_in_Machine_Learning.p
df

Más contenido relacionado

Similar a José Carlos Baquero | Inteligencia Artificial y Discriminación: Cómo conseguir algoritmos más igualitarios y justos | Codemotion Madrid 2018

La transformación digital de la Economía y la Contabilidad: innovando en el m...
La transformación digital de la Economía y la Contabilidad: innovando en el m...La transformación digital de la Economía y la Contabilidad: innovando en el m...
La transformación digital de la Economía y la Contabilidad: innovando en el m...
Esteban Romero Frías
 
Del dato a la toma de decisiones, pasando por el conocimiento
Del dato a la toma de decisiones, pasando por el conocimientoDel dato a la toma de decisiones, pasando por el conocimiento
Del dato a la toma de decisiones, pasando por el conocimiento
Lucero Vaccaro
 
GIGAS_IAAS CON SABOR ESPAÑOL
GIGAS_IAAS CON SABOR ESPAÑOLGIGAS_IAAS CON SABOR ESPAÑOL
GIGAS_IAAS CON SABOR ESPAÑOL
Lola Molins
 
Uso de simulaciones
Uso de simulaciones Uso de simulaciones
Uso de simulaciones
SD&W Latam
 

Similar a José Carlos Baquero | Inteligencia Artificial y Discriminación: Cómo conseguir algoritmos más igualitarios y justos | Codemotion Madrid 2018 (20)

Mejorando la experiencia de venta con herramientas digitales
Mejorando la experiencia de venta con herramientas digitalesMejorando la experiencia de venta con herramientas digitales
Mejorando la experiencia de venta con herramientas digitales
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big Data
 
Connect Events - #DigitalSignage
Connect Events - #DigitalSignageConnect Events - #DigitalSignage
Connect Events - #DigitalSignage
 
La transformación digital de la Economía y la Contabilidad: innovando en el m...
La transformación digital de la Economía y la Contabilidad: innovando en el m...La transformación digital de la Economía y la Contabilidad: innovando en el m...
La transformación digital de la Economía y la Contabilidad: innovando en el m...
 
Del dato a la toma de decisiones, pasando por el conocimiento
Del dato a la toma de decisiones, pasando por el conocimientoDel dato a la toma de decisiones, pasando por el conocimiento
Del dato a la toma de decisiones, pasando por el conocimiento
 
Gcg caso exito-dynamics-sl_micronext
Gcg caso exito-dynamics-sl_micronextGcg caso exito-dynamics-sl_micronext
Gcg caso exito-dynamics-sl_micronext
 
Candidatura UNISONO - Premios DEC 2021
Candidatura UNISONO - Premios DEC 2021Candidatura UNISONO - Premios DEC 2021
Candidatura UNISONO - Premios DEC 2021
 
De la cae a la cae
De la cae a la caeDe la cae a la cae
De la cae a la cae
 
Conferencia Cuti Marzo 2009
Conferencia Cuti Marzo 2009Conferencia Cuti Marzo 2009
Conferencia Cuti Marzo 2009
 
GIGAS_IAAS CON SABOR ESPAÑOL
GIGAS_IAAS CON SABOR ESPAÑOLGIGAS_IAAS CON SABOR ESPAÑOL
GIGAS_IAAS CON SABOR ESPAÑOL
 
Gigas iaas con sabor español julio 2016
Gigas iaas con sabor español julio 2016Gigas iaas con sabor español julio 2016
Gigas iaas con sabor español julio 2016
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
 
El scoring bancario en los tiempos del Big Data
El scoring bancario en los tiempos del Big DataEl scoring bancario en los tiempos del Big Data
El scoring bancario en los tiempos del Big Data
 
Big data sames
Big data samesBig data sames
Big data sames
 
Uso de simulaciones
Uso de simulaciones Uso de simulaciones
Uso de simulaciones
 
4.data mining
4.data mining4.data mining
4.data mining
 
Design Thinking y Agile para SOFOM
Design Thinking y Agile para SOFOMDesign Thinking y Agile para SOFOM
Design Thinking y Agile para SOFOM
 
White Paper Servicios Frost & Sullivan
White Paper Servicios Frost & SullivanWhite Paper Servicios Frost & Sullivan
White Paper Servicios Frost & Sullivan
 
Ricardo Rodriguez - eCommerce Day Guatemala Online [Live] Experience
Ricardo Rodriguez - eCommerce Day Guatemala Online [Live] ExperienceRicardo Rodriguez - eCommerce Day Guatemala Online [Live] Experience
Ricardo Rodriguez - eCommerce Day Guatemala Online [Live] Experience
 
Retos y oportunidades de la Analítica avanzada y Big Data en la industria
Retos y oportunidades de la Analítica avanzada y Big Data en la industriaRetos y oportunidades de la Analítica avanzada y Big Data en la industria
Retos y oportunidades de la Analítica avanzada y Big Data en la industria
 

Más de Codemotion

Más de Codemotion (20)

Fuzz-testing: A hacker's approach to making your code more secure | Pascal Ze...
Fuzz-testing: A hacker's approach to making your code more secure | Pascal Ze...Fuzz-testing: A hacker's approach to making your code more secure | Pascal Ze...
Fuzz-testing: A hacker's approach to making your code more secure | Pascal Ze...
 
Pompili - From hero to_zero: The FatalNoise neverending story
Pompili - From hero to_zero: The FatalNoise neverending storyPompili - From hero to_zero: The FatalNoise neverending story
Pompili - From hero to_zero: The FatalNoise neverending story
 
Pastore - Commodore 65 - La storia
Pastore - Commodore 65 - La storiaPastore - Commodore 65 - La storia
Pastore - Commodore 65 - La storia
 
Pennisi - Essere Richard Altwasser
Pennisi - Essere Richard AltwasserPennisi - Essere Richard Altwasser
Pennisi - Essere Richard Altwasser
 
Michel Schudel - Let's build a blockchain... in 40 minutes! - Codemotion Amst...
Michel Schudel - Let's build a blockchain... in 40 minutes! - Codemotion Amst...Michel Schudel - Let's build a blockchain... in 40 minutes! - Codemotion Amst...
Michel Schudel - Let's build a blockchain... in 40 minutes! - Codemotion Amst...
 
Richard Süselbeck - Building your own ride share app - Codemotion Amsterdam 2019
Richard Süselbeck - Building your own ride share app - Codemotion Amsterdam 2019Richard Süselbeck - Building your own ride share app - Codemotion Amsterdam 2019
Richard Süselbeck - Building your own ride share app - Codemotion Amsterdam 2019
 
Eward Driehuis - What we learned from 20.000 attacks - Codemotion Amsterdam 2019
Eward Driehuis - What we learned from 20.000 attacks - Codemotion Amsterdam 2019Eward Driehuis - What we learned from 20.000 attacks - Codemotion Amsterdam 2019
Eward Driehuis - What we learned from 20.000 attacks - Codemotion Amsterdam 2019
 
Francesco Baldassarri - Deliver Data at Scale - Codemotion Amsterdam 2019 -
Francesco Baldassarri  - Deliver Data at Scale - Codemotion Amsterdam 2019 - Francesco Baldassarri  - Deliver Data at Scale - Codemotion Amsterdam 2019 -
Francesco Baldassarri - Deliver Data at Scale - Codemotion Amsterdam 2019 -
 
Martin Förtsch, Thomas Endres - Stereoscopic Style Transfer AI - Codemotion A...
Martin Förtsch, Thomas Endres - Stereoscopic Style Transfer AI - Codemotion A...Martin Förtsch, Thomas Endres - Stereoscopic Style Transfer AI - Codemotion A...
Martin Förtsch, Thomas Endres - Stereoscopic Style Transfer AI - Codemotion A...
 
Melanie Rieback, Klaus Kursawe - Blockchain Security: Melting the "Silver Bul...
Melanie Rieback, Klaus Kursawe - Blockchain Security: Melting the "Silver Bul...Melanie Rieback, Klaus Kursawe - Blockchain Security: Melting the "Silver Bul...
Melanie Rieback, Klaus Kursawe - Blockchain Security: Melting the "Silver Bul...
 
Angelo van der Sijpt - How well do you know your network stack? - Codemotion ...
Angelo van der Sijpt - How well do you know your network stack? - Codemotion ...Angelo van der Sijpt - How well do you know your network stack? - Codemotion ...
Angelo van der Sijpt - How well do you know your network stack? - Codemotion ...
 
Lars Wolff - Performance Testing for DevOps in the Cloud - Codemotion Amsterd...
Lars Wolff - Performance Testing for DevOps in the Cloud - Codemotion Amsterd...Lars Wolff - Performance Testing for DevOps in the Cloud - Codemotion Amsterd...
Lars Wolff - Performance Testing for DevOps in the Cloud - Codemotion Amsterd...
 
Sascha Wolter - Conversational AI Demystified - Codemotion Amsterdam 2019
Sascha Wolter - Conversational AI Demystified - Codemotion Amsterdam 2019Sascha Wolter - Conversational AI Demystified - Codemotion Amsterdam 2019
Sascha Wolter - Conversational AI Demystified - Codemotion Amsterdam 2019
 
Michele Tonutti - Scaling is caring - Codemotion Amsterdam 2019
Michele Tonutti - Scaling is caring - Codemotion Amsterdam 2019Michele Tonutti - Scaling is caring - Codemotion Amsterdam 2019
Michele Tonutti - Scaling is caring - Codemotion Amsterdam 2019
 
Pat Hermens - From 100 to 1,000+ deployments a day - Codemotion Amsterdam 2019
Pat Hermens - From 100 to 1,000+ deployments a day - Codemotion Amsterdam 2019Pat Hermens - From 100 to 1,000+ deployments a day - Codemotion Amsterdam 2019
Pat Hermens - From 100 to 1,000+ deployments a day - Codemotion Amsterdam 2019
 
James Birnie - Using Many Worlds of Compute Power with Quantum - Codemotion A...
James Birnie - Using Many Worlds of Compute Power with Quantum - Codemotion A...James Birnie - Using Many Worlds of Compute Power with Quantum - Codemotion A...
James Birnie - Using Many Worlds of Compute Power with Quantum - Codemotion A...
 
Don Goodman-Wilson - Chinese food, motor scooters, and open source developmen...
Don Goodman-Wilson - Chinese food, motor scooters, and open source developmen...Don Goodman-Wilson - Chinese food, motor scooters, and open source developmen...
Don Goodman-Wilson - Chinese food, motor scooters, and open source developmen...
 
Pieter Omvlee - The story behind Sketch - Codemotion Amsterdam 2019
Pieter Omvlee - The story behind Sketch - Codemotion Amsterdam 2019Pieter Omvlee - The story behind Sketch - Codemotion Amsterdam 2019
Pieter Omvlee - The story behind Sketch - Codemotion Amsterdam 2019
 
Dave Farley - Taking Back “Software Engineering” - Codemotion Amsterdam 2019
Dave Farley - Taking Back “Software Engineering” - Codemotion Amsterdam 2019Dave Farley - Taking Back “Software Engineering” - Codemotion Amsterdam 2019
Dave Farley - Taking Back “Software Engineering” - Codemotion Amsterdam 2019
 
Joshua Hoffman - Should the CTO be Coding? - Codemotion Amsterdam 2019
Joshua Hoffman - Should the CTO be Coding? - Codemotion Amsterdam 2019Joshua Hoffman - Should the CTO be Coding? - Codemotion Amsterdam 2019
Joshua Hoffman - Should the CTO be Coding? - Codemotion Amsterdam 2019
 

Último

redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
nicho110
 

Último (12)

Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXI
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptx
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 

José Carlos Baquero | Inteligencia Artificial y Discriminación: Cómo conseguir algoritmos más igualitarios y justos | Codemotion Madrid 2018

  • 1. © GMV, 2018 Propiedad de GMV Todos los derechos reservados GMV-LIMITED El presente documento está clasificado como "GMV-CONFIDENTIAL". Esta clasificación habilita a su receptor al uso de la información contenida en el documento para los fines para los que la empresa la ha facilitado o, en su caso, a lo acordado contractualmente en relación al intercambio de información entre las partes, y ello sin perjuicio del cumplimiento de la normativa sobre propiedad intelectual y sobre protección de datos de carácter personal. Inteligencia Artificial y Discriminación José Carlos Baquero Triguero Madrid | November 30 - December 1, 2018
  • 2. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !2 MEQUIERO PRESENTAR MLEQUITATIVO
  • 3. SECURITY DATA SCIENCE GMV-LIMITED 24/10/2018 !3 MI BIO • Me llamo José Carlos Baquero y soy licenciado en Matemáticas con algún máster pero con más de 20 años de experiencia en el sector de las Tecnologías de la Información. • Actualmente lidero la division de Inteligencia Artificial y Big Data en GMV • Aplicando Inteligencia Artificial en Ciberseguridad, Prevención de Fraude, Optimización de Procesos Industriales, Asistentes Conversaciones, etc.
  • 4. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !4 AFRONTANDO UNNUEVO ESCENARIO MLEQUITATIVO
  • 5. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !5 SIEMPRE NOS HAN CLASIFICADO
  • 6. MACHINE LEARNING & DISCRIMINACIÓN GMV-LIMITED 2018/12/01 !6 UN ALGORITMO TE PUEDE CONDICIONAR TU FUTURO
  • 7. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !7 CONFIANZA CIEGA EN LA TECNOLOGÍA “Hiring could become faster and less expensive, and […] lead recruiters to more highly skilled people who are better matches for their companies. Another potential result: a more diverse workplace. The software relies on data to surface candidates from a wide variety of places and match their skills to the job requirements, free of human biases.”
  • 8. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !8 O NO? “But software is not free of human influence. Algorithms are written and maintained by people, and machine learning algorithms adjust what they do based on people’s behavior. As a result […] algorithms can reinforce human prejudices.”
  • 9. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !9 ALGUNOS CASOS RECIENTES
  • 10. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !10 “Latest White House report on Big Data charts pathways for fairness and opportunity but also cautions against re-encoding bias and discrimination into algorithmic systems” INQUIETUD EN LOS GOBIERNOS
  • 11. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !11 INQUIETUD EN LOS GOBIERNOS – GDPR
  • 12. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !12 Y LAS ORGANIZACIONES? “While algorithmic decision-making aids have been used for decades, machine learning is posing new challenges due to its greater complexity, opaqueness, ubiquity, and exclusiveness.” “Governments and international organizations have a role to play, but regulations tend not to keep pace with technological development.“
  • 13. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !13 MACHINE LEARNING PARA LA TOMA DE DECISIONES Desde las solicitudes de crédito hasta las citas on-line, día a día el machine learning está automatizando la toma de decisiones.
  • 14. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !14 CRECIENTE IMPACTO EN LA SOCIEDAD Cada vez más surgen inquietudes sobre la pérdida de transparencia, responsabilidad y equidad de los algoritmos.
  • 15. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !15 MACHINE LEARNING & DISCRIMINACIÓN Necesitamos intensificar y buscar nuevas formas para mitigar la discriminación emergente en nuestros modelos . .
  • 16. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !16 MACHINE LEARNING & DISCRIMINACIÓN Tenemos que estar seguros que nuestras predicciones no perjudiquen injustamente a la gente con ciertas características sensibles (e.j. género, etnia, etc.)
  • 17. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !17 REACCIÓN DELA COMUNIDAD CIENTÍFICA MLEQUITATIVO
  • 18. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !18 ÁREA ACTIVA DE INVESTIGACIÓN Cómo realizar modelos predictivos equitativos es un ámbito de investigación activa. Finalmente nos lo estamos tomando en serio.
  • 19. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !19 ALGUNAS APROXIMACIONES 1. Foco en la interpretabilidad y transparencia: Permitir interrogar a los modelos complejos. 2. Hacer modelos más robustos y justos en sus predicciones: Modificar la optimización de las funciones objetivos y añadir restricciones.
  • 20. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !20 EJEMPLO: PREDICCIÓN DEINGRESOS MLEQUITATIVO
  • 21. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !21 EJEMPLO: PREDICCIÓN DE INGRESOS Entrenaremos un clasificador básico que pueda predecir si los ingresos de una persona es mayor de 50K$ al año Usaremos el data set Adult UCI: : https:// archive.ics.uci.edu/ml/datasets/Adult
  • 22. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !22 VEAMOS UNA IMPLEMENTACIÓN https://github.com/jbaquerot/ Fairer_ML/blob/master/ notebooks/Fairer_ML.ipynb
  • 23. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !23 RESULTADOS MLEQUITATIVO
  • 24. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !24 RESULTADOS • Una vez ajustados la imparcialidad vs la exactitud de las predicciones, establecemos λrace= 130 y λgender= 30. • Aparentemente es un poco más complicado hacer cumplir la imparcialidad para atributos raciales frente por género
  • 25. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !25 RESULTADOS • Sacrificando sólo un 5% de la exactitud, tenemos un clasificador que realiza predicciones más imparciales frente raza y género • Un resultado bastante decente!
  • 26. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !26 CONCLUSIONES MLEQUITATIVO
  • 27. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !27 CONCLUSIONES • Construir modelos predictivos imparciales no es tan sencillo como quitar algunos atributos sensibles de los datos de entrenamiento.
  • 28. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !28 CONCLUSIONES • Se requieren técnicas ingeniosas para corregir el profundo sesgo de los datos y forzar a los modelos a realizar predicciones más imparciales
  • 29. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !29 CONCLUSIONES • Realizar predicciones imparciales conllevan un coste: reduce el desempeño de nuestro modelo
  • 30. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !30 CONCLUSIONES • Es un pequeño precio a pagar para dejar atrás el mundo sesgado de ayer y construir un mañana más justo
  • 31. © GMV, 2018 Propiedad de GMV Todos los derechos reservados GMV-LIMITED El presente documento está clasificado como "GMV-CONFIDENTIAL". Esta clasificación habilita a su receptor al uso de la información contenida en el documento para los fines para los que la empresa la ha facilitado o, en su caso, a lo acordado contractualmente en relación al intercambio de información entre las partes, y ello sin perjuicio del cumplimiento de la normativa sobre propiedad intelectual y sobre protección de datos de carácter personal. !31 ELRETO CONTINÚA MLEQUITATIVO
  • 32. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/10/30 !32 EL RETO CONTINÚA
  • 34. GMV-LIMITED MACHINE LEARNING & DISCRIMINACIÓN 2018/12/01 !34 REFERENCES • https://blog.godatadriven.com/fairness-in-ml • https://work.qz.com/1227982/ai-and-discrimination-what-tech-companies-can-do/ • https://research.google.com/bigpicture/attacking-discrimination-in-ml/ • https://obamawhitehouse.archives.gov/blog/2016/05/04/big-risks-big-opportunities- intersection-big-data-and-civil-rights • http://mrtz.org/nips17/#/ • http://www3.weforum.org/docs/ WEF_40065_White_Paper_How_to_Prevent_Discriminatory_Outcomes_in_Machine_Learning.p df