Why algorithmic transparency is important in the wake of new regulations aimed at curbing the increasing number of decisions made by algorithms that are unappealable.
Un overview del talento disponible, del talento que queremos y no tenemos, del talento que deberíamos tener, costos aproximados y formas de organizarlo dentro de nuestras empresas.
Inferencia Estadística para PeriodistasJesus Ramos
Para lograr una labor periodística más ética, justa y veraz, es importante incorporar elementos del método científico a la práctica. Las pruebas de hipótesis son la herramienta base en el método científico, y pensar en las aseveraciones y evaluarlas con esta técnica resultará en una nota más blindada y difícil de debatir.
(Spanish) An overview of machine/statistical learning, what it is, what's it for, and some firms that are using it to drive up revenue and create new products.
Un overview del talento disponible, del talento que queremos y no tenemos, del talento que deberíamos tener, costos aproximados y formas de organizarlo dentro de nuestras empresas.
Inferencia Estadística para PeriodistasJesus Ramos
Para lograr una labor periodística más ética, justa y veraz, es importante incorporar elementos del método científico a la práctica. Las pruebas de hipótesis son la herramienta base en el método científico, y pensar en las aseveraciones y evaluarlas con esta técnica resultará en una nota más blindada y difícil de debatir.
(Spanish) An overview of machine/statistical learning, what it is, what's it for, and some firms that are using it to drive up revenue and create new products.
Diseñando equipos de ciencia de datos: aciertos y desastres,Software Guru
En esta sesión, el conferencista compartirá experiencias adquiridas en la creación y gestión de equipos de ciencia de datos en distintas organizaciones.
Ponente: Jesús Ramos
Machine learning transparente como ventaja competitiva de negocioSoftware Guru
En esta sesión mostraremos casos de organizaciones que han seguido el camino de la transparencia en sus iniciativas de machine learning logrando tener modelos altamente interpretables, y cómo esto les ha brindado una ventaja competitiva.
Presentado por Jesús Ramos
Diseñando equipos de ciencia de datos: aciertos y desastresSoftware Guru
En esta sesión, el conferencista compartirá experiencias adquiridas en la creación y gestión de equipos de ciencia de datos en distintas organizaciones.
Primera versión del manual de análisis y diseño de algoritmos por parte del área de informática de la INACAP.
Manual interesante para el análisis y diseño de algoritmos.
Créditos a Víctor Valenzuela.
Slides de la charla "Machine learning a lo berserker". Una charla que consiste en explicar Machine Learning a lo bruto y con un poco de irresponsabilidad :P Nada de mates y un poco de sentido práctico.
Más información: http://berserker.science
eBook Nubiral _ DataOps_ cada cual atiende su juego (1).pdfNubiral
Conoce cómo esta disciplina aporta un marco de trabajo y herramientas para alinear los equipos de ingeniería y de análisis de datos para mejorar la gestión del ecosistema de datos en la organización.
Tallk given at #SXSW2019 in the Intelligent Future track as part of the Interactive Festival. We explain 3 frameworks for MachineEthics and how they affect the supervised and unsupervised methods, and the data engineering discipline.
(Spanish) Data Modelling takes companies to Data Quality, and Data Quality takes them to truthful analytics and unbiased Machine Learning. This talk establishes and explains this relationship, and where in materializes within the data architecture of a firm.
Diseñando equipos de ciencia de datos: aciertos y desastres,Software Guru
En esta sesión, el conferencista compartirá experiencias adquiridas en la creación y gestión de equipos de ciencia de datos en distintas organizaciones.
Ponente: Jesús Ramos
Machine learning transparente como ventaja competitiva de negocioSoftware Guru
En esta sesión mostraremos casos de organizaciones que han seguido el camino de la transparencia en sus iniciativas de machine learning logrando tener modelos altamente interpretables, y cómo esto les ha brindado una ventaja competitiva.
Presentado por Jesús Ramos
Diseñando equipos de ciencia de datos: aciertos y desastresSoftware Guru
En esta sesión, el conferencista compartirá experiencias adquiridas en la creación y gestión de equipos de ciencia de datos en distintas organizaciones.
Primera versión del manual de análisis y diseño de algoritmos por parte del área de informática de la INACAP.
Manual interesante para el análisis y diseño de algoritmos.
Créditos a Víctor Valenzuela.
Slides de la charla "Machine learning a lo berserker". Una charla que consiste en explicar Machine Learning a lo bruto y con un poco de irresponsabilidad :P Nada de mates y un poco de sentido práctico.
Más información: http://berserker.science
eBook Nubiral _ DataOps_ cada cual atiende su juego (1).pdfNubiral
Conoce cómo esta disciplina aporta un marco de trabajo y herramientas para alinear los equipos de ingeniería y de análisis de datos para mejorar la gestión del ecosistema de datos en la organización.
Tallk given at #SXSW2019 in the Intelligent Future track as part of the Interactive Festival. We explain 3 frameworks for MachineEthics and how they affect the supervised and unsupervised methods, and the data engineering discipline.
(Spanish) Data Modelling takes companies to Data Quality, and Data Quality takes them to truthful analytics and unbiased Machine Learning. This talk establishes and explains this relationship, and where in materializes within the data architecture of a firm.
This deck lays out the landscape for AI & DS in the Mexican Market. From MOOCs to national academic programs, and from our weaknesses as a country, to how we can tackle them.
Ipsos, empresa de investigación de mercados y opinión pública, divulgó su informe N°29 “Claves Ipsos” correspondiente al mes de abril, que encuestó a 800 personas con el fin de identificar las principales opiniones y comportamientos de las y los ciudadanos respecto de temas de interés para el país. En esta edición se abordó la a Carabineros de Chile, su evaluación, legitimidad en su actuar y el asesinato de tres funcionarios en Cañete. Además, se consultó sobre el Ejército y la opinión respecto de la marcha en Putre.
4. @xuxoramos
Algoritmo para
asignar fianzas y
predecir reincidencia
Sesgado VS
afroamericanos* :/
4
* https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing
5. @xuxoramos
Búsqueda de "CEO" en Google Images
5
Mujeres en los resultados = 11/100
Mujeres CEO en EU = 27/100*
* https://www.eurekalert.org/pub_releases/2015-04/uow-wac040915.php
6. @xuxoramos
"Three black
teenagers" VS
"Three white
teenagers"*
6
* https://www.theguardian.com/technology/2016/jun/09/three-black-teenagers-anger-as-google-image-search-shows-police-mugshots
7. @xuxoramos
Causas
1. Falta de contexto
Equipo dejó fuera al subject matter expert.
2. Correlación = Causalidad
Equipo dejó fuera a matemáticos/físicos.
3. Ninguna de las anteriores
Todo se hizo bien, los datos están sesgados de orígen.
7
8. @xuxoramos
Causas
8
1. Falta de contexto
Equipo dejó fuera al subject matter expert.
2. Correlación = Causalidad
Equipo dejó fuera a matemáticos/físicos.
3. Ninguna de las anteriores
Todo se hizo bien, los datos están sesgados de orígen.
9. "A big step towards countering
discriminatory algorithms is the ability
to understand them..."
- Ethan Chiel, writer @ Fusion
9
10. Abril 2016: Unión Europea*
10
* https://arxiv.org/pdf/1606.08813.pdf
11. No te aceptaron en la París IV?
No te dieron tu crédito
hipotecario?
Te recomendaron un
tratamiento médico?
Fuiste seleccionado para
programas de gobierno en un
tier X?
No fuiste aceptado en el
Eurovision?
Qué significa esto para la
sociedad?
Tienes derecho a
saber por qué!
Tienes derecho a
una explicación!
11
12. @xuxoramos
Qué significa esto para DS y ML?
12
Antes:
Buena Predicción > Interpretabilidad
Ahora:
Interpretabilidad >> Buena Predicción
13. @xuxoramos
Qué significa esto para el ML supervisado?
13
1. Privilegiar simplicidad.
2. Dedicar tiempo al Feature Selection.
3. Para tener modelos con menos variables.
4. Y poder entrenar varios en un tiempo menor.
5. Y así evitar la maldición de la dimensionalidad.
6. Y finalmente reducir el overfitting.
14. @xuxoramos
Qué significa esto para el ML no supervisado?
14
1. Privilegiar la reproducibilidad*
2. Elegir algoritmos parametrizables (DBSCAN >
K-means).
3. Establecer procesos formales de diseño de
experimentos.
* https://www.forbes.com/sites/quora/2017/02/09/how-the-reproducibility-crisis-in-academia-is-affecting-scientific-research/#1aa4d3853dad
15. @xuxoramos
Qué significa esto para la Ingeniería de Datos?
15
1. Incorporar Github al proceso de DS.
2. Levantar infras para entrenamientos en
paralelo.
3. Levantar pipelines de reentrenamiento.
4. "Solo los salvajes sobreescriben datos".
5. Envolver la DS en Ingeniería de Software.
19. @xuxoramos
Qué significa esto para el Deep Learning?
19
Explicar decisiones en términos de weights no
es admisible, ni accionable para el afectado*
* https://www.technologyreview.com/s/604087/the-dark-secret-at-the-heart-of-ai/
20. @xuxoramos
Entonces ya no lo usamos?
20
Cuando la distancia entre una decisión, y su
recompensa / penalización sea directa, usa DL*
* http://www.wired.co.uk/article/google-ai-montezuma-revenge
23. @xuxoramos
Y cuando no lo sea?
23
DARPA1
, MIT2
, Cambridge, Oxford, DATANK, et
al ya están en ello.
1. http://www.darpa.mil/attachments/DARPA-BAA-16-53.pdf
2. http://news.mit.edu/2016/making-computers-explain-themselves-machine-learning-1028