tipos de organización y sus objetivos y aplicación
IPython & Jupyter Computación interactiva en Data Science
1. Fernando Pérez
(@fperez_org & fperez@lbl.gov)
LBL & UC Berkeley
Computación
interactiva en “Data
Science”
IPython & Jupyter
2. –Hamming'62
“The purpose of computing is insight,
not numbers”
“El objetivo de la computación es la
comprensión, no los números”
3. El ciclo de una idea científica
1. Trabajo individual exploratorio
2. Desarrollo en Colaboración
3. Ejecución en Parallel (HPC, nube, ...)
4. Publicación & comunicación (de manera reproducible!)
5. Educación
6. Goto 1
4. Tratamos esto como un problema integrado y
coherente
1. Trabajo individual exploratorio
2. Desarrollo en Colaboración
3. Ejecución en Parallel (HPC, nube, ...)
4. Publicación & comunicación (de manera reproducible!)
5. Educación
6. Goto 1
El ciclo de una idea científica
5. IPython: CU Boulder, 2001
O, cómo evitar trabajar en una tesis doctoral de física de partículas
6. Noviembre del 2001: “Un hack de una tarde” "
❖ Script Python de 259 líneas.
❖ sys.ps1 -> In [N].
❖ sys.displayhook -> Out[N], cache de resultados.
❖ Graficación, Numeric, etc.
Hoy día
❖ Cientos de miles de líneas de código
❖ Cientos de personas han contribuído
❖ Múltiples individuos trabajando de tiempo completo
7. El crédito es de todo el equipo
Y más de 500 otros contribuyen en la comunidad
9. Más allá de la terminal
❖ El REPL como protocolo de red
❖ Kernels
❖ ejecución de código
❖ Clientes
❖ Leer la entrada
❖ Presentar resultado
Unas pocas abstracciones
soportan clientes sofisticados
Carlos Córdoba, Físico de la U. Nal de Bogotá, Continuum (charla previa)
10. 2011: The IPython Notebook
❖ Cliente para la web
❖ Texto & matemática
❖ Código
❖ Resultados
21. nbviewer: compartir notebooks sin esfuerzo
❖ Leer notebooks sin
instalar nada
❖ Comparta una URL
❖ nbviewer.jupyter.org
22. Blogging científico
Jake van der Plas @ UW
http://blogs.scientificamerican.com/
sa-visual/2014/09/16/visualizing-4-
dimensional-asteroids
23. Libros ejecutables
❖ Libro Springer
❖ Capítulos: Notebooks IPython
❖ Presentados en su blog
❖ Disponible en Github
Python for Signal Processing, por José Unpingco
25. Berkeley: Foundations of Data Science
http://data8.org
❖ Nuevo currículo para todos
los estudiantes de Berkeley
❖ Libro interactivo hecho de
Notebooks Jupyter
❖ Curso en JupyterHub
26. Libros sobre IPython
IPython Interactive Computing
and Visualization Cookbook
Learning IPython for Interactive
Computing and Data Visualization
Cyrille Rossant
cyrille.rossant.net
27. Cambiando la cultura científica
http://www.nature.com/news/interactive-notebooks-sharing-the-code-1.16261