Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Qué (pomo) hacen los programadores
1. ¿Que (pomo) hacen los
programadores?
martin sarsale
properati.com
martin@properati.com
@runixo
Hackeando el Periodismo
11 noviembre 2015
#HacksHackersMendoza
https://goo.gl/qoDwva
2. Que hacen los programadores
●Hacen que las computadoras trabajen por ellos
○Procesan, pican, cortan, pegotean datos
●Presentan los datos de distintas maneras
○Interfaces interesantes
3. Masaje de los datos
●extraer
○direcciones
○nombres propios
○fechas
○cosas que siguen un patrón mas o menos definido.
●homogeneizar
●ordenar
●filtrar
●cruzar con otros
○datos geográficos
○búsquedas en bases de datos
4. Presentación de los datos
●Para humanos:
○Mapas
○Lineas de tiempo
○Realtime (Twitter)
●Para máquinas / otros investigadores
○Google y robots varios
○Web Semántica
5. Prototipos
●Es bastante rápido hacer prototipos (80-20)
●Los productos finales llevan mucho más tiempo
○Hacer herramientas es otra historia
6. Prototipos
“mapear las direcciones que aparecen en un texto”
1. extraer las direcciones y el contexto en el que aparecen
■ 1 hora de desarrollo, 1 minuto de procesamiento
2. filtrar las correctas (mapeables)
■ 1/2hora de desarrollo, 1 minuto de procesamiento
3. mostrarlas en el mapa
■ 1/2 hora desarrollo, < 1segundo de procesamiento
7. Proto: Extraer direcciones
●Tienen una forma parecida a esta:
○NombrePropio(espacio)Numero(espacio)Localidad
○(([A-Z][a-z]+)+ [0-9]+ ([A-Z][a-z]+)*) (no es del todo verdad)
●226 resultados:
○Fragata Sarmiento 551
○Conadep 4151
○Humahuaca 3951
○Irala 1153
○Puente 12
○Comisaria 5
○Mitre 3450
○Alberdi 5045
8. Proto: Encontrar las mapeables
● Intentar geocodificarlas
○Dirección => Latitud y Longitud
●Echeverria 442 Martinez
○Provider: google
○Street: Echeverría 442
○City: San Isidro
○State: Buenos Aires
○Latitude: -34.4755408
○Longitude: -58.5062486
○Country: AR
●Conadep 4151
○Provider: google
○Street: (nada)
10. ● Datasets abiertos
○ Hay historias escondidas!
● Documentación abierta, pero no amigable
○ PDFs, Docs, Sitios web a scrappear
● Producción propia
○ crowdsourcing
Fuentes de Los Datos (en mayúscula)
14. Las visualizaciones
● Simple > Complejo
● Hay celulares chiquitos, conexiones malas, páginas web
angostas, etc, etc. Simple es bueno
● Aunque impresionante, a veces garpa :)
● Repositorios de visualizaciones:
○ esto ahora no me sirve, pero lo voy a guardar acá
16. ¿Que (pomo) hacen los
programadores?
martin sarsale
properati.com
martin@properati.com
@runixo
Hackeando el Periodismo
11 noviembre 2015 - Mendoza
https://goo.gl/qoDwva