Data Analytics!
sobre Votaciones
Nominales!
Taller Transparencia & TIC !
Lic. Gabriela Perez, Lic. Ernesto Mislej!
gabriela, ernesto [@7puentes.com]!


Marzo 2011!

                                        7puentes.com!
Resumen Hackathon OpenGov
           GarageLab - UdeSA!
Durante Septiembre de 2010 participamos de la hackathon
OpenGov, organizada por GarageLab y la Universidad de San
Andrés, quien convocaba a Hackers(*) y a Cientistas Sociales a
elaborar herramientas para promover la transparencia en los
datos públicos. !

De ese encuentro de dos días de trabajo surgieron 4 proyectos,
vinculados a gasto público, registro de audiencias, información
georeferenciada sobre la cuenca matanza-riachuelo y análisis
de grupos de afinidad de legisladores según votaciones
nominales, éste último integrado por 7P.!

(*): Léase “informáticos con iniciativa”!

  7puentes.com!              Data Analytics sobre Votaciones Nominales!
Resumen Hackathon OpenGov
           GarageLab - UdeSA!




http://garagelab.tumblr.com/post/1985840685/votosdiputados!

  7puentes.com!          Data Analytics sobre Votaciones Nominales!
Análisis de Legislaturas!

Objetivo: !
               Construir una herramienta para el "
                  Análisis de Legislaturas.!
Análisis de votaciones nominales, descripción y predicción
de comportamiento, inducción de grupos de afinidad. !


Audiencia: !
- Investigadores en Ciencia Política!
- Periodistas especializados!


  7puentes.com!            Data Analytics sobre Votaciones Nominales!
Análisis de Grupos de Afinidad de
               Legisladores!

              ¿Qué son 2 legisladores afines?!
           Modelar y caracterizar a los actores y !
        luego encontrar grupos de actores similares!

Según su forma/contenido:!
  - Bloque, edad, sexo, provincia, comisión…!
- Según su comportamiento:!
  - Co-firma en presentaciones de proyectos de ley!
  - Votaciones Nominales "!

  7puentes.com!             Data Analytics sobre Votaciones Nominales!
Pipeline de análisis!


Recuperar y extraer la información de las fuentes!


    Completar el modelo de datos !


        Preparar los datos para el análisis!


             Aplicar las técnicas y algoritmos!


                 Presentar los resultados!




 7puentes.com!                  Data Analytics sobre Votaciones Nominales!
Grupos de actores
con características
similares.
En este caso, secuencia
de votos similares.




                          Matriz vis, similitud=votos
Inducción de metabloques,
grupo de legisladores con
patrones de votos similares




        Heat map color=tipo_voto, filas=legislador,
          columnas=votación, filas reordenadas
2



                                1

                         Casos outliers, que quiebran el patrón común
                         1. la modificación al Código Civil incorporando el
                         matrimonio entre personas del mismo sexo;
                         2. Fondo del Bicentenario para el Desendeudamiento y
                         la Estabilidad (la utilización de reservas del tesoro
                         nacional para el pago de deuda externa, cuya discusión
                         llevó a la destitución/renuncia de Martín Redrado del
                         Banco Central);
http://bit.ly/9VPqCg !
Insights - eurekas!!
Votaciones outliers, fuera del patrón común.!
El meta-bloque de oposición.!
El comportamiento de bloques pequeños como Proyecto Sur.!

Membresía partidaria como principal descriptor.!
Caso Matrimonio Igualitario, donde se quiebra el patrón. !
Otras variables descriptivas y predictoras.!

Dimensionalidad del espacio de votaciones.!

Trabajo Futuro!
Desarrollar una herramienta de análisis interactiva.!
Sumar componente temporal al análisis.!
Especificar similitud de actores a partir de otras fórmulas.!

   7puentes.com!                   Data Analytics sobre Votaciones Nominales!
Dimensionalidad y !
     poder descriptivo de variables !




                                                              !



7puentes.com!    Data Analytics sobre Votaciones Nominales!
Herramientas utilizadas!
Recuperación de datos: Se construyeron robots para la recuperación de las
planillas de votaciones nominales publicadas en el sitio del HCDN. Las planillas
están en formato PDF. Los robots fueron programados en Ruby utilizando librerías
de scrapping (open-uri, Hpricot)!

Preparación de datos: Se armaron pequeños programas de procesamiento de
textos para la traducción de formatos también en Ruby. Para trabajar con los
formatos PDF, se utilizó la librería pdfreader. !

Análisis: Se aplicaron técnicas de clustering, métodos de agrupamiento de
individuos según su similitud. En este proyecto se utilizaron las suites de Data
Mining Weka y CLUTO.!

Presentación y Visualización de Datos: Se aplicaron las metáforas visuales de
visualización de matrices, heatmaps y treemaps. Se utilizaron las herramientas
Protovis y ManyEyes. !


   7puentes.com!                  Data Analytics sobre Votaciones Nominales!
Referencias!
Ruby: http://www.ruby-lang.org/es/ !
Hpricot: https://github.com/hpricot/hpricot/wiki !
PDFReader: http://rubyforge.org/projects/pdf-reader!
Weka: http://www.cs.waikato.ac.nz/ml/weka/!
CLUTO: http://glaros.dtc.umn.edu/gkhome/views/cluto/!
Protovis: http://vis.stanford.edu/protovis/!
Manyeyes: http://www-958.ibm.com/software/data/cognos/manyeyes/!
Heatmaps: http://en.wikipedia.org/wiki/Heat_map!
Matrix Visualization: http://vis.stanford.edu/protovis/ex/matrix.html!
Treemaps: http://www.cs.umd.edu/hcil/treemap/!




   7puentes.com!                   Data Analytics sobre Votaciones Nominales!
Nuestra empresa – 7Puentes!

7Puentes está conformada por un equipo de jóvenes
profesionales de computación egresados de la
Universidad de Buenos Aires (UBA) con amplia
experiencia en el campo laboral y académico. !

Fundada en el año 2007 el objetivo de la empresa está
focalizado en soluciones de sofware y análisis de datos
de alto valor e investigación científica para el
tratamiento eficaz de información compleja.!

Contamos con experiencias exitosas de constucción de software y consultoría en el mercado
local e internacional; en la actualidad poseemos proyectos activos y propuestas en desarrollo. !

Nuestro grupo posee una organización horizontal y flexible lo que permite adaptarnos a la
magnitud y particularidad de cada proyecto de manera efectiva, valiéndonos de profesionales
en cada área específica. En nuestra historia hemos contado con la colaboración de expertos
de diferentes disciplinas como ciencias políticas, económicas y de la comunicación.!

7Puentes de Königsberg Gerli La empresa posee sus oficinas en Banfield, situadas al sur del
gran Buenos Aires, a 15 km. del obelisco porteño de la Ciudad Autónoma de Buenos Aires.!


   7puentes.com!                         Data Analytics sobre Votaciones Nominales!
Nuestro Equipo!
Lic. Ernesto Mislej Responsable del área 7PLabs. Su área de experiencia profesional y académica
es en Inteligencia Artificial, Aprendizaje Automático y Visualización de Datos. Actualmente está
liderando proyectos en Opinion Mining. Es Lic. en Cs. de la Computación graduado de la Facultad
de Ciencias Exactas y Naturales de la UBA, donde se desempeña como docente en la maestría de
Data Mining & Knowledge Discovery y JTP del área Inteligencia Artificial en la licenciatura.!

Lic. Gabriela Perez Licenciada en Ciencia Política de la Universidad Nacional de Rosario (1999), se
especializó en Administración y Políticas Públicas en la Universidad de San Andrés (2001-2003). Fue
asesora parlamentaria en el H. Senado de la Nación (2002-2006). Desde entonces es consultora en
proyectos de cooperación internacional (Proyecto de Modernización del Estado (BIRF), 2006-2007 y
Proyecto de Fortalecimiento del Sistema de Protección de los Derechos Humanos (UE) desde 2008 y
continua), desarrollando tareas de investigación, análisis, planificación y coordinación de actividades. !


En conjunto trabajan en el Proyecto Ventura,
una herramienta de monitoreo de opinión pública
sobre temas políticos en la websocial; utilizando
tecnología de Text Analytics, recuperación y
procesamiento de textos, Procesamiento del
Lenguaje, Sentiment Analysis y Visualización de
Datos.



    7puentes.com!                           Data Analytics sobre Votaciones Nominales!
Data Analytics!
sobre Votaciones
Nominales!
Taller Transparencia & TIC !
Lic. Gabriela Perez, Lic. Ernesto Mislej!
gabriela, ernesto [@7puentes.com]!


Marzo 2011!

                                        7puentes.com!

Data analytics sobre votaciones nominales

  • 1.
    Data Analytics! sobre Votaciones Nominales! TallerTransparencia & TIC ! Lic. Gabriela Perez, Lic. Ernesto Mislej! gabriela, ernesto [@7puentes.com]! Marzo 2011! 7puentes.com!
  • 2.
    Resumen Hackathon OpenGov GarageLab - UdeSA! Durante Septiembre de 2010 participamos de la hackathon OpenGov, organizada por GarageLab y la Universidad de San Andrés, quien convocaba a Hackers(*) y a Cientistas Sociales a elaborar herramientas para promover la transparencia en los datos públicos. ! De ese encuentro de dos días de trabajo surgieron 4 proyectos, vinculados a gasto público, registro de audiencias, información georeferenciada sobre la cuenca matanza-riachuelo y análisis de grupos de afinidad de legisladores según votaciones nominales, éste último integrado por 7P.! (*): Léase “informáticos con iniciativa”! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 3.
    Resumen Hackathon OpenGov GarageLab - UdeSA! http://garagelab.tumblr.com/post/1985840685/votosdiputados! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 4.
    Análisis de Legislaturas! Objetivo:! Construir una herramienta para el " Análisis de Legislaturas.! Análisis de votaciones nominales, descripción y predicción de comportamiento, inducción de grupos de afinidad. ! Audiencia: ! - Investigadores en Ciencia Política! - Periodistas especializados! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 5.
    Análisis de Gruposde Afinidad de Legisladores! ¿Qué son 2 legisladores afines?! Modelar y caracterizar a los actores y ! luego encontrar grupos de actores similares! Según su forma/contenido:! - Bloque, edad, sexo, provincia, comisión…! - Según su comportamiento:! - Co-firma en presentaciones de proyectos de ley! - Votaciones Nominales "! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 6.
    Pipeline de análisis! Recuperary extraer la información de las fuentes! Completar el modelo de datos ! Preparar los datos para el análisis! Aplicar las técnicas y algoritmos! Presentar los resultados! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 7.
    Grupos de actores concaracterísticas similares. En este caso, secuencia de votos similares. Matriz vis, similitud=votos
  • 8.
    Inducción de metabloques, grupode legisladores con patrones de votos similares Heat map color=tipo_voto, filas=legislador, columnas=votación, filas reordenadas
  • 9.
    2 1 Casos outliers, que quiebran el patrón común 1. la modificación al Código Civil incorporando el matrimonio entre personas del mismo sexo; 2. Fondo del Bicentenario para el Desendeudamiento y la Estabilidad (la utilización de reservas del tesoro nacional para el pago de deuda externa, cuya discusión llevó a la destitución/renuncia de Martín Redrado del Banco Central); http://bit.ly/9VPqCg !
  • 10.
    Insights - eurekas!! Votacionesoutliers, fuera del patrón común.! El meta-bloque de oposición.! El comportamiento de bloques pequeños como Proyecto Sur.! Membresía partidaria como principal descriptor.! Caso Matrimonio Igualitario, donde se quiebra el patrón. ! Otras variables descriptivas y predictoras.! Dimensionalidad del espacio de votaciones.! Trabajo Futuro! Desarrollar una herramienta de análisis interactiva.! Sumar componente temporal al análisis.! Especificar similitud de actores a partir de otras fórmulas.! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 11.
    Dimensionalidad y ! poder descriptivo de variables ! ! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 12.
    Herramientas utilizadas! Recuperación dedatos: Se construyeron robots para la recuperación de las planillas de votaciones nominales publicadas en el sitio del HCDN. Las planillas están en formato PDF. Los robots fueron programados en Ruby utilizando librerías de scrapping (open-uri, Hpricot)! Preparación de datos: Se armaron pequeños programas de procesamiento de textos para la traducción de formatos también en Ruby. Para trabajar con los formatos PDF, se utilizó la librería pdfreader. ! Análisis: Se aplicaron técnicas de clustering, métodos de agrupamiento de individuos según su similitud. En este proyecto se utilizaron las suites de Data Mining Weka y CLUTO.! Presentación y Visualización de Datos: Se aplicaron las metáforas visuales de visualización de matrices, heatmaps y treemaps. Se utilizaron las herramientas Protovis y ManyEyes. ! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 13.
    Referencias! Ruby: http://www.ruby-lang.org/es/ ! Hpricot:https://github.com/hpricot/hpricot/wiki ! PDFReader: http://rubyforge.org/projects/pdf-reader! Weka: http://www.cs.waikato.ac.nz/ml/weka/! CLUTO: http://glaros.dtc.umn.edu/gkhome/views/cluto/! Protovis: http://vis.stanford.edu/protovis/! Manyeyes: http://www-958.ibm.com/software/data/cognos/manyeyes/! Heatmaps: http://en.wikipedia.org/wiki/Heat_map! Matrix Visualization: http://vis.stanford.edu/protovis/ex/matrix.html! Treemaps: http://www.cs.umd.edu/hcil/treemap/! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 14.
    Nuestra empresa –7Puentes! 7Puentes está conformada por un equipo de jóvenes profesionales de computación egresados de la Universidad de Buenos Aires (UBA) con amplia experiencia en el campo laboral y académico. ! Fundada en el año 2007 el objetivo de la empresa está focalizado en soluciones de sofware y análisis de datos de alto valor e investigación científica para el tratamiento eficaz de información compleja.! Contamos con experiencias exitosas de constucción de software y consultoría en el mercado local e internacional; en la actualidad poseemos proyectos activos y propuestas en desarrollo. ! Nuestro grupo posee una organización horizontal y flexible lo que permite adaptarnos a la magnitud y particularidad de cada proyecto de manera efectiva, valiéndonos de profesionales en cada área específica. En nuestra historia hemos contado con la colaboración de expertos de diferentes disciplinas como ciencias políticas, económicas y de la comunicación.! 7Puentes de Königsberg Gerli La empresa posee sus oficinas en Banfield, situadas al sur del gran Buenos Aires, a 15 km. del obelisco porteño de la Ciudad Autónoma de Buenos Aires.! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 15.
    Nuestro Equipo! Lic. ErnestoMislej Responsable del área 7PLabs. Su área de experiencia profesional y académica es en Inteligencia Artificial, Aprendizaje Automático y Visualización de Datos. Actualmente está liderando proyectos en Opinion Mining. Es Lic. en Cs. de la Computación graduado de la Facultad de Ciencias Exactas y Naturales de la UBA, donde se desempeña como docente en la maestría de Data Mining & Knowledge Discovery y JTP del área Inteligencia Artificial en la licenciatura.! Lic. Gabriela Perez Licenciada en Ciencia Política de la Universidad Nacional de Rosario (1999), se especializó en Administración y Políticas Públicas en la Universidad de San Andrés (2001-2003). Fue asesora parlamentaria en el H. Senado de la Nación (2002-2006). Desde entonces es consultora en proyectos de cooperación internacional (Proyecto de Modernización del Estado (BIRF), 2006-2007 y Proyecto de Fortalecimiento del Sistema de Protección de los Derechos Humanos (UE) desde 2008 y continua), desarrollando tareas de investigación, análisis, planificación y coordinación de actividades. ! En conjunto trabajan en el Proyecto Ventura, una herramienta de monitoreo de opinión pública sobre temas políticos en la websocial; utilizando tecnología de Text Analytics, recuperación y procesamiento de textos, Procesamiento del Lenguaje, Sentiment Analysis y Visualización de Datos. 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 16.
    Data Analytics! sobre Votaciones Nominales! TallerTransparencia & TIC ! Lic. Gabriela Perez, Lic. Ernesto Mislej! gabriela, ernesto [@7puentes.com]! Marzo 2011! 7puentes.com!