SlideShare una empresa de Scribd logo
1 de 21
Descargar para leer sin conexión
Infopython




  Midiendo Información de Mass-Media Con Python
  Juan B Cabral <jbc.develop@gmail.com>
  Pycon Argentina 2010




   Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
¿Qué es Infopython?

    • Infopython es una librería que se utiliza para la valoración de medios de
      información utilizando teorías formales.
    • Surge como muchos módulos sueltos en mi trabajo.




  Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
Un Poco de Teoría

    • Existen diferentes teorías para determinar la importancia de los medios. sobre
      la opinión publica.
    • La “Teoría de Información” de Shannon es una formalización matemática de
      una de la “Aguja hipodérmica”.
    • Existen teorías más complejas.




  Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
Teoría de La "Agenda-Setting"

    • La teoría de la agenda-setting postula que los medios de comunicación de
      masas tienen una gran influencia sobre el público al determinar qué historias
      poseen interés informativo y cuánto espacio e importancia se les da.
      (Wikipedia)
    • El punto central de esta teoría es asignar una prioridad para obtener mayor
      audiencia, mayor impacto y una determinada conciencia sobre la noticia.




  Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
¿Qué es un Medio Para Nuestro Caso?
  "En el dominio es un "coso" al cual quiero medir el valor de su información"
  Entonces tiene que:

        • Ser homogéneo en su información.
        • Tener la sensación de "unidad".
        • Ser Medible.




   Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
Formalizando
  VALOR = F(AUDIENCIA, IMPACTO)

     • VALOR: Es la importancia del medio dada la teoría.
     • AUDIENCIA: A cuánta gente le llega la información del medio.
     • IMPACTO: Qué tanta importancia le da la audiencia al medio
     • NOTA: La conciencia NO es medible (o no se me ocurrió como formalizarlo)




   Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
Proponiendo F(AUDIENCIA, IMPACTO)
  VALOR = AUDIENCIA * IMPACTO

     • Funciona bien cuando uno de los valores es 0.
     • Refleja mejor la variación de los valores.




   Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
Consideraciones finales de diseño

    • Es mas fácil empezar por "nuevos medios" (web, twitter, etc).
    • Existe una amplia variedad de servicios públicos que miden "cosas" sobre
      nuevos medios.
    • Hay que identificar qué mide la audiencia y qué mide el impacto de estas
      "cosas".
    • El reto no es técnico.




  Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
Arquitectura de Infopython




   Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
Metodología de Trabajo

   1. Configurar la sesión.
   2. Crear los medios.
   3. Crear "sacadatos". (Opcional)
   4. Crear los interpoladores. (Opcional)
   5. Crear la/s agenda/s.
   6. Evaluar los nodos.




  Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
session API
  from infopython import session

  # Listado de todas las llaves OBLIGATORIAS
  session.NEEDED_KEYS

  # crea una nueva session con las llaves v0, v1, ...
  session.set(v0=1, v1=2...)

  # retorna el valor de una llave
  session.get("v0")

  # borra la session
  session.clear()



  Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
IS Webpage

    • Representa una página web (PLOP!).
    • No importa si es web, un perfil de twitter o un blog.
    • Audiencia:

           • Compete (http://www.compete.com/).
           • Alexa (http://www.alexa.com/).

    • Impacto:

           • Page Rank (http://es.wikipedia.org/wiki/PageRank).




  Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
WebPage API
  from infopython.isources import webpages

  google = webpages.WebPage("google.com")

  print "ID> " + google.id
  print "URL> " + google.url
  print "HTML>n" + google.html

  print "Compete>"
  pprint(google.get_info("compete"))




  Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
IS TwitterUser

     • Representa un usuario de twitter (PLOP²)
     • Audiencia:

            • Followers.
            • Kout (http://klout.com/).

     • Impacto:

            • RT.
            • Klout (http://klout.com/).




   Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
TwitterUser API
   from infopython.isources import twitteruser

   yo = twitteruser.TwitterUser("leliel12")

   print "ID> " + yo.id
   print "Username> " + yo.username
   print "Tweepy>"
   pprint(yo.get_info("tweepy"))




  Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
Agenda API
  from infopython import agenda
  from infopython.util import interpolator
  from infopython.isources import twitteruser

  google = webpages.WebPage("google.com")
  yahoo = webpages.WebPage("yahoo.com")

  aud = lambda w: w.get_info("compete")["metrics"]["uv_count"]
  imp = lambda w: w.get_info("pagerank")["pagerank"]
  itp = interpolator.PieceWisePolynomial([0,0,1,1,2,45,64], [1,3,1,1,2,4,64])

  ag = agenda.AgendaSetting(itype=webpages.WebPage,
                            inf_sources=[google, yahoo],
                            audience_valuator=aud,
                            impact_valuator=imp,
                            audience_interpolator=itp,
                            impact_interpolator=itp)



  Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
Agenda API 2
  ag.value_of(google)
  ag.impact_of(google)
  ag.audience_of(google)
  ag.wrap(google)

  ag.count(google)
  ag.remove(google)
  ag.append(google)

  ag.for_type
  ag.audience_valuator
  ag.impact_valuator
  ag.audience_interpolator
  ag.impact_interpolator


  Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
Comparando 2 Agendas
  for i in agenda.rank_isources(ag1, ag2):
      print i




  Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
Test

   1. Correr
       $ python setup.py test
   2. Configurar test.cfg con las llaves de las apis correspondientes.
   3. Again
       $ python setup.py test




  Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
Futuro

    • linkedin.
    • Integrar más tipos de massmedia (imdb, amazon...).
    • y... ¿desde el punto de vista de la audiencia?
    • ¿Web semántica?
    • nltk.




  Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
¿Preguntas?

    • Proyecto:

           • http://bitbucket.org/leliel12/infopython/

    • Contacto:

           • Juan B Cabral <jbc.develop@gmail.com> / @leliel12




  Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>

Más contenido relacionado

Similar a 2001 10-16-infopython

Nuevas funcionalidades de Google Analytics - David Canos
Nuevas funcionalidades de Google Analytics - David CanosNuevas funcionalidades de Google Analytics - David Canos
Nuevas funcionalidades de Google Analytics - David CanosComunica2 Campus Gandia
 
Innovación tecnológica 2010
Innovación tecnológica 2010Innovación tecnológica 2010
Innovación tecnológica 2010Guillermo Díaz
 
Creación de concepto App Apple Watch - Shortcut
Creación de concepto App Apple Watch - ShortcutCreación de concepto App Apple Watch - Shortcut
Creación de concepto App Apple Watch - ShortcutLaura Rodríguez Sánchez
 
Monografia
MonografiaMonografia
MonografiaLika07
 
TuToRiAl dE InFoRmaTiCa
TuToRiAl dE InFoRmaTiCa TuToRiAl dE InFoRmaTiCa
TuToRiAl dE InFoRmaTiCa paty897659
 
TuToRiAl dE InFoRmaTiCa
TuToRiAl dE InFoRmaTiCa TuToRiAl dE InFoRmaTiCa
TuToRiAl dE InFoRmaTiCa paty897659
 
Gremi d'Hotels de Barcelona (4ª sesión)
Gremi d'Hotels de Barcelona (4ª sesión)Gremi d'Hotels de Barcelona (4ª sesión)
Gremi d'Hotels de Barcelona (4ª sesión)Tirso Maldonado
 
Tecnologias de Informacion
Tecnologias de InformacionTecnologias de Informacion
Tecnologias de InformacionYuri Serbolov
 
Informe final tsusoftware
Informe final tsusoftwareInforme final tsusoftware
Informe final tsusoftwareJesus Alvarado
 
Experiencia del Centro Internacional de Agricultura Tropical (CIAT) en la com...
Experiencia del Centro Internacional de Agricultura Tropical (CIAT) en la com...Experiencia del Centro Internacional de Agricultura Tropical (CIAT) en la com...
Experiencia del Centro Internacional de Agricultura Tropical (CIAT) en la com...CIAT
 

Similar a 2001 10-16-infopython (20)

Clase 4 tecno i- periodismo 2015
Clase 4  tecno i- periodismo 2015Clase 4  tecno i- periodismo 2015
Clase 4 tecno i- periodismo 2015
 
GSoC en la UNI
GSoC en la UNIGSoC en la UNI
GSoC en la UNI
 
11 2
11 211 2
11 2
 
Nuevas funcionalidades de Google Analytics - David Canos
Nuevas funcionalidades de Google Analytics - David CanosNuevas funcionalidades de Google Analytics - David Canos
Nuevas funcionalidades de Google Analytics - David Canos
 
Clase 4 periodismo de base de datos
Clase 4  periodismo de base de datosClase 4  periodismo de base de datos
Clase 4 periodismo de base de datos
 
Proyecto Integral 2015
Proyecto Integral 2015Proyecto Integral 2015
Proyecto Integral 2015
 
Guia 1
Guia 1Guia 1
Guia 1
 
Innovación tecnológica 2010
Innovación tecnológica 2010Innovación tecnológica 2010
Innovación tecnológica 2010
 
Creación de concepto App Apple Watch - Shortcut
Creación de concepto App Apple Watch - ShortcutCreación de concepto App Apple Watch - Shortcut
Creación de concepto App Apple Watch - Shortcut
 
Monografia
MonografiaMonografia
Monografia
 
TuToRiAl dE InFoRmaTiCa
TuToRiAl dE InFoRmaTiCa TuToRiAl dE InFoRmaTiCa
TuToRiAl dE InFoRmaTiCa
 
TuToRiAl dE InFoRmaTiCa
TuToRiAl dE InFoRmaTiCa TuToRiAl dE InFoRmaTiCa
TuToRiAl dE InFoRmaTiCa
 
Gremi d'Hotels de Barcelona (4ª sesión)
Gremi d'Hotels de Barcelona (4ª sesión)Gremi d'Hotels de Barcelona (4ª sesión)
Gremi d'Hotels de Barcelona (4ª sesión)
 
Herramientas de la web 2.0, blogs y red social
Herramientas de la web 2.0, blogs y red socialHerramientas de la web 2.0, blogs y red social
Herramientas de la web 2.0, blogs y red social
 
Tecnologias de Informacion
Tecnologias de InformacionTecnologias de Informacion
Tecnologias de Informacion
 
Herramientas de google
Herramientas de googleHerramientas de google
Herramientas de google
 
Tics equipo3 manualpowtoon_doc_g2_patzcuaro
Tics equipo3 manualpowtoon_doc_g2_patzcuaroTics equipo3 manualpowtoon_doc_g2_patzcuaro
Tics equipo3 manualpowtoon_doc_g2_patzcuaro
 
Informe final tsusoftware
Informe final tsusoftwareInforme final tsusoftware
Informe final tsusoftware
 
Experiencia del Centro Internacional de Agricultura Tropical (CIAT) en la com...
Experiencia del Centro Internacional de Agricultura Tropical (CIAT) en la com...Experiencia del Centro Internacional de Agricultura Tropical (CIAT) en la com...
Experiencia del Centro Internacional de Agricultura Tropical (CIAT) en la com...
 
Web 20
Web 20Web 20
Web 20
 

Más de Juan Cabral

Software Libre para Ingenieros en Sistemas
Software Libre para Ingenieros en SistemasSoftware Libre para Ingenieros en Sistemas
Software Libre para Ingenieros en SistemasJuan Cabral
 
Floss - Programa de open source
Floss - Programa de open sourceFloss - Programa de open source
Floss - Programa de open sourceJuan Cabral
 
Enano - Browser Games en Django
Enano - Browser Games en DjangoEnano - Browser Games en Django
Enano - Browser Games en DjangoJuan Cabral
 
LibFree or Die Hard
LibFree or Die HardLibFree or Die Hard
LibFree or Die HardJuan Cabral
 
Desarrollando Browser Games
Desarrollando Browser Games Desarrollando Browser Games
Desarrollando Browser Games Juan Cabral
 

Más de Juan Cabral (6)

Yatel dm redes
Yatel dm redesYatel dm redes
Yatel dm redes
 
Software Libre para Ingenieros en Sistemas
Software Libre para Ingenieros en SistemasSoftware Libre para Ingenieros en Sistemas
Software Libre para Ingenieros en Sistemas
 
Floss - Programa de open source
Floss - Programa de open sourceFloss - Programa de open source
Floss - Programa de open source
 
Enano - Browser Games en Django
Enano - Browser Games en DjangoEnano - Browser Games en Django
Enano - Browser Games en Django
 
LibFree or Die Hard
LibFree or Die HardLibFree or Die Hard
LibFree or Die Hard
 
Desarrollando Browser Games
Desarrollando Browser Games Desarrollando Browser Games
Desarrollando Browser Games
 

Último

Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Herramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxHerramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxRogerPrieto3
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 

Último (15)

Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Herramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxHerramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptx
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 

2001 10-16-infopython

  • 1. Infopython Midiendo Información de Mass-Media Con Python Juan B Cabral <jbc.develop@gmail.com> Pycon Argentina 2010 Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 2. ¿Qué es Infopython? • Infopython es una librería que se utiliza para la valoración de medios de información utilizando teorías formales. • Surge como muchos módulos sueltos en mi trabajo. Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 3. Un Poco de Teoría • Existen diferentes teorías para determinar la importancia de los medios. sobre la opinión publica. • La “Teoría de Información” de Shannon es una formalización matemática de una de la “Aguja hipodérmica”. • Existen teorías más complejas. Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 4. Teoría de La "Agenda-Setting" • La teoría de la agenda-setting postula que los medios de comunicación de masas tienen una gran influencia sobre el público al determinar qué historias poseen interés informativo y cuánto espacio e importancia se les da. (Wikipedia) • El punto central de esta teoría es asignar una prioridad para obtener mayor audiencia, mayor impacto y una determinada conciencia sobre la noticia. Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 5. ¿Qué es un Medio Para Nuestro Caso? "En el dominio es un "coso" al cual quiero medir el valor de su información" Entonces tiene que: • Ser homogéneo en su información. • Tener la sensación de "unidad". • Ser Medible. Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 6. Formalizando VALOR = F(AUDIENCIA, IMPACTO) • VALOR: Es la importancia del medio dada la teoría. • AUDIENCIA: A cuánta gente le llega la información del medio. • IMPACTO: Qué tanta importancia le da la audiencia al medio • NOTA: La conciencia NO es medible (o no se me ocurrió como formalizarlo) Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 7. Proponiendo F(AUDIENCIA, IMPACTO) VALOR = AUDIENCIA * IMPACTO • Funciona bien cuando uno de los valores es 0. • Refleja mejor la variación de los valores. Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 8. Consideraciones finales de diseño • Es mas fácil empezar por "nuevos medios" (web, twitter, etc). • Existe una amplia variedad de servicios públicos que miden "cosas" sobre nuevos medios. • Hay que identificar qué mide la audiencia y qué mide el impacto de estas "cosas". • El reto no es técnico. Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 9. Arquitectura de Infopython Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 10. Metodología de Trabajo 1. Configurar la sesión. 2. Crear los medios. 3. Crear "sacadatos". (Opcional) 4. Crear los interpoladores. (Opcional) 5. Crear la/s agenda/s. 6. Evaluar los nodos. Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 11. session API from infopython import session # Listado de todas las llaves OBLIGATORIAS session.NEEDED_KEYS # crea una nueva session con las llaves v0, v1, ... session.set(v0=1, v1=2...) # retorna el valor de una llave session.get("v0") # borra la session session.clear() Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 12. IS Webpage • Representa una página web (PLOP!). • No importa si es web, un perfil de twitter o un blog. • Audiencia: • Compete (http://www.compete.com/). • Alexa (http://www.alexa.com/). • Impacto: • Page Rank (http://es.wikipedia.org/wiki/PageRank). Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 13. WebPage API from infopython.isources import webpages google = webpages.WebPage("google.com") print "ID> " + google.id print "URL> " + google.url print "HTML>n" + google.html print "Compete>" pprint(google.get_info("compete")) Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 14. IS TwitterUser • Representa un usuario de twitter (PLOP²) • Audiencia: • Followers. • Kout (http://klout.com/). • Impacto: • RT. • Klout (http://klout.com/). Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 15. TwitterUser API from infopython.isources import twitteruser yo = twitteruser.TwitterUser("leliel12") print "ID> " + yo.id print "Username> " + yo.username print "Tweepy>" pprint(yo.get_info("tweepy")) Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 16. Agenda API from infopython import agenda from infopython.util import interpolator from infopython.isources import twitteruser google = webpages.WebPage("google.com") yahoo = webpages.WebPage("yahoo.com") aud = lambda w: w.get_info("compete")["metrics"]["uv_count"] imp = lambda w: w.get_info("pagerank")["pagerank"] itp = interpolator.PieceWisePolynomial([0,0,1,1,2,45,64], [1,3,1,1,2,4,64]) ag = agenda.AgendaSetting(itype=webpages.WebPage, inf_sources=[google, yahoo], audience_valuator=aud, impact_valuator=imp, audience_interpolator=itp, impact_interpolator=itp) Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 17. Agenda API 2 ag.value_of(google) ag.impact_of(google) ag.audience_of(google) ag.wrap(google) ag.count(google) ag.remove(google) ag.append(google) ag.for_type ag.audience_valuator ag.impact_valuator ag.audience_interpolator ag.impact_interpolator Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 18. Comparando 2 Agendas for i in agenda.rank_isources(ag1, ag2): print i Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 19. Test 1. Correr $ python setup.py test 2. Configurar test.cfg con las llaves de las apis correspondientes. 3. Again $ python setup.py test Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 20. Futuro • linkedin. • Integrar más tipos de massmedia (imdb, amazon...). • y... ¿desde el punto de vista de la audiencia? • ¿Web semántica? • nltk. Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>
  • 21. ¿Preguntas? • Proyecto: • http://bitbucket.org/leliel12/infopython/ • Contacto: • Juan B Cabral <jbc.develop@gmail.com> / @leliel12 Infopython - Pycon Argentina 2010 - Juan B Cabral <jbc.develop@gmail.com>