Deep Searching Web (I)

                              Por Sandra Crucianelli
         Knight International Journalism Fellowship
                                      @spcrucianelli
                                scrucianelli@icfj.org
                                        www.icfj.org
             www.facebook.com/periodismodedatos
Recomendaciones
   Disponga de una casilla de correos de Gmail, creando una cuenta
    en Google
   Disponga de una casilla de correo de Yahoo, creando una cuenta
    en ese servidor.
   Estas casillas son independientes de su email habitual. Incluso
    puede crearlas con un nombre de fantasía, lo que le facilitará el
    acceso a ciertas bases de datos
   Capacidad para descargar programas en la PC
   Excel, WinZip, Chrome, PDF (Profesional 8.0)
   Navegar conectado a cable; evite Wifi para rastreo digital desde
    una cuenta institucional
   Configure correctamente su navegador
   Navegación privada:
    http://support.google.com/chrome/bin/answer.py?hl=es&answer=954
   Navegación segura:
    http://support.google.com/chrome/bin/answer.py?hl=es&answer=956
   Seguridad informática:
     https://security.ngoinabox.org/es
Archivo Virtual del Reportero
     Armar carpetas en Marcadores, Favoritos.
Archivo Virtual del Reportero
    Usar criterio por temas
    Adicionar enlaces favoritos en cada
     carpeta.
    Mantenga sus Marcadores
     ordenados y actualizados
    Guarde Páginas web + capturas de
     pantalla
    Marcadores Sociales
http://www.publish2.com/newsgroups/sandra-crucianelli-links


http://delicious.com/search?p=data+journalism
Tipología Websites
   Directorio: Lista categorizada de sitios Web.
    Esto tiene el inconveniente que información sobre
    un mismo tema pero de contenido diferente puede
    estar en distintas categorías. Ninguno reúne más
    de 1.000.000 de sitios.
    http://www.dondebuscar.net/
   Metabuscadores: Sistemas de recuperación
    de sitios a partir de búsquedas en paralelo.
    www.metacrawler.com rastrea un mismo
    tema en 14 buscadores distintos. EL MAS
    PODEROSO www.ixquick.com/esp/
   Motores de Búsqueda: La búsqueda responde
    a la teoría de conjuntos y usa operadores
    boleanos. El mejor motor sigue siendo
    www.google.com.ar

Busqueda Avanzada
   http://www.google.com.ar/advanced_sea
 Uso de filtros y restricciones
 Búsqueda por defecto
 Búsqueda reversa


   Ejercicios
Información del Pasado

   www.archive.org

   http://www.worldlii.org/databases.html

   http://www.gwu.edu/~nsarchiv/
Documentación Web
Para todo documento hallado en la Web, sea cual
  fuera su naturaleza, el documento debe cumplir
  con 4 principios básicos:

   Principio verificativo o comprobatorio

   Principio explicativo (relacionado positiva o negativamente
    con la hipótesis)

   Principio editorial o de crédito

   Principio de perdurabilidad
Herramientas de Búsqueda
   Alertas
   Google News
   Fotos + Cooliris http://www.cooliris.com/
   YouTube: uso de filtros + Videos Vía
    Google
   Blogs
   Libros
   Bing
   Académico + http://www.scirus.com/
http://bdu.siu.edu.ar/index.htm
Servicios de Google Poco Conocidos

    Data Explorer
http://www.google.com/publicdata/directory?hl=es
    Google Móviles
http://www.google.com/mobile/?tab=fD
    Patentes
https://www.google.com/?tbm=pts
    Opiniones del público
http://www.google.com/moderator/
    Google Code
http://code.google.com/intl/es/
    Google Grupos
https://groups.google.com/grphp?hl=es&pli=1
    Google Financiero
http://investor.google.com/earnings.html
    Google TV
http://www.google.com/tv/
    Google Voice
http://www.google.com/chat/voice/
    Centro de Crisis
http://www.google.org/crisisresponse/resources.html
Directorios de Google
  Directorio de Blogs
https://www.google.com.ar/press/blog-directory.html
  Directorio de Google+
https://www.google.com.ar/press/google-directory.html
  Directorio de Twitter
https://www.google.com.ar/press/twitter-directory.html
  Directorio de Facebook
https://www.google.com.ar/press/facebook-directory.html
  Directorio de Youtube
https://www.google.com.ar/press/youtube-directory.html
Conocer cómo funciona el Estado

 Necesidad de diagnóstico propio,
  conforme a intereses temáticos para
  cada país
 Extensión .gov.ar OR gob.ar
 http://www.argentina.gob.ar/
   http://www.argentina.gob.ar/directorio/
¿Qué podemos encontrar en fase de
  rastreo?
 Repositorios:
  http://repositorio.educacion.gov.ar/dspace/handle/123
 Entes de Control: http://www.enre.gov.ar/

¿Nivel de profundidad?
Otros buscadores
   Buscadores por formatos
http://www.pdfgeni.com/index.php
http://docjax.com/home/index.shtml
   Busque en paralelo:
http://www.locoindex.com/
   Buscadores visuales:
http://www.quintura.com/
http://www.search-cube.com
http://redz.com/home
http://www.liveplasma.com/
   Buscadores semánticos
http://www.wolframalpha.com/
http://www.blinkx.com/
http://www.meaningtool.com/
http://omgili.com/
Internet Invisible

   http://www.comunicacioninvisible.net/wai/
   http://www.hipertexto.info/documentos/web_invisib
    .htm
   http://infomine.ucr.edu/
   http://vlib.org/
   http://www.ipl.org/
   http://www.ojose.com/
   http://internetinvisibleyprofunda.webs.com/enlaces
    .htm
Sandra Crucianelli
        www.icfj.org
     @spcrucianelli
scrucianelli@icfj.org

Deep Web searching

  • 1.
    Deep Searching Web(I) Por Sandra Crucianelli Knight International Journalism Fellowship @spcrucianelli scrucianelli@icfj.org www.icfj.org www.facebook.com/periodismodedatos
  • 2.
    Recomendaciones  Disponga de una casilla de correos de Gmail, creando una cuenta en Google  Disponga de una casilla de correo de Yahoo, creando una cuenta en ese servidor.  Estas casillas son independientes de su email habitual. Incluso puede crearlas con un nombre de fantasía, lo que le facilitará el acceso a ciertas bases de datos  Capacidad para descargar programas en la PC  Excel, WinZip, Chrome, PDF (Profesional 8.0)  Navegar conectado a cable; evite Wifi para rastreo digital desde una cuenta institucional  Configure correctamente su navegador  Navegación privada: http://support.google.com/chrome/bin/answer.py?hl=es&answer=954  Navegación segura: http://support.google.com/chrome/bin/answer.py?hl=es&answer=956  Seguridad informática: https://security.ngoinabox.org/es
  • 3.
    Archivo Virtual delReportero Armar carpetas en Marcadores, Favoritos.
  • 4.
    Archivo Virtual delReportero  Usar criterio por temas  Adicionar enlaces favoritos en cada carpeta.  Mantenga sus Marcadores ordenados y actualizados  Guarde Páginas web + capturas de pantalla  Marcadores Sociales http://www.publish2.com/newsgroups/sandra-crucianelli-links http://delicious.com/search?p=data+journalism
  • 5.
    Tipología Websites  Directorio: Lista categorizada de sitios Web. Esto tiene el inconveniente que información sobre un mismo tema pero de contenido diferente puede estar en distintas categorías. Ninguno reúne más de 1.000.000 de sitios. http://www.dondebuscar.net/  Metabuscadores: Sistemas de recuperación de sitios a partir de búsquedas en paralelo. www.metacrawler.com rastrea un mismo tema en 14 buscadores distintos. EL MAS PODEROSO www.ixquick.com/esp/  Motores de Búsqueda: La búsqueda responde a la teoría de conjuntos y usa operadores boleanos. El mejor motor sigue siendo www.google.com.ar 
  • 6.
    Busqueda Avanzada  http://www.google.com.ar/advanced_sea  Uso de filtros y restricciones  Búsqueda por defecto  Búsqueda reversa  Ejercicios
  • 7.
    Información del Pasado  www.archive.org  http://www.worldlii.org/databases.html  http://www.gwu.edu/~nsarchiv/
  • 8.
    Documentación Web Para tododocumento hallado en la Web, sea cual fuera su naturaleza, el documento debe cumplir con 4 principios básicos:  Principio verificativo o comprobatorio  Principio explicativo (relacionado positiva o negativamente con la hipótesis)  Principio editorial o de crédito  Principio de perdurabilidad
  • 9.
    Herramientas de Búsqueda  Alertas  Google News  Fotos + Cooliris http://www.cooliris.com/  YouTube: uso de filtros + Videos Vía Google  Blogs  Libros  Bing  Académico + http://www.scirus.com/ http://bdu.siu.edu.ar/index.htm
  • 10.
    Servicios de GooglePoco Conocidos  Data Explorer http://www.google.com/publicdata/directory?hl=es  Google Móviles http://www.google.com/mobile/?tab=fD  Patentes https://www.google.com/?tbm=pts  Opiniones del público http://www.google.com/moderator/  Google Code http://code.google.com/intl/es/  Google Grupos https://groups.google.com/grphp?hl=es&pli=1  Google Financiero http://investor.google.com/earnings.html  Google TV http://www.google.com/tv/  Google Voice http://www.google.com/chat/voice/  Centro de Crisis http://www.google.org/crisisresponse/resources.html
  • 11.
    Directorios de Google  Directorio de Blogs https://www.google.com.ar/press/blog-directory.html  Directorio de Google+ https://www.google.com.ar/press/google-directory.html  Directorio de Twitter https://www.google.com.ar/press/twitter-directory.html  Directorio de Facebook https://www.google.com.ar/press/facebook-directory.html  Directorio de Youtube https://www.google.com.ar/press/youtube-directory.html
  • 12.
    Conocer cómo funcionael Estado  Necesidad de diagnóstico propio, conforme a intereses temáticos para cada país  Extensión .gov.ar OR gob.ar  http://www.argentina.gob.ar/  http://www.argentina.gob.ar/directorio/ ¿Qué podemos encontrar en fase de rastreo?  Repositorios: http://repositorio.educacion.gov.ar/dspace/handle/123  Entes de Control: http://www.enre.gov.ar/ ¿Nivel de profundidad?
  • 13.
    Otros buscadores  Buscadores por formatos http://www.pdfgeni.com/index.php http://docjax.com/home/index.shtml  Busque en paralelo: http://www.locoindex.com/  Buscadores visuales: http://www.quintura.com/ http://www.search-cube.com http://redz.com/home http://www.liveplasma.com/  Buscadores semánticos http://www.wolframalpha.com/ http://www.blinkx.com/ http://www.meaningtool.com/ http://omgili.com/
  • 14.
    Internet Invisible  http://www.comunicacioninvisible.net/wai/  http://www.hipertexto.info/documentos/web_invisib .htm  http://infomine.ucr.edu/  http://vlib.org/  http://www.ipl.org/  http://www.ojose.com/  http://internetinvisibleyprofunda.webs.com/enlaces .htm
  • 15.
    Sandra Crucianelli www.icfj.org @spcrucianelli scrucianelli@icfj.org