Este documento ofrece una introducción al uso de Internet para periodistas, destacando la importancia de evaluar críticamente la información encontrada en línea. Explica cómo usar herramientas como buscadores, motores de búsqueda avanzada y operadores lógicos para realizar búsquedas más efectivas. También cubre la "Internet profunda" y recursos para acceder a información no indexada fácilmente.
1. 1
CLASE SEMANA 1
INTRODUCCIÓN AL USO DE LA WEB PARA PERIODISTAS
Por Sandra Crucianelli
Copyright 2008
Que un dato o documento aparezca en Internet no implica que el mismo sea fidedigno.
El problema en este campo es que no hay reglas o normas establecidas para quien es el
responsable de la información virtual.
Así como el reportero debe distinguir, muy especialmente en el campo del periodismo
de investigación, entre los distintos grados de confiabilidad de sus fuentes, este proceso
se agudiza aún más en Internet.
USO DE LA INTERNET COMO FUENTE DOCUMENTAL
Que un dato o documento aparezca en Internet no implica que el mismo sea fidedigno.
El problema en este campo es que no hay reglas o normas establecidas para quien es el
autor de la información virtual.
Así como el reportero debe distinguir, muy especialmente en el campo del periodismo
de investigación, entre los distintos grados de confiabilidad de sus fuentes, este proceso
se agudiza aún más en Internet.
Una guía de 7 pasos puede ser consultada en:
http://www.sin.itesm.mx/~biblio/tutor/tito/Uso_web_evaluacion.htm
Metas del reportero frente a la Web
• Conseguir la mejor calidad de información en el menor tiempo posible.
• Obtener documentos oficiales
• Recolectar datos, ponerlos en un contexto y darles un significado: esto es, en
contrar primicias
Condiciones Básicas para Búsquedas Eficientes:
1. Dominio de la tecnología, así como del software básico (programas informáticos
no solo de los navegadores, sino además de los distintos formatos como Word, Excel,
PPT, PDF, ZIP, etc.
2. Dominio del idioma inglés: hay muy buena información sobre países
latinoamericanos como tesis doctorales, ensayos, etc. que pueden ser fuente
documental importante, pero están en ese idioma
3. Dominio de los denominados “métodos de filtrado”, o estrategias que optimicen
2. 2
la búsqueda, en directorios, buscadores y meta buscadores: son fuentes virtuales
de uso frecuente. Un investigador debe conocer buenos sitios en la Web
merecedores de su confianza, sobre los temas que son de su interés.
4. Conocimiento sobre la valoración de un sitio Web: propiedad del dominio,
financiamiento de la página, etc.
5. Clasificación y orden en distintas carpetas temáticas de Favoritos.
6. Optimización del tiempo en las búsquedas. Esto se logra mediante el análisis y
uso del llamado “mapa de sitio”
Cómo guardar un documento obtenido en Internet
Hay varias formas, pero como regla general, se activa la opción de Archivo,
Guardar Como y luego, se despliegan las acciones en el cuadro de texto inferior que da
varias posibilidades.
No elija la opción “página completa”, ya que el sistema informático que use, sea cual
fuere, desagregará la información y no podrá visualizar un documento como un todo.
Por lo tanto las opciones más usadas son guardar el documento Web:
Como archivo único (multimedia activa)
Como HTML (solo texto y formato básico, pero no fotos ni gráficos)
El consejo, en este caso, es apelar al archivo único, ya que el documento conserva todas
las propiedades. También puede ser útil la opción HTLM.
Internet como vía de recuperación documental
Sepa distinguir qué tipo de herramienta de búsqueda utiliza cuando necesita apelar al
rastreo documental virtual:
a) Directorio: Es una lista categorizada de sitios Web por temas. Remite a la página
inicial del sitio. El ejemplo más conocido es www.yahoo.com. Los reporteros
profesionales no usamos directorios para investigaciones periodísticas, salvo raras
excepciones.
b) Buscador o Motor de Búsqueda: Remite a la página exacta dentro del sitio, la cual
contiene el o los parámetros introducidos en la ventana de búsqueda. El mejor ejemplo y
más usado a nivel mundial es www.google.com, que tiene su versión propia para cada
país. Utilice la versión del suyo.
c)Metabuscadores: Son motores de búsqueda avanzados, que permiten la recuperación
de sitios a partir de búsquedas en paralelo, cruzando la información proporcionada por
3. 3
buscadores por separado. El ejemplo más conocido es www.metacrawler.com, que
rastrea un mismo tema en varios buscadores distintos
Métodos de Filtrado mediante Operadores
Los periodistas de investigación usamos buscadores, metabuscadores y bases de datos
como vía de recuperación documental en la Web.
En todos los casos, estas búsquedas responden a la Teoría de Conjuntos y usan
operadores (los más comunes son los llamados “booleanos”), que combinan
determinados signos y palabras para búsquedas más eficientes.
Los denominados “Métodos de Filtrado” no son más que técnicas de búsqueda mediante
las cuales se usan operadores.
Los operadores lógicos u operadores booleanos surgieron a partir de la Teoría de Boole
o más conocida como Teoría de los Conjuntos, que toma ese nombre de su creador, John
Boole, un matemático del siglo XIX.
Sostiene que la combinación de conjuntos de diferentes maneras permite obtener
universos más acotados, por ejemplo, mediante el operador “intersección”.
En el uso de la Web, existen 3 operadores booleanos básicos: AND, OR y NOT.
Dos de ellos (AND y NOT) son operadores de restricción (permiten obtener un menor
número de resultados), mientras que OR es un operador de expansión (permite obtener
un mayor número de resultados)
Los operadores permiten enfocar la búsqueda vinculando términos de búsqueda y
definiendo la relación entre ellos.
Las sugerencias para el reportero investigador son:
Utilizar el operador AND (su traducción del inglés = y) para localizar registros que
contengan todos los términos de búsqueda especificados.
La misma función (y más usada de todas), cumple el operador SUMA (+), es decir el
signo +
El operador OR localizar registros que contengan cualquiera o todos los términos
especificados.
Al utilizar el operador NOT, lo que se logra es localizar registros que contengan el
primer término de búsqueda, pero no el segundo.
El operador comillas, devolverá las páginas que contengan la exacta frase que se
escribió.
4. 4
La combinación de comillas y el signo + (o el operador AND), es la búsqueda más
específica de las que pueden hacer en la ventana principal (después veremos que hay
otras mejores).
La denominada búsqueda combinatoria especial permite combinar dos frases,
relacionándolas con una suma o varias sumas.
El reportero puede intentar, mediante el uso de sinónimos o giros idiomáticos, variar sus
opciones de búsqueda para optimizar sus resultados, en especial para el caso de que la
búsqueda de una combinatoria especial.
Para este caso puede probar con la siguiente elección:
Una estrategia muy usada por periodistas es realizar un filtrado mediante fechas, más
específicamente años.
Por ejemplo: “Economía en Latinoamérica” + 2008
Un resultado diferente obtendrá si tipea:
“Economía en Latinoamérica” + “abril del 2008”
Otros ejemplos de combinatoria especial:
“corrupción en América Latina” + presidentes + 2008 + 2007
“corrupción en Colombia” + “corrupción en Venezuela”
“análisis presupuestario” + “auditoria social”
Funcionalidades de Google, relevantes para la investigación periodística
Existe dentro de este buscador una herramienta de búsqueda avanzada, ubicada a la
derecha de la ventana principal.
Ingrese a www.google.com y vea sus componentes
5. 5
Ubique “Búsqueda Avanzada” e ingrese
Cuando ingrese al sistema lo que verá es un cuadro conforme muestra la imagen:
6. 6
Para mejores resultados siga estos consejos de la instructora:
• Arriba, a la derecha, elija la opción para que el buscador le devuelva 100
resultados y nomenos; de ese modo ahorrará tiempo al no tener que pasar de página
en página.
• Decida el idioma en el que realizará la búsqueda; si no domina el inglés,
seleccione “Mostrar página escritas en”: español
• De todas las opciones que puede seleccionar, la más relevante es la búsqueda
por formato de archivo. Los documentos más relevantes no están en Word sino en
PDF o Excel.
Como regla general:
• LOS DOCUMENTOS DE TEXTO DE CALIDAD SE BUSCAN EN PDF
• LAS ESTADISTICAS ES MEJOR BUSCARLAS EN EXCEL
• LOS CONTENIDOS DE CONFERENCIAS y EXPOSICIONES DE
CONGRESOS ES MEJOR BUSCARLOS EN PPT, ES DECIR PowerPoint
Recién después que escogió estos parámetros de búsqueda, concéntrese en las múltiples
ventanas a las que podrá apelar, colocando las palabras o frases clave de su interés.
Opciones de Ventanas en Búsqueda Avanzada de Google:
La opción “con todas las palabras” representa al operador booleano AND, que es un
operador de restricción. Ingresar palabras en este campo permite hacer búsquedas en las
que estos dos términos están combinados.
La opción con la “frase exacta” permite buscar frases. Esto reemplaza el uso de
comillas.
La opción “con alguna de las palabras” representa al operador booleano OR, que es un
operador de expansión.
La opción “sin las palabras” representa al operador booleano NOT, es decir que todo lo
que ingresemos en este campo no aparecerá en los resultados de búsqueda.
7. 7
Vea cómo funciona esto en:
http://www.aulaclic.es/internet/t_4_5.htm
Buscar dentro de una página o un dominio
Es importantísimo encontrar algo dentro de un sitio, sin tener que perderse dentro de él.
La Búsqueda Avanzada permite buscar dentro de un Website de manera muy sencilla.
Puede buscar sólo en sitios tipo: .edu (educativos), .org (organizaciones de la sociedad
civil) y hasta definir el dominio de su país.
En esta ventana no ingrese las 3 w. Por ejemplo, si quiere buscar información dentro del
sitio www.census.gov lo que colocará en esa ventana es solamente census.gov
VEREMOS ESTE PUNTO EN AL FORO DE APRENDIZAJE DE ESTA SEMANA
Otros buscadores de uso en periodismo de investigación
www.alltheweb.com : Buscador puro y rápido. Ha desarrollado sus bases de datos para
la búsqueda en video, imágenes y audio/mp3.
www.vivisimo.com: en una barra de la izquierda agrupa los resultados por
subtema.
www.kostenloses.com Permite búsqueda regionalizada por países
www.search.com Realiza meta búsquedas seccionadas por tipos de información
www.dogpile.com
Es el mejor y puede rastrear hasta en 25 buscadores al mismo tiempo).
www.supercrawler.com
Busca al mismo tiempo en Altavista, Excite, Lycos y Yahoo. Hay recursos interesantes e
n el apartado de “sociedad” y busca páginas temáticas en otros idiomas, como español
El Google académico
En la barra superior de www.google.com podrá ver varios accesos activados
(de izquierda a derecha):
Web Imágenes Noticias Grupos Libros Gmail
Si hace clic en Más ▼ el menú se despliega de modo tal que puede acceder a
“Todavía más”.
Arriba, a la derecha, verá un link de acceso conocido como “EL ACADEMICO”, al que
puede acceder directamente mediante
www.scholar.google.com
8. 8
Es un buscador de documentos, como su nombre lo indica, académicos, de alta calidad
documental, en general tesis, tesinas, investigaciones realizadas en ámbitos
universitarios, etc.
LA INTERNET PROFUNDA
En ocasiones es indispensable extender nuestra búsqueda a través de la “Web Invisible”,
pues no toda la información que se encuentra publicada en la Web es posible consultarla
a través de los buscadores convencionales.
Al espacio de la Internet a la cual no pueden acceder los buscadores precisamente se le
conoce como “Internet Invisible” o su traducción al inglés “Deep Web”
Para que se entienda mejor este concepto podemos usar el modelo clásico: el contenido
de Internet se asemeja a un iceberg.
Hay una parte que asoma a la superficie y es la que encuentra Google. Pero la más
profunda no. Esa es la información contenida en especial, en Bases de Datos.
9. 9
Existe una Web profunda que escapa a los robots de búsqueda, en ella se encuentra la
información de numerosas bases de datos especializadas.
A pesar de que los buscadores cada vez son más hábiles a la hora de recuperar todo tipo
de documentos, los más interesantes para los investigadores, una gran parte de la Web
sigue siendo invisible a primera vista.
Por consiguiente la ‘Web Invisible’ o ‘Web Profunda’ está formada por todos los
documentos a los que no se puede acceder a través de directorios y los enlaces que
ofrecen los resultados de los buscadores convencionales.
Esa zona menos accesible de Internet está formada básicamente por:
• El contenido de las bases de datos, que almacenan información sólo recuperable
través de búsquedas dentro de las mismas.
• Todo lo que no es texto (archivos multimedia, gráficos, programas) o los
documentos creados con formatos distintos al lenguaje común en Internet (HTML).
10. 10
Los recursos de la Internet Invisible más usados son:
Internet Invisible de España: http://www.internetinvisible.com/ii/
Open Directory Project: http://www.dmoz.org/
Complete Planet: http://aip.completeplanet.com/aip engines/aboutcp.jsp
Infomine: http://www.infomine.com/
The Invisible Web Directory: http://www.invisible web.net/
Free Pint: http://www.freepint.com/gary/direct.htm
The Dark Hiding Places: http://www.robertlackie.com/invisible/index.html
Y finalmente, los blogs
http://deepwebresearch.blogspot.com/
http://invisibleweblog.blogspot.com/
¿Nos introducimos en la Web 2.0?
Lea sobre esto en:
http://www.aulaclic.es/internet/t_12_1.htm