Colegio de Traductores Públicos de la Ciudad de Buenos AiresColeccionables de Aplicaciones Informáticas                   ...
Motores de búsqueda     ¿Qué son?                                                  2. Los Directorios     Un motor de búsq...
3. Los sistemas mixtos                                        El avance de la tecnología es demasiado veloz, y hay        ...
mos un sitio web relativamente nuevo: si el sitio se sube, por    primera vez en la Red, al final de un rastreo, y las ara...
res" se ubicarán resultados que incluyan todos los términos,        Es decir los profesionales o traductores.   aunque est...
2. Ausencia                                                 De esta manera, una búsqueda de "educa" incluirá tam-       Es...
Es posible buscar palabras o frases dentro de una pági-na en especial, como la de un cliente. Por ejemplo, "trojanhorse si...
Google Desktop: http://desktop.google.com/                          De esta manera, una vez que encontramos el término, ta...
Próxima SlideShare
Cargando en…5
×

1277715195

500 visualizaciones

Publicado el

excellent

0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
500
En SlideShare
0
De insertados
0
Número de insertados
3
Acciones
Compartido
0
Descargas
19
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

1277715195

  1. 1. Colegio de Traductores Públicos de la Ciudad de Buenos AiresColeccionables de Aplicaciones Informáticas Edición 5 - Motores de búsqueda Coleccionables de Aplicaciones Informáticas Edición 1 - MS Office Edición 2 - Herramientas generales Edición 3 - Herramientas de traducción Edición 4 - Lenguaje de etiquetas (archivos *.*ml) Edición 5 - Motores de búsqueda Edición 6 - Archivos de diseño (DTP) Edición 7 - Estándares
  2. 2. Motores de búsqueda ¿Qué son? 2. Los Directorios Un motor de búsqueda es una pieza de software que per- Son motores buscadores totalmente distintos a las mite encontrar y visitar los sitios relacionados con una arañas. Son listas de recursos organizados por cate- palabra clave -o keyword- introducida al sistema por el gorías temáticas que se estructuran jerárquicamente mismo usuario. También se los denomina buscadores. en un árbol de materias que permite visualizar los con- tenidos desde los más generales, en las ramas supe- Básicamente, están compuestos por bases de datos riores, a los más específicos, en las ramas inferiores. gigantescas que contienen información sobre el conte- Más que buscar información sobre contenidos de la nido de los sitios que integran la Web. página, los resultados serán referencias a los conteni- dos y a la temática de la Web. Es decir, si buscamos "traducción", aparecerán los sitios que de una forma u otra estén relacionados con la temática de la traducción. ¿Qué tipos de motores hay? Su tecnología es muy barata y sencilla. Pero el costo Según como trabajen encontraremos: de operación es relativamente alto, ya que dependen de la operación manual. 1. Buscadores propiamente dichos o spiders 2. Directorios Índices, Catálogos La clasificación y categorización requieren una inter- 3. Sistemas Mixtos (directorio y motor de búsqueda) vención humana y en muchos casos, debido a la hete- 4. Metabuscadores rogeneidad de los temas tratados, algunas páginas 5. Multibuscadores presentan problemas de categorización ya que los 6. Buscadores de portal índices suelen mantener su base de datos de forma manual. 1. Buscadores propiamente dichos o spiders La mayoría de los grandes buscadores internacionales que todos usamos y conocemos entran dentro de esta denominación. Requieren muchos recursos para su funcionamiento. Las arañas recorren páginas y recopi- lan información sobre su contenido, y las presentan cla- sificadas por orden de relevancia. Por ejemplo, si bus- camos una palabra, [traducción], los resultados de la búsqueda nos mostrarán las páginas que contengan esta palabra en alguna parte del texto. En algunos casos registran todas las páginas del sitio, y en otros, sólo algunas. Además, las arañas van reco- pilando las actualizaciones, cuya periodicidad depen- de del motor en cuestión. Por este motivo, puede su- ceder que algunos sitios no aparezcan actualizados. El orden de relevancia, es decir, el orden en que se muestran los resultados de la consulta, está determi- nado por diversos factores que dependen de cada buscador. Pueden existir distintos parámetros, pero existen muchísimas estrategias, que las distintas em- presas elaboran para lograr los primeros puestos. Ejemplos de buscadores "spiders" Google, Altavista, Lycos2
  3. 3. 3. Los sistemas mixtos El avance de la tecnología es demasiado veloz, y hay muchas empresas dedicadas al desarrollo de motores deBuscador - Directorio búsqueda. Por este motivo, periódicamente nos sorpren- den con nuevos programas, y nuevas categorías, cuyoSon una mezcla entre buscadores y directorio. Además único fin es encontrar más fácilmente la información quede tener características de buscadores, presentan las pá- buscamos, o en los casos de las empresas de marketing,ginas registradas clasificadas en catálogos según su con- mostrar mejor los productos y buscar permanentementetenido: Informática, cultura, sociedad, que a su vez se di- potenciales clientes.viden en subsecciones. Hoy en día los grandes buscado-res, van en esa dirección.Ejemplos: Excite, Voila, InfoseekEn la actualidad, todos los motores tienden hacia estossistemas mixtos ¿Cómo trabajan? Los buscadores automáticos están compuestos por tres partes:4. Metabuscadores Los robots que se encargan de recorrer la RedEn realidad, los metabuscadores hacen sus búsquedas escrutándolaen auténticos buscadores, analizan los resultados de la La base de datos que construyen estos robotspágina y presentan sus propios resultados. El motor de búsqueda que facilita la consulta a laLos metabuscadores permiten buscar en varios buscado- baseres al mismo tiempo. No almacenan las descripciones depáginas en sus bases de datos, sino que contienen los Los robots son programas que buscan o rastreanregistros de los motores de búsqueda y la información continuamente todos los servidores de la WWW, ensobre ellos, adecuando su expresión a los diferentes mo- Gopher (uno de los sistemas de Internet para recupe-tores para remitir la consulta. Cuando reciben la respues- rar información que precedió a la World Wide Web), yta, envían al usuario el resultado que fue previamente FTP, que alimentan una base de datos. Los robots ac-sometido a un filtrado para eliminar y depurar los enlaces tualizan estas bases y añaden nuevas páginas o refe-repetidos y ordenados. Los más repetidos ocuparán los rencias cuando ha cambiado o bien, cuando ya noprimeros puestos ya que el metabuscador considerará existe. Google por ejemplo, guarda la página inicial yque son los más relevantes por estar dados de alta en aunque la página ya no exista en la opción "caché",mayor número de buscadores. se puede ver la información original.Copernic (www.copernic.com), sigue siendo un metabus- Cuando abrimos la página de un buscador, encontra-cador interesante con muchas categorías de búsqueda y mos un formulario para definir nuestra búsqueda yversiones gratuitas y aranceladas. sus posibles opciones. Ingresamos la palabra o pala- bras clave que son las que describen los conceptos,Ejemplo: Search.com, www.copernic ideas o términos que buscamos. El motor nos devuel- ve los resultados en función de cómo hayamos defini- do nuestra búsqueda.5. Multibuscadores Los buscadores temáticos o especializados estánPermiten lanzar varias búsquedas en motores seleccio- compuestos por:nados respetando el formato original de los buscadores. una base de datos creada a partir de los URL remi-Se limitan a colocar en una página web una lista con los tidosbuscadores más comunes y con una ventana de texto una estructura jerárquica que facilita la consultapara que el usuario envíe la cadena de búsqueda introdu-cida a cada uno de ellos. Muestra los resultados según el De todas maneras, se tiende más a utilizar un siste-buscador. ma mixto con buscadores automáticos edición 5- Motores de búsquedaEjemplo: Gooyaglehoo. http://www.gooyaglehoo.com/6. Buscadores de Portal Actualización de los datosBajo este título, englobamos los buscadores específicosde sitio. Aquellos que buscan información sólo en su por- Ingreso a la Redtal o sitio web. Podríamos considerarlos como un directo-rio. Trabajan sobre la base de expresiones regulares y La mayoría de los motores de búsqueda actualizan susconsultas SQL. Son muy útiles para los temas de admi- bases de datos con la información recopilada por sus ara-nistración. ñas, al menos una vez al mes. Esto es importante si tene- 3
  4. 4. mos un sitio web relativamente nuevo: si el sitio se sube, por primera vez en la Red, al final de un rastreo, y las arañas no Desde el escritorio lo encuentran, habrá que esperar hasta la actualización si- guiente para entrar a formar parte de la base de datos. Una del traductor vez incorporado a la base de datos, todavía llevará una o dos actualizaciones más antes de que se estabilice en los resulta- dos de las búsquedas. La mayoría de los motores de búsqueda, también tienen lo que Durante muchos años, en la era pre-internet, usábamos nues- se llama listados frescos. Éstas son actualizaciones rápidas tros "motores de búsqueda" mentales para buscar terminolo- y cortas que generalmente no pondrán al día un sitio entero, gía e investigar los escasos recursos disponibles. Hoy In- pero agregarán las páginas nuevas y aquellas que hayan ternet nos abre una puerta a un mundo donde sucede todo lo cambiado. contrario: estamos invadidos por una sobreabundancia de re- cursos y el desafío es, precisamente saber cómo encontrarlos. En un artículo publicado en el ITI bulletin (www.iti.org.uk) de julio de este año, Michael Benis comenta que la estrategia Otros programas esencial de toda búsqueda debería ser:Ask.com buscar seleccionar verificarEste motor de búsqueda está obteniendo buenos resultados, Por más compleja que sea la búsqueda o la situación, estey permite hacer búsquedas no sólo de webs, sino también de método es la base para asegurarnos de que la terminología yimágenes, noticias, blogs, enciclopedias, y más. la información que obtenemos sean correctas. En un entorno convencional, esta estrategia implicaría la búsqueda del tér-CodigoFuente.net mino en cuestión en diccionarios y enciclopedias bilingües yCodigoFuente.net es un espacio para la búsqueda y registro monolingües, corroborar definiciones, verificar los resultadosde Código Fuente, software libre, clases, librerías, funciones, de nuestras búsquedas en los recursos monolingües corres-Programas gratis y procedimientos de: ASP, ASP.NET, C++, pondientes, y verificarlo en los materiales de referencia. ClaroJava, Csharp, Delphi, Perl, PHP, Python, Cold fusion, que en la época digital, todos estos procesos, son mucho másJavaScript, XML y otros lenguajes de programación, comple- rápidos y ágiles.tamente en español. Una de las grandes ventajas de la Internet para los traducto-Dogpile res, ha sido el gran número de bases de datos terminológicasPortal mediante el cual se pueden realizar búsquedas en múl- que nos ponen a nuestro alcance las unidades de traduccióntiples buscadores a la vez. de los departamentos gubernamentales. Canadá y la Unión Europea encabezan esta lista. Son fuentes confiables y nosKrugle ofrecen diccionarios que constituyen recursos indispensablesDirectorio dedicado exclusivamente a programadores, contie- para el traductor. Salvo en el caso de Termium (que prevé unne motor de búsqueda para todo lo relacionado con lenguajes arancel anual) el resto es totalmente gratis. Por supuesto,de programación, código que puede reusarse, y mucho más. además de estos diccionarios oficiales existe otra enorme cantidad de diccionarios en Internet que profesionales, em-MSN presas, o simplemente individuos ponen a nuestra disposi-MSN, la red de Microsoft, es otro de los buscadores máspopulares. ción, y que pueden ayudarnos a resolver una búsqueda siem- pre y cuando verifiquemos lo que estamos buscando, y fun- damentalmente, con una fuente confiable.OhlohUna nueva clase de directorio de software, que combina con- ¿Cómo busco?tenido comunitario con un motor de búsqueda que indexa Cuando se introduce una frase o palabra, el motor busca-cambios en los repositorios de proyectos de software libre, rá en su base de datos y devolverá resultados en un ordenanalizando código y extrayendo reportes muy interesantes. que estará determinado por su propio algoritmo.También permite socializar con otra gente que tenga los mis-mos intereses de software, y también permite buscar informa- Para las búsquedas precisas, los motores tienen su propioción de cada programador. lenguaje de interrogación y suelen permitir acotar las bús- quedas utilizando interfaces sencillas de búsqueda que permiten la introducción de texto en alguna de estas variantes: Todas las palabras: permite recuperar los resultados que contengan todas las palabras que se introducen en la caja de interrogación. Por ejemplo, "colegio de traducto-4
  5. 5. res" se ubicarán resultados que incluyan todos los términos, Es decir los profesionales o traductores. aunque estén separados: colegio de traductores, aunque no Nos devolverá las páginas que contengan algún elemento necesariamente en ese orden exacto. de los dos o los dos (Algunos buscadores también permiten usar | en vez de OR). Alguna de las palabras: permite recuperar los resulta- dos que contienen alguna de las palabras. Por ejemplo, la Cuando no indicamos ningún operador entre las palabras, interrogación: "colegio de traductores" los resultados se pre- los buscadores lo interpretan como si hubiéramos colocado sentarán con colegio o traductores. OR. La frase exacta: es la más adecuada para búsqueda por Es muy útil para buscar varias formas de escritura simultá- nombres propios y expresiones que deben ser buscadas en neamente. el orden especificado. Para introducirla se suelen utilizar comillas. Por ejemplo, la consulta: "colegio de traductores”, Ejemplo: sólo mostrará resultados donde aparezca exactamente esa España OR Spain OR Espagne frase. La búsqueda booleana: se trata de un tipo de interroga- Operadores de proximidad ción que incluye alguno de los operadores lógicos. Para obtener resultados precisos, el operador de proximidad, nos permite especificar la relación entre elementos presentesLos buscadores también permiten acotar la búsqueda por una de nuestra búsqueda.serie de operadores lógicos, así encontramos: 1. Cerca (NEAR) Lógicos Es similar al Y lógico, pero además exige que entre ambas De proximidad palabras no haya más de 10 palabras. De existencia De exactitud Ejemplo: profesionales NEAR traductores Es decir que las palabras profesionales y traductores apa-Operadores lógicos rezcan relativamente juntas.Los operadores lógicos o booleanos facilitan este objetivo. Para Es ideal para buscar, por ejemplo, nombres y apellidos.los ejemplos siguientes usaremos dos conjuntos de elementos:los profesionales y los traductores. 2. Junto (ADJ) Es la intersección de los dos conjuntos de búsqueda que 1. Y lógico (AND) además están adyacentes. Se parece al Y lógico pero ade- más exige que entre ambas palabras no haya otra . En el resultado aparecerán únicamente los documentos que contentan estas dos palabras clave. Es un operador de re- Ejemplo: ducción. profesionales ADJ traductores Ejemplo: Es decir que las palabras profesionales y traductores apa- profesionales AND traductores rezcan juntas. (En algunos buscadores también se puede usar & en lugar de AND) Se puede usar comillas para obtener un resultado idénti- co "profesionales traductores" También se puede usar un guión entre las palabras que desea juntar profesionales-traductores. 2. NO lógico (NOT) Excluye los elementos de una de las dos palabras clave de búsqueda. Ejemplo: Operadores de existencia edición 5- Motores de búsqueda profesionales AND NOT traductores (En algunos buscadores también se puede utilizar ! en lugar 1. Presencia. de NOT.) Especifica palabras que deben aparecer en el resultado. Es útil cuando necesitamos que una determinada palabra clave, de tal forma que si no está presente en él, no se incluirá en 3. O lógico (OR) la lista de resultados. Indica al buscador que en los resultados de la búsqueda aparezca por lo menos una de las palabras clave. Es un Habitualmente se añade al inicio de la palabra clave el signo operador de ampliación. más (+), sin dejar espacio. Ejemplo: Ejemplo: profesionales OR traductores +olímpico baloncesto fútbol voleibol balonmano 5
  6. 6. 2. Ausencia De esta manera, una búsqueda de "educa" incluirá tam- Es útil cuando necesitamos que una determinada pala- bién en la respuesta "educador" y "educativo". bra clave no esté presente en el documento, de tal for- Esto es ideal si no se sabe cómo se escribe exactamen- ma que si está, no lo incluirá en la lista de resultado. te la palabra que se quiere buscar. A diferencia de estos Habitualmente se indica añadiendo el signo menos - al casos mencionados, el comodín de Google (*) permite inicio de la palabra clave, sin dejar espacio. encontrar palabras completas, no familias de palabras. Ejemplo: Es muy útil por ejemplo, para buscar la palabra que si- juventud –racismo gue, nombres de instituciones. etc.: colegio * traductores, mostrará colegio para traductores, de traductores, con Podemos obtenerlo también a través de estos dos traductores, etc. operadores lógicos: juventud AND NOT racismo 2. Truncar la palabra Para encontrar sólo aquellas referencias que tengan la Operadores de exactitud palabra exacta y no extensiones, se debe seleccionar la opción Complete words en Yahoo, y en Lycos usar el 1. Familia punto (.) al final de la palabra que se busca, para limi- Se trata de una especie de comodín, que permite realizar tarla. Por ejemplo "ciudad" encontrará referencias que la búsqueda también en documentos en los cuales contengan la palabra "ciudad" pero no así "ciudadano" las palabras clave aparecen como parte de otras pala- ni "ciudadanía". bras. Con la opción Substrings en Yahoo o el signo (*). Google Encontrar todos estos recursos es un desafío. En la mayoría de los casos, se resuelve fácilmente con el uso de alguno de los motores de búsqueda que mencionamos en la primera parte de este coleccionable. El más popular sigue siendo Google, con el que se pueden realizar búsquedas bastante complejas, entre otras: Para buscar la definición de una palabra (en cualquier idioma), se puede escribir "define:" seguido de la palabra clave de búsqueda. Por ejemplo, define:localization mostrará este resultado:6
  7. 7. Es posible buscar palabras o frases dentro de una pági-na en especial, como la de un cliente. Por ejemplo, "trojanhorse site:www.symantec.com" mostrará este resultado(aplicable a cualquier idioma): Para buscar palabras en un tipo de archivo en especial: supongamos que se quiere buscar la palabra "localization" en un archivo PDF, si escribimos "localization filetype:pdf" se obten- drá algo así: Para buscar palabras en un sitio y en la dirección del sitio,se puede utilizar "inurl:". Por ejemplo, si queremos buscarla palabra "enfiteusis" y, que además aparezca en un glo-sario, escribimos "enfiteusis inurl:glosario", y se obtendráeste resultado: Listados: http://labs.google.com/sets. Nos permite encontrar o completar listas de un conjunto de ele- mentos (por ejemplo: si necesitamos una lista de marcas de au- tomóviles, con incluir dos, Google completa el resto).Además de buscar en glosarios, también pueden buscar en edición 5- Motores de búsquedapáginas de clientes, empresas, etc. Para la conversión de unidades (millas a kilómetros, porejemplo), basta con escribir "x miles", "x yards", etc... El resulta-do va a ser algo así: 7
  8. 8. Google Desktop: http://desktop.google.com/ De esta manera, una vez que encontramos el término, tam- Desde este sitio, se baja el programa. Está diseñado con la bién encontraremos la traducción oficial del mismo término misma tecnología de Google, es una herramienta de bús- en la lengua meta. queda instantánea pero... en los archivos de nuestra propia computadora. Permite buscar en correos electrónicos de Outlook, Outlook Express y en archivos de Word, Excel, Algunos otros recursos CTPCBA - Colegio de Traductores Públicos de la Ciudad de Buenos Aires PowerPoint y texto; también realiza búsquedas paralelas en el disco duro de nuestra computadora y en Internet. Yahoo, también tiene una herramienta similar. Diccionarios en línea Answers.com: www.answers.com Es otra herramienta útil y a través de la cooperación con Termium - Base de datos trilingüe Google permite utilizar el buscador de Google y, al mismo www.termium.gc.ca tiempo, poder buscar palabras y hacer preguntas desde los IATE - Base de datos terminológica multilingüe sitios que estamos consultando. http://iate.europa.eu ITU - Diccionario multilingüe Termite de telecomuni- cacionesOtros usos de los motores www.itu.int/terminology/index.html Comisión de Aplicaciones Informáticas UNITERMde búsqueda Base de datos de las Naciones Unidas http://www.un.org/spanish/unterm/ Pero además, los motores de búsqueda son muy útiles no sólo para buscar términos, sino para verificar el uso, el esti- lo, las palabras que se utilizan con un determinado verbo, o Recursos de investigación en línea el adjetivo más común para un sustantivo, y el análisis de los Servidor Web del Parlamento Europeo resultados, podría permitirnos esbozar hasta un registro de www.europarl.europa.eu uso, y obtener información que no podemos conseguir en Biblioteca en línea de legislación de la Unión los diccionarios. Europea Si utilizamos motores de búsqueda con mucha frecuencia, http://eur-lex.europa.eu/en/index.htm una herramienta útil, es Practisearch, que permite consultar el motor de búsqueda favorito con sólo seleccionar la frase Sitios y programas de búsquedas útiles en cuestión [desde cualquier programa, por ejemplo, Word, presionando una tecla de acceso rápido y luego enter]. Babilón www.babylon.com Direct Search (Web invisible)La Web invisible. www.freepint.com/gary/direct.htm www.traductores.org.arIdeal para investigadores Google www.google.com La "Web visible" es lo que podemos "ver" con los motores de Medline Medscape search http://search.medscape.com búsqueda, que presentan el contenido del sitio como resul- tado de una búsqueda. Lo que no se incluye en la mayoría Metacrawler www.metracrawler.com de los casos, es el contenido de las bases de datos, por ejemplo. Si incluimos en los términos de búsqueda database Omega First www.omega-first.co.uk (o base de datos) o directory podremos ver recursos de in- vestigación útiles que los motores no pueden encontrar de otra forma, ya que las arañas de los motores de búsqueda Web Invisible no pueden catalogar el contenido que, por ende, queda rele- Internetinvisible.com (en español) gado a lo que denominamos "Web invisible". Al final de este http://www.internetinvisible.com/ coleccionable, se detalla una lista de sitios Web, que inclu- InvisibleWeb.com (en inglés) infocomisiones@traductores.org.ar yen sitios y programas utiles para buscar en la "Web invisi- http://www.invisibleweb.com ble", como Direct Search, u OAIster, y permite buscar en Invisible Web Directory (por temas) las bases de datos de universidades o viejos artículos que http://www.invisibleweb.net/ no han sido generados en formato electrónico, y fueron Complete Planet: The Deep Web Directory (contie- escaneados. ne unas 70.000 bases de datos de la Red profunda y otros recursos especializados)Las búsquedas avanzadas http://aip.completeplanet.com Direct Search (es una compilación de enlaces e in- Este tipo de búsquedas no sólo permiten encontrar termino- terfaces de búsqueda de recursos que contienen datos logía sino textos especializados que nos pueden confirmar el que no son fácilmente accesibles o "buscables" por los estilo, las elecciones tanto técnicas como estratégicas que buscadores generalistas) deberemos hacer y, al mismo tiempo, podemos investigar http://www.freepint.com/gary/direct.htm sobre el tema que estamos traduciendo. Por ejemplo tome- OAISTER mos la biblioteca EUR-Lex en línea de la legislación de la http://www.oaister.org Unión Europea. En este sitio se pueden buscar archivos html Otras Fuentes de la legislación de la Unión Europea en todos los idiomas Ricardo Baeza Yates. (www.dcc.uchile.cl/~rbaeza/inf/webfaces.gif) oficiales. Y cada uno de estos archivos incluye los enlaces a (www.hipertexto.info/documentos/tipos_buscador.htm#indices) las traducciones correspondientes en todos estos idiomas. ITI bulletin (www.iti.org.uk)

×