1. LECTURA DE SOBRE LA
INTERNET PROFUNDA O
INVISIBLE
ALUMNO: JESUS FERNANDO
QUIROGA
2. DEFINICIÓN
Se denomina 'Internet invisible' o Infranet al
conjunto de recursos accesibles únicamente a
través de algún tipo de pasarela o formulario Web
que por tanto, no pueden ser indicados de forma
estructural por los robots de los buscadores.
3. TIPOS DE INTERNET GLOBAL:
Red de información libre y gratuita
que es accesible mediante la
interconexión de ordenadores. La
forma de acceso se realiza mediante
programas navegadores, Chats,
mensajería o intercambio de
protocolos (FTP, P2P).
Red de información libre y gratuita
que es accesible mediante la
interconexión de ordenadores. La
forma de acceso se realiza mediante
programas navegadores, Chats,
mensajería o intercambio de
protocolos (FTP, P2P).
Es inaccesible mediante los procesos
habituales de recuperación de la
información que realizan
buscadores, directorios y agentes de
búsqueda. Los servidores o host que
son totalmente inaccesibles desde
nuestro ordenador.
La causa principal se debe a zonas
restringidas con fines de seguridad
nacional y militar, otros motivos son
la configuración incorrecta de
routers, servicios de cortafuegos y
protección, servidores inactivos y
finalmente " secuestro & quot;
de servidores para utilización ilegal.
4. TIPOS DE INFORMACIÒN:
Bases de datos: los buscadores sólo
proporcionan acceso a la página de
inicio porque las restantes son
dinámicas. Documentos en formato
pdf, word: los motores de
búsquedas fueron creados sólo para
localizar e indizar páginas html,
aunque actualmente Google indiza
documentos en formato pdf, doc,
xml. Páginas web que no son
indizadas por los motores de
búsqueda: porque se excluyen ellas
mismas a través de un protocolo.
6. WEB OPACA
• Se compone de archivos que podrían estar incluidos en los índices de los motores de
búsqueda, pero no lo están por alguna de estas razones:
Extensión de la indización: por economía, no todas las páginas de un sitio son indizadas en los
buscadores.
Frecuencia de la indización: los motores de búsqueda no tienen la capacidad de indizar todas las
páginas existentes; diariamente se añaden, modifican o desaparecen muchas y la indización no se realiza
al mismo ritmo.
Número máximo de resultados visibles: aunque los motores de búsqueda arrojan a veces un gran
número de resultados de búsqueda, generalmente limitan el número de documentos que se muestran (entre
200 y 1000 documentos).
7. WEB PRIVADA
• Consiste en las páginas Web que podrían estar indizadas en los motores de
búsqueda pero son excluidas deliberadamente por alguna de estas causas:
Las páginas están
protegidas por
contraseñas
(passwords).
Contienen un archivo
“robots.txt” para evitar
ser indizadas.
Contienen un campo
“noindex” para evitar
que el buscador índice la
parte correspondiente al
cuerpo de la página.
8. WEB PROPIETARIA
• Incluye aquellas páginas en las que es necesario registrarse para tener acceso al
contenido, ya sea de forma gratuita o pagada. Se dice que al menos 95% de la Web
profunda contiene información de acceso público y gratuito (Turner, 2003)
9. WEB REALMENTE INVISIBLE
Se compone de páginas que no pueden ser
indizadas por limitaciones técnicas de los
buscadores, como las siguientes:
• Páginas Web que incluyen formatos como
PDF, PostScript, Flash, Shockwave, programas
ejecutables y archivos comprimidos.
• Páginas generadas dinámicamente, es decir, que
se generan a partir de datos que introduce el
usuario. Información almacenada en bases de
datos relacionales, que no puede ser extraída a
menos que se realice una petición específica.
Otra dificultad consiste en la variable
estructura y diseño de las bases de datos, así
como en los diferentes procedimientos de
búsqueda.
10. CLASIFICACIÒN DE LA WEB
INVISIBLEAsí pues, la Web invisible está constituida por toda esa:
Bases de datos bibliográficas: incluidos los catálogos de
bibliotecas, las bases de datos de referencias
bibliográficas, gratuitas o de pago, etc.
Bases de datos alfanuméricas y a texto completo: que
incluyen en esta categoría las obras de referencia,
tipo enciclopedia o diccionarios.
Revistas electrónicas y archivos de documentos
11. SITIOS DE INTERNET INVISIBLE
Motores de Búsqueda Buscadores: Especializados- Regionales-Generales. Ejemplo:
Google Youtube Altavista Web crawler
METABUSCADORES
Un metabuscador es una clase de buscador que carece de base de datos propia y, en su
lugar, usa las de otros buscadores y muestra una combinación de las mejores páginas que
ha devuelto cada buscador. EJEMPLO: IXQUICK MAMMA VIVISIMO GLUSTY
DIRECTORIO
Es una agrupación de archivos de datos, atendiendo a su contenido, a su propósito o a
cualquier criterio que decida el usuario. Técnicamente el directorio almacena información
acerca de los archivos que contiene: como los atributos de los archivos o dónde se
encuentran físicamente en el dispositivo de almacenamiento. EJEMPLO: EXIT
YAHOO.