El documento define e identifica tres tipos de Internet: Internet global, Internet invisible e Internet oscuro. Explica que Internet invisible se refiere a recursos en la web que solo son accesibles de forma indirecta o restringida y que los motores de búsqueda no pueden indexar. Identifica varios tipos de contenido que componen la Internet invisible como bases de datos, documentos en formatos como PDF y páginas web excluidas de la indexación. Finalmente, discute algunos ejemplos de información que se puede encontrar en la "web profunda" como directorios, leyes e información
2. Se denomina 'Internet
invisible' al conjunto de
recursos Web a los que se
consigue acceder de manera
indirecta y habitualmente con
alguna restricción, cuyo
contenido permanece vedado
a la indización de los robots
de búsqueda de los
buscadores.
I.-. DEFINICION:
3. A) Internet global: Red de información libre
y gratuita que es accesible mediante la
interconexión de ordenadores.
B) Internet invisible: Información que está
disponible en Internet pero que únicamente
es accesible a través de páginas generadas
dinámicamente tras realizar una consulta en
una base de datos.
C) Internet oscuro: Los servidores o host que
son totalmente inaccesibles desde nuestro
ordenador. La causa principal se debe a
zonas restringidas con fines de seguridad
nacional y militar.
II.- TIPOS DE INTERNET:
4. A) Bases de datos: los buscadores sólo
proporcionan acceso a la página de inicio
porque las restantes son dinámicas.
B) Documentos en formato pdf, Word, etc.:
los motores de búsquedas fueron creados sólo
para localizar e indizar páginas html, aunque
actualmente Google indiza documentos en
formato pdf, doc, xml.
C) Páginas web que no son indizadas por los
motores de búsqueda: porque se excluyen
ellas mismas a través de un protocolo.
III.- TIPOS DE INFORMACIÒN:
5. A) WEB OPACA: Se compone de archivos
que podrían estar incluidos en los índices de
los motores de búsqueda, pero no lo están
por alguna de estas razones: Extensión de la
indización: por economía, no todas las
páginas de un sitio son indizadas en los
buscadores. Frecuencia de la indización: los
motores de búsqueda no tienen la capacidad
de indizar todas las páginas existentes.
B) WEB PRIVADA: Consiste en las páginas
Web que podrían estar indizadas en los
motores de búsqueda pero son excluidas
deliberadamente.
IV.-CLASIFICACIÒN DE INTERNET
INVISIBLE:
6. C) WEB PROPIETARIA: Incluye aquellas
páginas en las que es necesario registrarse
para tener acceso al contenido, ya sea de
forma gratuita o pagada.
D) WEB REALMENTE INVISIBLE: Se
compone de páginas que no pueden ser
indizadas por limitaciones técnicas de los
buscadores, como las siguientes: Páginas
Web que incluyen formatos como PDF,
PostScript, Flash, Shockwave, programas
ejecutables y archivos comprimidos. Páginas
generadas dinámicamente, es decir, que se
generan a partir de datos que introduce el
usuario.
IV.-CLASIFICACIÒN DE INTERNET
INVISIBLE:
7. El web profundo es una realidad que no podemos
ignorar.
Lo más importante es tener presente que información
incluye, de manera que cuando buscamos algo de esto
deberemos plantearnos otra estrategia de acceso:
• Guías y listas de teléfonos, e-mail, y todo tipo de
directorios, "People finders" es decir listas de
profesionales de todas la disciplinas.
• Leyes, decretos, en general información legal,
aunque alguna se puede encontrar en web estático
• Patentes, Diccionarios, aunque muchos glosarios se
encuentran disponibles, y no nos olvidemos que la
Wikipedia tiene un poco de todo, entre otros.
V).- ¿QUÉ HAY EN LA WEB
PROFUNDA?