2. Se le conoce informalmente como Internet
profunda o Internet invisible a todo el
contenido de Internet que no forma parte del
Internet superficial, es decir, de las páginas
indexadas por las redes de los motores de
búsqueda de la red. Esto se debe a las
limitaciones que tienen las redes para
acceder a todos los sitios web por distintos
motivos.
3. ORIGEN
• imposibilidad de los motores de búsqueda (Google,
Yahoo, Bing, etc.)
• encontrar o indexar gran parte de la información
existente en Internet.
• Páginas y sitios web protegidos con contraseñas o
códigos establecidos.
• Páginas que el buscador decidió no indexar
• Documentos en formatos no indexables.
• Enciclopedias, diccionarios, revistas en las que para
acceder a la información hay que interrogar a la base
de datos, como por ejemplo la base de datos de la
RAE.4
4. TAMAÑO
• La internet profunda es un conjunto de sitios web
y bases de datos que buscadores comunes no
pueden encontrar ya que no están indexadas.
• El contenido que puede ser hallado dentro de la
Internet profunda es muy amplio.
• Se estima que la Internet Profunda es 500 veces
mayor que la Internet Superficial, siendo el 95 %
de esta información públicamente accesible.
• El Internet superficial se compone de páginas
estáticas o fijas, mientras que Web profunda está
compuesta de páginas dinámicas.
5. DENOMINACION
• Son páginas de texto, archivos, o en ocasiones
información a la cual se puede acceder por medio de la
World Wide Web
• La Web profunda se refiere a la colección de sitios o
bases de datos que un buscador común, como Google,
no puede o quiere indexar
• El primer uso del término específico de web profunda,
ahora generalmente aceptada, ocurrió en el estudio de
Bergman de 2001 mencionado anteriormente.
• Muchos usuarios asumen que la única forma de
acceder a la web es consultando un buscador.
6. RASTREANDO LA INTERNET
PROFUNDA
• Los motores de búsqueda comerciales han comenzado
a explorar métodos alternativos para rastrear la Web
profunda.
• Este sistema se realiza utilizando tres algoritmos
claves:
• La selección de valores de entrada, para que las
entradas de búsqueda de texto acepten palabras clave.
• La identificación de los insumos que aceptan sólo
valores específicos (por ejemplo, fecha).
• La selección de un pequeño número de combinaciones
de entrada que generan URLs adecuadas para su
inclusión en el índice de búsqueda Web.
7. METODO DE PROFUNDIZACION
• Las arañas
• Las arañas no pueden tener acceso a páginas
protegidas con contraseñas,
• Las “arañas” son incapaces de mostrar páginas
que no estén creadas en lenguaje HTML, ni
tampoco puede leer enlaces que incluyen un
signo de interrogación.
• Existen diferente técnicas de búsqueda para
extraer contenido de la internet profunda como
librerías de bases de datos o simplemente
conocer el URL al que quieres acceder y escribirlo
8. METODOS DE PROFUNDIZACION
• Logo de tor:
• The Onion Router (abreviado como TOR) es un
proyecto diseñado e implementado por la marina
de los Estados Unidos lanzado el 20 de
septiembre de 2002.
• fue patrocinado por la EFF (Electronic Frontier
Foundation, una organización en defensa de los
derechos digitales).
• le permite a los usuarios navegar por la Web de
forma anónima.
9. METODOS DE PROFUNDIZACION
• Logo de Bitcoin
• Mercados ilegales están alojados en servidores que son
exclusivos para usuarios de Tor. En estos sitios, se pueden
encontrar drogas, armas, o incluso asesinos a sueldo.
• Se utiliza la moneda digital llamada Bitcoin
• intercambia a través de billeteras digitales entre el usuario
y el vendedor
• Los recursos de la Internet Profunda pueden estar
clasificados en las siguientes categorías:
• Contenido de Acceso limitado, Contenido Dinámico,
Contenido No Vinculado, Contenido Programado, Sin
contenido HTML Web privada, los Web contextual.