Esta presentación habla de la Internet oculta o invisible esa donde pocas personas pueden llegar. Esta parte de la Internet esta oculta ya que su contenido es clasificado y no apto para todo publico.
2. También conocida como internet oculta.
Es aquella parte de la red que contiene material, información y páginas web
que no están indexadas en ninguno de los buscadores existentes como
pueden ser Bing, google, yahoo, etc.
3. La Deep Web es una región prohibida de internet, y la tecnología relacionada
con ella por lo general no es conspirativa, peligrosa o ilegal. En ella se alberga
todo tipo de recurso que es difícil de acceder mediante métodos comunes
como la búsqueda.
4. La existencia de la internet profunda se debe a que existen paginas en las
cuales no cualquier persona puede acceder ya que están ocultas y para entrar
en ellas requieren contraseñas o códigos especiales para acceder.
5. Es un conjunto de sitios web y bases de datos que buscadores comunes no
pueden encontrar ya que no están indexadas. El contenido que se puede
hallar dentro de la internet profunda es muy amplio.
El internet se ve dividido en dos ramas:
1. La internet profunda
2. La superficial o visible.
6. -La superficial se compone de páginas indexadas en servidores DNS con una
alfabetización y codificación de página perfectamente entendible por los
motores de búsqueda como ser google, yahoo,bing,etc.
-La profunda está compuesta de páginas cuyos dominios están registrados
con extensiones onion y los nombres de los dominios están codificados en
una trama HASH. Estas páginas se sirven de forma ad hoc, y no necesitan
registrarse, basta con que tu ordenador tenga funcionando un servicio onion,
que hará las veces de un servicio dns, pero especial para las páginas del
internet profundo.
7. 1. Web contextual: páginas cuyo contenido varía dependiendo del contexto
(por ejemplo, la dirección IP del cliente, de las visitas anteriores, etc.).
2. Contenido dinámico: páginas dinámicas obtenidas como respuesta a
parámetros, por ejemplo, datos enviados a través de un formulario.
3. Contenido de acceso restringido: páginas protegidas con contraseña,
contenido protegido por un Captcha, etc.
8. 4. Contenido No HTML: contenido textual en archivos multimedia, otras
extensiones como exe, rar, zip, etc.
5. Software: Contenido oculto intencionadamente, que requiere un programa
o protocolo específico para poder acceder (ejemplos: Tor, I2P, Freenet).
6. Páginas no enlazadas: páginas de cuya existencia no tienen referencia los
buscadores; por ejemplo, páginas que no tienen enlaces desde otras páginas.
9. 1. Muchos usuarios asumen que la única forma de acceder a la web es
consultando un buscador.
2. Alguna información puede ser encontrada más fácilmente que otra, pero
esto no quiere decir que esté invisible.
3. La web contiene información de diversos tipos que es almacenada y
recuperada en diferentes formas.
4. El contenido indexado por los buscadores de la web es almacenado
también en bases de datos y disponible solamente a través de las
peticiones o consultas del usuario, por tanto no es correcto decir que la
información almacenada en bases de datos es invisible.
10. 1. Las arañas (web crawlers): Se utiliza el término «araña web» o robots
(por software, comúnmente llamados "bots") inteligentes que van
haciendo búsquedas por enlaces de hipertexto de página en página,
registrando la información ahí disponible.
11. 2. Tor(red de anonimato): Es un proyecto diseñado e implementado por la
marina de los Estados Unidos lanzado el 20 de septiembre de 2002. Tor le
permite a los usuarios navegar por la Web de forma anónima, Tor puede
acceder a unos 6500 sitios web ocultos.
12. 3. Criptomoneda: Es posible encontrar sitios web que realicen transacciones
ilegales (como drogas, armas, o incluso asesinos a sueldo). Es una práctica
común utilizar monedas digitales como el Bitcoin12 que se intercambia a
través de billeteras digitales entre el usuario y el vendedor, lo que hace que
sea prácticamente imposible de rastrear.
13. Cuando se ejecuta el software de Tor, para acceder a la internet profunda, los
datos de la computadora se cifran en capas. El software envía los datos a
través de una red de enlaces a otros equipos y lo va retransmitiendo quitando
una capa antes de retransmitirlo de nuevo, esta trayectoria cambia con
frecuencia.
14. 1. Contenido de acceso limitado
2. Contenido dinámico
3. Contenido no enlazado
4. Contenido programado
5. Sin contenido HTML
6. Web privada
7. Web contextual
15. • En 2010 se estimó que la información que se encuentra en la internet
profunda es de 7500 terabytes, lo que equivale a aproximadamente 550
billones de documentos individuales. El contenido de la internet profunda
es de 400 a 550 veces mayor de lo que se puede encontrar en la internet
superficial.
• En comparación, se estima que la internet superficial contiene solo 19
terabytes de contenido y un billón de documentos individuales.
16. • También en 2010 se estimó que existían más de 200 000 sitios en la
internet profunda.
• Se estima que alrededor del 95 % del internet es internet profunda, ya que
la información que alberga no siempre está disponible para su uso.
• Por ello se han desarrollado herramientas como buscadores
especializados para acceder a ella.