La presente exposición sobre "apuntes sobre la deep web" fue realizada como trabajo para la clase de "Introducción a la informática" de la Universidad de Caldas, del grupo 17 - Martes 10 AM, del año 2017-2
Institucion educativa la esperanza sede la magdalena
Apuntes sobre la deep web
1. APUNTES SOBRE LA DEEP WEB
Presentado por:
JUAN CAMILO LUNA ALARCÓN
Introducción a la informática (grupo 17)
Universidad de Caldas.
2. ¿QUÉ ES LA DEEP WEB?
Se podría llegar a pensar que Internet es Google y todo lo que se
accede a través de él, pero no, tal acceso es lo conocido como el
INTERNET SUPERFICIAL, es así como la DEEP WEB es el conjunto
de información que está bajo esa capa.
DEEP WEB entonces, es el término usado para describir al
conjunto de bases de datos y sitios web que no son indexados
por los motores de búsqueda por distintas razones, conocido por
su traducción en español como internet profunda, internet
invisible o internet.
3. ¿QUÉ ES LA DEEP WEB?
Según Wikipedia, la principal causa de la existencia de la internet profunda es la
imposibilidad de los motores de búsqueda (Google, Yahoo, Bing, etc.) de encontrar
o indexar gran parte de la información existente en Internet. Si los buscadores
tuvieran la capacidad para acceder a toda la información entonces la magnitud de
la internet profunda se reduciría casi en su totalidad.
No obstante, aunque los motores de búsqueda pudieran indexar la información de
la internet profunda esto no significaría que esta dejara de existir, ya que siempre
existirán las páginas privadas. Los motores de búsqueda no pueden acceder a la
información de estas páginas y sólo determinados usuarios, aquellos con
contraseñas o códigos especiales, pueden hacerlo.
4. ¿QUÉ ES LA DEEP WEB?
Antes de seguir, se debe aclarar que la internet profunda no es
una región prohibida o mística de internet, y la tecnología
relacionada con ella por lo general no es conspirativa, peligrosa o
ilegal. En ella se alberga todo tipo de recurso al que se es difícil
de acceder mediante métodos comunes como los motores de
búsqueda populares.
NOTA: El término Deep Web se atribuye al informático MIKE
BERGMAN por el opuesto a Internet superficial.
5. ¿QUÉ ES LA DEEP
WEB?
El internet que todos creemos conocer es
solo el 15 por ciento; el 85 por ciento
restante está debajo de la punta del
iceberg en lo que se denomina la Deep
Web.
Esta es la parte de internet que más gusta
a hackers, ciberdelincuentes y activistas
proderechos humanos que viven en
regímenes totalitarios (Tomado del artículo
que escribió Zulma Sierra de Barcelona
para El Tiempo en agosto del 2014).
6. ¿QUÉ ES LA DEEP
WEB?
La principal causa de su existencia, es
la imposibilidad o no deseo de los
motores de búsqueda de encontrar o
indexar el 100% de la información
existente Por cada millón de páginas
visibles hay otros 500 o 550 millones
ocultas.
El 90% es información pública y
gratuita La información es de 400 a
550 veces mayor que la internet
superficial.
7. TAMAÑO DE LA DEEP WEB
Según Wikipedia, el internet se ve dividido en dos ramas, la internet profunda y la
superficial.
La internet superficial se compone de páginas indexadas en servidores DNS con
una alfabetización y codificación de página perfectamente entendible por los
motores de búsqueda, mientras que la internet profunda está compuesta de
páginas cuyos dominios están registrados con extensiones .onion y los nombres de
los dominios están codificados en una trama HASH. Estas páginas se sirven de
forma ad hoc, y no necesitan registrarse, basta con que tu ordenador tenga
funcionando un servicio onion, que hará las veces de un servicio dns, pero especial
para las páginas del internet profundo. Mediante una red P2P, se replican las bases
de datos que contienen la resolución de nombres HASH.
8. TAMAÑO DE LA DEEP WEB
En 2010 se estimó que la información que se encuentra en la
internet profunda es de 7500 terabytes, lo que equivale a
aproximadamente 550 billones de documentos individuales,
También en 2010 se estimó que existían más de 200 000
sitios.
El contenido de la internet profunda es de 400 a 550 veces
mayor de lo que se puede encontrar en la internet superficial.
En comparación, se estima que la internet superficial contiene
solo 19 terabytes de contenido y un billón de documentos
individuales.
9. RAZONES DE LA DEEP WEB
Motivos por los que los motores de búsqueda no pueden o no quieren indexar algunas páginas:
• WEB CONTEXTUAL: páginas cuyo contenido varía dependiendo del contexto (por ejemplo, la
dirección IP del cliente, de las visitas anteriores, etc.).
• CONTENIDO DINÁMICO: páginas dinámicas obtenidas como respuesta a parámetros, por
ejemplo, datos enviados a través de un formulario.
• CONTENIDO DE ACCESO RESTRINGIDO: páginas protegidas con contraseña, contenido
protegido por un Captcha, etc.
• CONTENIDO NO HTML: contenido textual en archivos multimedia, otras extensiones como exe,
rar, zip, etc.
• SOFTWARE: Contenido oculto intencionadamente, que requiere un programa o protocolo
específico para poder acceder (ejemplos: Tor, I2P, Freenet)
• PÁGINAS NO ENLAZADAS: páginas de cuya existencia no tienen referencia los buscadores; por
ejemplo, páginas que no tienen enlaces desde otras páginas.
10. LO QUE PODEMOS ENCONTRAR EN LA DEEP WEB
En la Deep Web se encuentra
gran cantidad de información de
tipo multimedia, documentos,
sitios web privados, sitios con
restricciones de acceso por
seguridad, contenido malicioso e
incluso material que puede variar
dependiendo del tipo de acceso,
lo que se conoce como web
contextual.
11. EL “PELIGRO” DE NAVEGAR POR LA DEEP WEB
Como mucha de esta información no tiene un
control sobre quien la puede acceder o modificar
se presta para que abunde el contenido malicioso
que puede afectar la seguridad de nuestra
información. Pero en la medida que seamos
cuidadosos en donde ingresamos y lo que
descargamos teniendo una solución de seguridad
podemos estar más seguros. Además hay que
tener presente que por el tipo de información
ilegal que se encuentra en muchos de estos
repositorios, dependiendo de nuestra ubicación
geográfica su acceso puede ser un delito.
12. RED MÁS UTILIZADA
Para sumergirse en esta red de una manera un poco más segura, se usa el software
THE ONION ROUTER, más conocido como TOR.
Tor es una red de túneles virtuales, que protege las comunicaciones del usuario
haciendo que reboten dentro de una red enorme mantenida por voluntarios
alrededor del mundo.
TOR es un proyecto diseñado e implementado por la marina de los Estados Unidos
lanzado el 20 de septiembre de 2002. Posteriormente fue patrocinado por la EFF
(Electronic Frontier Foundation, una organización en defensa de los derechos
digitales). Al presente (2017), subsiste como TOR Project, una organización sin ánimo
de lucro galardonada en 2011 por la Free Software Foundation por permitir que
millones de personas en el mundo tengan libertad de acceso y expresión en
internet manteniendo su privacidad y anonimato.
13. RED MÁS UTILIZADA
Cuando se ejecuta el software de Tor, para acceder a la internet
profunda, los datos de la computadora se cifran en capas. El
software envía los datos a través de una red de enlaces a otros
equipos ―llamados en inglés «relays» (‘nodos’)― y lo va
retransmitiendo quitando una capa antes de retransmitirlo de
nuevo, esta trayectoria cambia con frecuencia. Tor cuenta con más
de 4000 retransmisiones y todos los datos cifrados pasan a través
de ―por lo menos― tres de estos relays. Una vez que la última
capa de cifrado es retirado por un nodo de salida, se conecta a la
página web que desea visitar.
El contenido que puede ser encontrado dentro de la internet
profunda es muy vasto, se encuentran por ejemplo, datos que se
generan en tiempo real, como pueden ser valores de Bolsa,
información del tiempo, horarios de trenes; bases de datos sobre
agencias de inteligencia, disidentes políticos y contenidos
criminales.
14. RECOMENDACIONES PRINCIPALES
Al ingresar:
No descargar absolutamente nada.
No durar demasiado tiempo en las paginas.
No comprar ni adquirir servicios de ningún tipo.
Evitar a toda costa las paginas de pornografía infantil y pedofilia.
Es recomendable no abrir imágenes y no abrir links.
Desactivar la cámara o taparla, ya que es posible que los Hackers tengan acceso
desde tu cámara y puedan verte.
15. RECURSOS DE LA INTERNET
PROFUNDA
Los recursos de la internet profunda pueden estar clasificados en las siguientes categorías:
• CONTENIDO DE ACCESO LIMITADO: los sitios que limitan el acceso a sus páginas de una
manera técnica (Por ejemplo, utilizando el estándar de exclusión de robots o captcha, que
prohíben los motores de búsqueda de la navegación por y la creación de copias en
caché.23
• CONTENIDO DINÁMICO: las páginas dinámicas que devuelven respuesta a una pregunta
presentada o acceder a través de un formulario, especialmente si se utilizan elementos de
entrada en el dominio abierto como campos de texto.
• CONTENIDO NO ENLAZADO: páginas que no están conectadas con otras páginas, que
pueden impedir que los programas de rastreo web tengan acceso al contenido. Este
material se conoce como páginas sin enlaces entrantes.
16. RECURSOS DE LA INTERNET
PROFUNDA
• CONTENIDO PROGRAMADO: páginas que solo son accesibles a través de
enlaces producidos por JavaScript, así como el contenido descargado de
manera dinámica a partir de los servidores web a través de soluciones de
Flash o Ajax.
• SIN CONTENIDO HTML: contenido textual codificado en multimedia
(imagen o video) archivos o formatos de archivo específicos no tratados
por los motores de búsqueda.
• WEB PRIVADA: LOS sitios que requieren de registro y de una contraseña
para iniciar sesión
• WEB CONTEXTUAL: páginas con contenidos diferentes para diferentes
contextos de acceso (por ejemplo, los rangos de direcciones IP de clientes
o secuencia de navegación anterior).
17. BITCOIN EN LA DEEP WEB
Es una moneda, como el euro o el
dólar, la cual sirve para intercambiar
bienes y servicios. Es una divisa
electrónica, se destaca por su
eficiencia, seguridad y facilidad de
intercambio. Es una moneda que esta
fuera del control de bancos centrales y
es muy bien vista por hackers. La
mayor parte de las transacciones y
compras en la Deep Web son llevadas
a cabo mediante las BITCOINS.
18. CARACTERÍSTICAS DEL LOS BITCOIN
No pertenece a ningún Estado o país , puede usarse en todo el mundo por igual.
No es controlada por ningún Estado, banco, institución financiera. • Es imposible su
falsificación o duplicación gracias a un sofisticado sistema criptográfico.
No hay intermediarios: Las transacciones se hacen directamente de persona a persona.
Puedes cambiar bitcoins a euros u otras divisas y viceversa, como cualquier moneda.
No es necesario revelar tu identidad al hacer negocios y preserva tu privacidad.
El dinero te pertenece al 100%; no puede ser intervenido por nadie ni las cuentas pueden
ser congeladas.