TRABAJO SOBRE LA DEEP WEB
Trabajo elaborado por:
 LUIS HELI ÁLVAREZ VILLARRAGA: id 455613
 BRAYAN ANDRES CAÑAVERAL BARBOSA: id 473962
Área: Gestión básica de la información
Tutora: DIANA VÉLASQUEZ ROMERO
Programa: contaduría pública-distancia
Grupo: 1C
DEEP WEB( internet profunda o invisible)
DEEP WEB
Internet profunda o invisible, contenido de
internet que no forma parte del internet
superficial.
CAUSAS:
• Páginas y sitios web
protegidos con
contraseñas o códigos
establecidos.
• Enciclopedias,
diccionarios, revistas en
las que para acceder a
la información hay que
interrogar a la base de
datos, como por
ejemplo la base de
datos de la RAE
• Documentos en
formatos no indexables
TAMAÑO
Se estima que la Internet
Profunda es 500 veces
mayor que la Internet
Superficial, siendo el 95%
de esta información
públicamente accesible. En
2010 se estimó que la
información que se
encuentra en la Internet
profunda es de
7,500 terabytes, lo que
equivale a
aproximadamente 550
billones de documentos
individuales. El contenido de
la internet profunda es de
400 a 550 veces mayor de
lo que se puede encontrar
en la Internet superficial. En
comparación, se estima que
la Internet superficial
contiene solo 19 terabytes
de contenido y un billón de
documentos individuales.
DENOMINACIÓN
Son páginas de texto, archivos, o
en ocasiones información a la
cual se puede acceder por medio
de la world wide web que los
buscadores de uso general no
pueden, debido a limitaciones o
deliberadamente, agregar a sus
índices de páginas webs.
RASTREANDO LA
INTERNET
PROFUNDA
• La selección de valores de
entrada, para que las
entradas de búsqueda de
texto acepten palabras clave.
• La identificación de los
insumos que aceptan sólo
valores específicos (por
ejemplo, fecha).
• La selección de un pequeño
número de combinaciones de
entrada que generan URLS
adecuadas para su inclusión
en el índice de búsqueda
Web.
INGRESANDO A LA
RED PROFUNDA
• Las arañas(web crawler): Son
bots inteligentes que van
haciendo búsquedas por en
laces de hipertexto de página
en página, registrando la
información ahí disponible
• Tor: Es un proyecto diseñado e
implementado por la marina de
los Estados Unidos lanzado el
20 de septiembre de 2002. A
diferencia de los navegadores
de Internet convencionales, Tor
le permite a los usuarios
navegar por la Web de forma
anónima.
• Bitcoin: En estos sitios, se
pueden encontrar drogas,
armas, o incluso asesinos a
sueldo. Se utiliza la moneda
digital llamada bitcoin, que
tiene sus orígenes en 2009,
pero que se ha vuelto todo un
fenómeno desde 2012, que se
intercambia a través de
billeteras digitales entre el
usuario y el vendedor, lo que
hace que sea prácticamente
imposible de rastrear.
RECURSOS DE LA
INTERNET
• Contenido de Acceso limitado: los sitios
que limitan el acceso a sus páginas de una
manera técnica (Por ejemplo, utilizando
el estándar de exclusión de
robots o captcha, que prohíben los motores
de búsqueda de la navegación por y la
creación de copias en caché
• Contenido Dinámico: Las páginas
dinámicas que devuelven respuesta a una
pregunta presentada o acceder a través de
un formulario, especialmente si se utilizan
elementos de entrada en el dominio abierto
como campos de texto.
• Contenido No Vinculado: páginas que no
están conectadas con otras páginas, que
pueden impedir que los programas de
rastreo web tengan acceso al contenido.
Este material se conoce como páginas sin
enlaces entrantes.
• Contenido Programado: páginas que sólo
son accesibles a través de enlaces
producidos por JavaScript, así como el
contenido descargado de forma dinámica a
partir de los servidores web a través de
soluciones de Flash o Ajax
• Sin contenido HTML: contenido textual
codificado en multimedia (imagen o video)
archivos o formatos de archivo específicos
no tratados por los motores de búsqueda
• Web privada: los sitios que requieren de
registro y de una contraseña para iniciar
sesión
• Web contextual: páginas con contenidos
diferentes para diferentes contextos de
acceso (por ejemplo, los rangos
de direcciones IP de clientes o secuencia
de navegación anterior).
¿Cómo hacer un buen uso de la DEEP WEB?
 Crear una cuenta con un código o contraseña
 Buscar contenido confiable y bueno para hacer de la web buen uso
 Buscar vínculos con páginas de buena información que tengan compatibilidad
 A la hora de usar la moneda( bitcoin) para pagos, utilizarla correctamente y legalmente
¿Qué mecanismos se utilizan en la DEEP WEB?
• Las arañas ( web crawler)
• Tor
• Bitcoin
¿Cómo se accede a la DEEP WEB?
No se puede entrar desde google, yahoo o buscadores convencionales, se tiene que usar programas especiales
como el TOR que es un navegador que oculta nuestra IP para entrar de una forma anónima.
Presentación deep web

Presentación deep web

  • 1.
    TRABAJO SOBRE LADEEP WEB Trabajo elaborado por:  LUIS HELI ÁLVAREZ VILLARRAGA: id 455613  BRAYAN ANDRES CAÑAVERAL BARBOSA: id 473962 Área: Gestión básica de la información Tutora: DIANA VÉLASQUEZ ROMERO Programa: contaduría pública-distancia Grupo: 1C
  • 2.
    DEEP WEB( internetprofunda o invisible)
  • 3.
    DEEP WEB Internet profundao invisible, contenido de internet que no forma parte del internet superficial. CAUSAS: • Páginas y sitios web protegidos con contraseñas o códigos establecidos. • Enciclopedias, diccionarios, revistas en las que para acceder a la información hay que interrogar a la base de datos, como por ejemplo la base de datos de la RAE • Documentos en formatos no indexables TAMAÑO Se estima que la Internet Profunda es 500 veces mayor que la Internet Superficial, siendo el 95% de esta información públicamente accesible. En 2010 se estimó que la información que se encuentra en la Internet profunda es de 7,500 terabytes, lo que equivale a aproximadamente 550 billones de documentos individuales. El contenido de la internet profunda es de 400 a 550 veces mayor de lo que se puede encontrar en la Internet superficial. En comparación, se estima que la Internet superficial contiene solo 19 terabytes de contenido y un billón de documentos individuales. DENOMINACIÓN Son páginas de texto, archivos, o en ocasiones información a la cual se puede acceder por medio de la world wide web que los buscadores de uso general no pueden, debido a limitaciones o deliberadamente, agregar a sus índices de páginas webs. RASTREANDO LA INTERNET PROFUNDA • La selección de valores de entrada, para que las entradas de búsqueda de texto acepten palabras clave. • La identificación de los insumos que aceptan sólo valores específicos (por ejemplo, fecha). • La selección de un pequeño número de combinaciones de entrada que generan URLS adecuadas para su inclusión en el índice de búsqueda Web. INGRESANDO A LA RED PROFUNDA • Las arañas(web crawler): Son bots inteligentes que van haciendo búsquedas por en laces de hipertexto de página en página, registrando la información ahí disponible • Tor: Es un proyecto diseñado e implementado por la marina de los Estados Unidos lanzado el 20 de septiembre de 2002. A diferencia de los navegadores de Internet convencionales, Tor le permite a los usuarios navegar por la Web de forma anónima. • Bitcoin: En estos sitios, se pueden encontrar drogas, armas, o incluso asesinos a sueldo. Se utiliza la moneda digital llamada bitcoin, que tiene sus orígenes en 2009, pero que se ha vuelto todo un fenómeno desde 2012, que se intercambia a través de billeteras digitales entre el usuario y el vendedor, lo que hace que sea prácticamente imposible de rastrear. RECURSOS DE LA INTERNET • Contenido de Acceso limitado: los sitios que limitan el acceso a sus páginas de una manera técnica (Por ejemplo, utilizando el estándar de exclusión de robots o captcha, que prohíben los motores de búsqueda de la navegación por y la creación de copias en caché • Contenido Dinámico: Las páginas dinámicas que devuelven respuesta a una pregunta presentada o acceder a través de un formulario, especialmente si se utilizan elementos de entrada en el dominio abierto como campos de texto. • Contenido No Vinculado: páginas que no están conectadas con otras páginas, que pueden impedir que los programas de rastreo web tengan acceso al contenido. Este material se conoce como páginas sin enlaces entrantes. • Contenido Programado: páginas que sólo son accesibles a través de enlaces producidos por JavaScript, así como el contenido descargado de forma dinámica a partir de los servidores web a través de soluciones de Flash o Ajax • Sin contenido HTML: contenido textual codificado en multimedia (imagen o video) archivos o formatos de archivo específicos no tratados por los motores de búsqueda • Web privada: los sitios que requieren de registro y de una contraseña para iniciar sesión • Web contextual: páginas con contenidos diferentes para diferentes contextos de acceso (por ejemplo, los rangos de direcciones IP de clientes o secuencia de navegación anterior).
  • 5.
    ¿Cómo hacer unbuen uso de la DEEP WEB?  Crear una cuenta con un código o contraseña  Buscar contenido confiable y bueno para hacer de la web buen uso  Buscar vínculos con páginas de buena información que tengan compatibilidad  A la hora de usar la moneda( bitcoin) para pagos, utilizarla correctamente y legalmente ¿Qué mecanismos se utilizan en la DEEP WEB? • Las arañas ( web crawler) • Tor • Bitcoin ¿Cómo se accede a la DEEP WEB? No se puede entrar desde google, yahoo o buscadores convencionales, se tiene que usar programas especiales como el TOR que es un navegador que oculta nuestra IP para entrar de una forma anónima.