TRABAJO SOBRE LA DEEP WEB
Trabajo elaborado por:
 LUIS HELI ÁLVAREZ VILLARRAGA: id 455613
 BRAYAN ANDRES CAÑAVERAL BARBOSA: id 473962
Área: Gestión básica de la información
Tutora: DIANA VÉLASQUEZ ROMERO
Programa: contaduría pública-distancia
Grupo: 1C
DEEP WEB( internet profunda o invisible)
DEEP WEB
Internet profunda o invisible, contenido de
internet que no forma parte del internet
superficial.
CAUSAS:
• Páginas y sitios web
protegidos con
contraseñas o códigos
establecidos.
• Enciclopedias,
diccionarios, revistas en
las que para acceder a
la información hay que
interrogar a la base de
datos, como por
ejemplo la base de
datos de la RAE
• Documentos en
formatos no indexables
TAMAÑO
Se estima que la Internet
Profunda es 500 veces
mayor que la Internet
Superficial, siendo el 95%
de esta información
públicamente accesible. En
2010 se estimó que la
información que se
encuentra en la Internet
profunda es de
7,500 terabytes, lo que
equivale a
aproximadamente 550
billones de documentos
individuales. El contenido de
la internet profunda es de
400 a 550 veces mayor de
lo que se puede encontrar
en la Internet superficial. En
comparación, se estima que
la Internet superficial
contiene solo 19 terabytes
de contenido y un billón de
documentos individuales.
DENOMINACIÓN
Son páginas de texto, archivos, o
en ocasiones información a la
cual se puede acceder por medio
de la world wide web que los
buscadores de uso general no
pueden, debido a limitaciones o
deliberadamente, agregar a sus
índices de páginas webs.
RASTREANDO LA
INTERNET
PROFUNDA
• La selección de valores de
entrada, para que las
entradas de búsqueda de
texto acepten palabras clave.
• La identificación de los
insumos que aceptan sólo
valores específicos (por
ejemplo, fecha).
• La selección de un pequeño
número de combinaciones de
entrada que generan URLS
adecuadas para su inclusión
en el índice de búsqueda
Web.
INGRESANDO A LA
RED PROFUNDA
• Las arañas(web crawler): Son
bots inteligentes que van
haciendo búsquedas por en
laces de hipertexto de página
en página, registrando la
información ahí disponible
• Tor: Es un proyecto diseñado e
implementado por la marina de
los Estados Unidos lanzado el
20 de septiembre de 2002. A
diferencia de los navegadores
de Internet convencionales, Tor
le permite a los usuarios
navegar por la Web de forma
anónima.
• Bitcoin: En estos sitios, se
pueden encontrar drogas,
armas, o incluso asesinos a
sueldo. Se utiliza la moneda
digital llamada bitcoin, que
tiene sus orígenes en 2009,
pero que se ha vuelto todo un
fenómeno desde 2012, que se
intercambia a través de
billeteras digitales entre el
usuario y el vendedor, lo que
hace que sea prácticamente
imposible de rastrear.
RECURSOS DE LA
INTERNET
• Contenido de Acceso limitado: los sitios
que limitan el acceso a sus páginas de una
manera técnica (Por ejemplo, utilizando
el estándar de exclusión de
robots o captcha, que prohíben los motores
de búsqueda de la navegación por y la
creación de copias en caché
• Contenido Dinámico: Las páginas
dinámicas que devuelven respuesta a una
pregunta presentada o acceder a través de
un formulario, especialmente si se utilizan
elementos de entrada en el dominio abierto
como campos de texto.
• Contenido No Vinculado: páginas que no
están conectadas con otras páginas, que
pueden impedir que los programas de
rastreo web tengan acceso al contenido.
Este material se conoce como páginas sin
enlaces entrantes.
• Contenido Programado: páginas que sólo
son accesibles a través de enlaces
producidos por JavaScript, así como el
contenido descargado de forma dinámica a
partir de los servidores web a través de
soluciones de Flash o Ajax
• Sin contenido HTML: contenido textual
codificado en multimedia (imagen o video)
archivos o formatos de archivo específicos
no tratados por los motores de búsqueda
• Web privada: los sitios que requieren de
registro y de una contraseña para iniciar
sesión
• Web contextual: páginas con contenidos
diferentes para diferentes contextos de
acceso (por ejemplo, los rangos
de direcciones IP de clientes o secuencia
de navegación anterior).
¿Cómo hacer un buen uso de la DEEP WEB?
 Crear una cuenta con un código o contraseña
 Buscar contenido confiable y bueno para hacer de la web buen uso
 Buscar vínculos con páginas de buena información que tengan compatibilidad
 A la hora de usar la moneda( bitcoin) para pagos, utilizarla correctamente y legalmente
¿Qué mecanismos se utilizan en la DEEP WEB?
• Las arañas ( web crawler)
• Tor
• Bitcoin
¿Cómo se accede a la DEEP WEB?
No se puede entrar desde google, yahoo o buscadores convencionales, se tiene que usar programas especiales
como el TOR que es un navegador que oculta nuestra IP para entrar de una forma anónima.
Presentaciã³n deep web

Presentaciã³n deep web

  • 1.
    TRABAJO SOBRE LADEEP WEB Trabajo elaborado por:  LUIS HELI ÁLVAREZ VILLARRAGA: id 455613  BRAYAN ANDRES CAÑAVERAL BARBOSA: id 473962 Área: Gestión básica de la información Tutora: DIANA VÉLASQUEZ ROMERO Programa: contaduría pública-distancia Grupo: 1C
  • 2.
    DEEP WEB( internetprofunda o invisible)
  • 3.
    DEEP WEB Internet profundao invisible, contenido de internet que no forma parte del internet superficial. CAUSAS: • Páginas y sitios web protegidos con contraseñas o códigos establecidos. • Enciclopedias, diccionarios, revistas en las que para acceder a la información hay que interrogar a la base de datos, como por ejemplo la base de datos de la RAE • Documentos en formatos no indexables TAMAÑO Se estima que la Internet Profunda es 500 veces mayor que la Internet Superficial, siendo el 95% de esta información públicamente accesible. En 2010 se estimó que la información que se encuentra en la Internet profunda es de 7,500 terabytes, lo que equivale a aproximadamente 550 billones de documentos individuales. El contenido de la internet profunda es de 400 a 550 veces mayor de lo que se puede encontrar en la Internet superficial. En comparación, se estima que la Internet superficial contiene solo 19 terabytes de contenido y un billón de documentos individuales. DENOMINACIÓN Son páginas de texto, archivos, o en ocasiones información a la cual se puede acceder por medio de la world wide web que los buscadores de uso general no pueden, debido a limitaciones o deliberadamente, agregar a sus índices de páginas webs. RASTREANDO LA INTERNET PROFUNDA • La selección de valores de entrada, para que las entradas de búsqueda de texto acepten palabras clave. • La identificación de los insumos que aceptan sólo valores específicos (por ejemplo, fecha). • La selección de un pequeño número de combinaciones de entrada que generan URLS adecuadas para su inclusión en el índice de búsqueda Web. INGRESANDO A LA RED PROFUNDA • Las arañas(web crawler): Son bots inteligentes que van haciendo búsquedas por en laces de hipertexto de página en página, registrando la información ahí disponible • Tor: Es un proyecto diseñado e implementado por la marina de los Estados Unidos lanzado el 20 de septiembre de 2002. A diferencia de los navegadores de Internet convencionales, Tor le permite a los usuarios navegar por la Web de forma anónima. • Bitcoin: En estos sitios, se pueden encontrar drogas, armas, o incluso asesinos a sueldo. Se utiliza la moneda digital llamada bitcoin, que tiene sus orígenes en 2009, pero que se ha vuelto todo un fenómeno desde 2012, que se intercambia a través de billeteras digitales entre el usuario y el vendedor, lo que hace que sea prácticamente imposible de rastrear. RECURSOS DE LA INTERNET • Contenido de Acceso limitado: los sitios que limitan el acceso a sus páginas de una manera técnica (Por ejemplo, utilizando el estándar de exclusión de robots o captcha, que prohíben los motores de búsqueda de la navegación por y la creación de copias en caché • Contenido Dinámico: Las páginas dinámicas que devuelven respuesta a una pregunta presentada o acceder a través de un formulario, especialmente si se utilizan elementos de entrada en el dominio abierto como campos de texto. • Contenido No Vinculado: páginas que no están conectadas con otras páginas, que pueden impedir que los programas de rastreo web tengan acceso al contenido. Este material se conoce como páginas sin enlaces entrantes. • Contenido Programado: páginas que sólo son accesibles a través de enlaces producidos por JavaScript, así como el contenido descargado de forma dinámica a partir de los servidores web a través de soluciones de Flash o Ajax • Sin contenido HTML: contenido textual codificado en multimedia (imagen o video) archivos o formatos de archivo específicos no tratados por los motores de búsqueda • Web privada: los sitios que requieren de registro y de una contraseña para iniciar sesión • Web contextual: páginas con contenidos diferentes para diferentes contextos de acceso (por ejemplo, los rangos de direcciones IP de clientes o secuencia de navegación anterior).
  • 5.
    ¿Cómo hacer unbuen uso de la DEEP WEB?  Crear una cuenta con un código o contraseña  Buscar contenido confiable y bueno para hacer de la web buen uso  Buscar vínculos con páginas de buena información que tengan compatibilidad  A la hora de usar la moneda( bitcoin) para pagos, utilizarla correctamente y legalmente ¿Qué mecanismos se utilizan en la DEEP WEB? • Las arañas ( web crawler) • Tor • Bitcoin ¿Cómo se accede a la DEEP WEB? No se puede entrar desde google, yahoo o buscadores convencionales, se tiene que usar programas especiales como el TOR que es un navegador que oculta nuestra IP para entrar de una forma anónima.