LECTURA DE SOBRE LA
INTERNET PROFUNDA O
INVISIBLE
ALUMNO: JESUS FERNANDO
QUIROGA
DEFINICIÓN
Se denomina 'Internet invisible' o Infranet al
conjunto de recursos accesibles únicamente a
través de algún tipo de pasarela o formulario Web
que por tanto, no pueden ser indicados de forma
estructural por los robots de los buscadores.
TIPOS DE INTERNET GLOBAL:
Red de información libre y gratuita
que es accesible mediante la
interconexión de ordenadores. La
forma de acceso se realiza mediante
programas navegadores, Chats,
mensajería o intercambio de
protocolos (FTP, P2P).
Red de información libre y gratuita
que es accesible mediante la
interconexión de ordenadores. La
forma de acceso se realiza mediante
programas navegadores, Chats,
mensajería o intercambio de
protocolos (FTP, P2P).
Es inaccesible mediante los procesos
habituales de recuperación de la
información que realizan
buscadores, directorios y agentes de
búsqueda. Los servidores o host que
son totalmente inaccesibles desde
nuestro ordenador.
La causa principal se debe a zonas
restringidas con fines de seguridad
nacional y militar, otros motivos son
la configuración incorrecta de
routers, servicios de cortafuegos y
protección, servidores inactivos y
finalmente " secuestro & quot;
de servidores para utilización ilegal.
TIPOS DE INFORMACIÒN:
Bases de datos: los buscadores sólo
proporcionan acceso a la página de
inicio porque las restantes son
dinámicas. Documentos en formato
pdf, word: los motores de
búsquedas fueron creados sólo para
localizar e indizar páginas html,
aunque actualmente Google indiza
documentos en formato pdf, doc,
xml. Páginas web que no son
indizadas por los motores de
búsqueda: porque se excluyen ellas
mismas a través de un protocolo.
CLASIFICACIÒN DE INTERNET
INVISIBLE:
Web opaca
Web privada
Web
propietaria
WEB OPACA
• Se compone de archivos que podrían estar incluidos en los índices de los motores de
búsqueda, pero no lo están por alguna de estas razones:
Extensión de la indización: por economía, no todas las páginas de un sitio son indizadas en los
buscadores.
Frecuencia de la indización: los motores de búsqueda no tienen la capacidad de indizar todas las
páginas existentes; diariamente se añaden, modifican o desaparecen muchas y la indización no se realiza
al mismo ritmo.
Número máximo de resultados visibles: aunque los motores de búsqueda arrojan a veces un gran
número de resultados de búsqueda, generalmente limitan el número de documentos que se muestran (entre
200 y 1000 documentos).
WEB PRIVADA
• Consiste en las páginas Web que podrían estar indizadas en los motores de
búsqueda pero son excluidas deliberadamente por alguna de estas causas:
Las páginas están
protegidas por
contraseñas
(passwords).
Contienen un archivo
“robots.txt” para evitar
ser indizadas.
Contienen un campo
“noindex” para evitar
que el buscador índice la
parte correspondiente al
cuerpo de la página.
WEB PROPIETARIA
• Incluye aquellas páginas en las que es necesario registrarse para tener acceso al
contenido, ya sea de forma gratuita o pagada. Se dice que al menos 95% de la Web
profunda contiene información de acceso público y gratuito (Turner, 2003)
WEB REALMENTE INVISIBLE
Se compone de páginas que no pueden ser
indizadas por limitaciones técnicas de los
buscadores, como las siguientes:
• Páginas Web que incluyen formatos como
PDF, PostScript, Flash, Shockwave, programas
ejecutables y archivos comprimidos.
• Páginas generadas dinámicamente, es decir, que
se generan a partir de datos que introduce el
usuario. Información almacenada en bases de
datos relacionales, que no puede ser extraída a
menos que se realice una petición específica.
Otra dificultad consiste en la variable
estructura y diseño de las bases de datos, así
como en los diferentes procedimientos de
búsqueda.
CLASIFICACIÒN DE LA WEB
INVISIBLEAsí pues, la Web invisible está constituida por toda esa:
Bases de datos bibliográficas: incluidos los catálogos de
bibliotecas, las bases de datos de referencias
bibliográficas, gratuitas o de pago, etc.
Bases de datos alfanuméricas y a texto completo: que
incluyen en esta categoría las obras de referencia,
tipo enciclopedia o diccionarios.
Revistas electrónicas y archivos de documentos
SITIOS DE INTERNET INVISIBLE
Motores de Búsqueda Buscadores: Especializados- Regionales-Generales. Ejemplo:
Google Youtube Altavista Web crawler
METABUSCADORES
Un metabuscador es una clase de buscador que carece de base de datos propia y, en su
lugar, usa las de otros buscadores y muestra una combinación de las mejores páginas que
ha devuelto cada buscador. EJEMPLO: IXQUICK MAMMA VIVISIMO GLUSTY
DIRECTORIO
Es una agrupación de archivos de datos, atendiendo a su contenido, a su propósito o a
cualquier criterio que decida el usuario. Técnicamente el directorio almacena información
acerca de los archivos que contiene: como los atributos de los archivos o dónde se
encuentran físicamente en el dispositivo de almacenamiento. EJEMPLO: EXIT
YAHOO.

LECTURA SOBRE LA INTERNET PROFUNDA O INVISIBLE

  • 1.
    LECTURA DE SOBRELA INTERNET PROFUNDA O INVISIBLE ALUMNO: JESUS FERNANDO QUIROGA
  • 2.
    DEFINICIÓN Se denomina 'Internetinvisible' o Infranet al conjunto de recursos accesibles únicamente a través de algún tipo de pasarela o formulario Web que por tanto, no pueden ser indicados de forma estructural por los robots de los buscadores.
  • 3.
    TIPOS DE INTERNETGLOBAL: Red de información libre y gratuita que es accesible mediante la interconexión de ordenadores. La forma de acceso se realiza mediante programas navegadores, Chats, mensajería o intercambio de protocolos (FTP, P2P). Red de información libre y gratuita que es accesible mediante la interconexión de ordenadores. La forma de acceso se realiza mediante programas navegadores, Chats, mensajería o intercambio de protocolos (FTP, P2P). Es inaccesible mediante los procesos habituales de recuperación de la información que realizan buscadores, directorios y agentes de búsqueda. Los servidores o host que son totalmente inaccesibles desde nuestro ordenador. La causa principal se debe a zonas restringidas con fines de seguridad nacional y militar, otros motivos son la configuración incorrecta de routers, servicios de cortafuegos y protección, servidores inactivos y finalmente " secuestro & quot; de servidores para utilización ilegal.
  • 4.
    TIPOS DE INFORMACIÒN: Basesde datos: los buscadores sólo proporcionan acceso a la página de inicio porque las restantes son dinámicas. Documentos en formato pdf, word: los motores de búsquedas fueron creados sólo para localizar e indizar páginas html, aunque actualmente Google indiza documentos en formato pdf, doc, xml. Páginas web que no son indizadas por los motores de búsqueda: porque se excluyen ellas mismas a través de un protocolo.
  • 5.
    CLASIFICACIÒN DE INTERNET INVISIBLE: Webopaca Web privada Web propietaria
  • 6.
    WEB OPACA • Secompone de archivos que podrían estar incluidos en los índices de los motores de búsqueda, pero no lo están por alguna de estas razones: Extensión de la indización: por economía, no todas las páginas de un sitio son indizadas en los buscadores. Frecuencia de la indización: los motores de búsqueda no tienen la capacidad de indizar todas las páginas existentes; diariamente se añaden, modifican o desaparecen muchas y la indización no se realiza al mismo ritmo. Número máximo de resultados visibles: aunque los motores de búsqueda arrojan a veces un gran número de resultados de búsqueda, generalmente limitan el número de documentos que se muestran (entre 200 y 1000 documentos).
  • 7.
    WEB PRIVADA • Consisteen las páginas Web que podrían estar indizadas en los motores de búsqueda pero son excluidas deliberadamente por alguna de estas causas: Las páginas están protegidas por contraseñas (passwords). Contienen un archivo “robots.txt” para evitar ser indizadas. Contienen un campo “noindex” para evitar que el buscador índice la parte correspondiente al cuerpo de la página.
  • 8.
    WEB PROPIETARIA • Incluyeaquellas páginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o pagada. Se dice que al menos 95% de la Web profunda contiene información de acceso público y gratuito (Turner, 2003)
  • 9.
    WEB REALMENTE INVISIBLE Secompone de páginas que no pueden ser indizadas por limitaciones técnicas de los buscadores, como las siguientes: • Páginas Web que incluyen formatos como PDF, PostScript, Flash, Shockwave, programas ejecutables y archivos comprimidos. • Páginas generadas dinámicamente, es decir, que se generan a partir de datos que introduce el usuario. Información almacenada en bases de datos relacionales, que no puede ser extraída a menos que se realice una petición específica. Otra dificultad consiste en la variable estructura y diseño de las bases de datos, así como en los diferentes procedimientos de búsqueda.
  • 10.
    CLASIFICACIÒN DE LAWEB INVISIBLEAsí pues, la Web invisible está constituida por toda esa: Bases de datos bibliográficas: incluidos los catálogos de bibliotecas, las bases de datos de referencias bibliográficas, gratuitas o de pago, etc. Bases de datos alfanuméricas y a texto completo: que incluyen en esta categoría las obras de referencia, tipo enciclopedia o diccionarios. Revistas electrónicas y archivos de documentos
  • 11.
    SITIOS DE INTERNETINVISIBLE Motores de Búsqueda Buscadores: Especializados- Regionales-Generales. Ejemplo: Google Youtube Altavista Web crawler METABUSCADORES Un metabuscador es una clase de buscador que carece de base de datos propia y, en su lugar, usa las de otros buscadores y muestra una combinación de las mejores páginas que ha devuelto cada buscador. EJEMPLO: IXQUICK MAMMA VIVISIMO GLUSTY DIRECTORIO Es una agrupación de archivos de datos, atendiendo a su contenido, a su propósito o a cualquier criterio que decida el usuario. Técnicamente el directorio almacena información acerca de los archivos que contiene: como los atributos de los archivos o dónde se encuentran físicamente en el dispositivo de almacenamiento. EJEMPLO: EXIT YAHOO.