El documento describe la evolución de la Web desde su creación en 1989 hasta la actualidad. Comenzó como una Web estática con documentos de sólo lectura, luego evolucionó a una Web dinámica que permitió contenido generado por usuarios, y más recientemente una Web social donde los usuarios comparten y crean contenido de forma colaborativa. La próxima etapa es una Web semántica donde los agentes de software puedan procesar automáticamente la información entre sitios para satisfacer objetivos.
2. Evolución de la Web
(1989-hoy)
2
Extraída de: http://internetlivestats.com
3. ▪ Fuentes de datos no estructurada
▪ Documentos (ficheros) escritos en lenguaje natural cuyo contenido es
interpretado por las personas
▪ Búsqueda de información: Técnicas de Information Retrieval IR con
matching sintáctico
▪ Interfaces basadas en palabras clave
▪ Fuentes de datos estructuradas
▪ Datos que tienen asociados un conjunto de metadatos, generalmente
información tabular (80-90%)
▪ Búsqueda de información: Localización de la fuente, análisis de su
estructura (metadatos) y consulta con interfaces o lenguajes específicos
▪ Interfaces basadas en SQL (Standard Query Language)
▪ Fuentes de datos semi-estructuradas o híbridas
2
Tipos de fuentes de datos
4. ▪ Web estática o tradicional (Web 1.0)
▪ Internet VS Web
▪ Origen de la Web y características
▪ Ataques, amenazas y vulnerabilidades
▪ Web dinámica (Web 1.5)
▪ Características
▪ Ataques, amenazas y vulnerabilidades
▪ Web social (Web 2.0)
▪ Características
▪ Ataques, amenazas y vulnerabilidades
▪ Web semántica o Web de datos enlazados (Web 3.0)
▪ Pilares de la Web semántica: anotación, ontologías y razonadores
▪ Las tecnologías de Datos enlazados (Abiertos) o (Open) Linked Data
▪ La Web de Datos
▪ ¿Cuál es la próxima generación?
▪ Bibliografía y referencias
4
Guión
5. Web estática o tradicional (Web 1.0)
5
Internet VS. Web
▪ Internet: Nodos interconectados (red) y conjunto de protocolos (TCP/IP) que
permite comunicar y compartir datos e información entre los diferentes
nodos y compartir recursos (impresora, memoria para almacenamiento,
capacidad de procesamiento, etc.)
▪ Origen:
▪ Proyecto DARPA (Defense Advanced Research Proyect Agency, 1958, USA)
▪ Contexto: Guerra fría
▪ Objetivo: crear una red de conmutación de paquetes para evitar aislamiento de nodos
▪ ARPANET (Advanced Research Projects Agency Network)
▪ En 1969 sólo cuatro nodos conectados: Standford, California Los Angeles, Santa
Bárbara y Utah
6. Web estática o tradicional (Web 1.0)
Internet VS. Web
▪ Origen de Internet
7. Web estática o tradicional (Web 1.0)
Internet VS. Web
▪ Evolución de Internet
▪ 1971, 24 nodos
▪ 1973, Vinton Cerf y Robert Kahn lideraron el diseño del conjunto de
protocolos TCP/IP que llegaron a convertirse en el estándar de facto
inicialmente
▪ 1974, 62 nodos consolidados
▪ 1981, se superaron los 200 nodos
▪ 1983, se oficializa el nombre de Internet
▪ Mediados de los ochenta masa crítica suficiente
▪ 1994 se habían incorporado hasta 45.000 redes pequeñas
9. Web estática o tradicional (Web 1.0)
Internet VS. Web
▪ Origen de Internet
• Surgen numerosas aplicaciones (sistemas de
información) gracias a esta infraestructura:
▪ El protocolo de transferencia de
ficheros (FTP)
▪ El correo electrónico (1971)
▪ IRC (Internet Relay Chat, 1988)
▪ Telnet
▪ La World Wide Web (la Web) 1989
• Enorme confusión Internet y la Web
▪ The Internet map
▪ http://internet-map.net Capa
Transporte
(en
TCP/IP)
Protocolos
(http y https)
10. Web estática o tradicional (Web 1.0)
10
Origen de la Web
▪ Proyecto impulsado por Tim Berners Lee finales de los 80
▪ CERN (Center of European Organization for Nuclear Research)
▪ Objetivo: Facilitar la “compartición” e intercambio de documentos
entre los diferentes científicos involucrados en un proyecto
▪ 3 elementos clave:
▪ HyperText Markup Language (HTML)
▪ Uniform Resource Locator (URL)
▪ HyperText Transfer Protocol (HTTP)
[Fuente: Tim Berners-Lee,Robert Cailliau, Ari Luotonenen, Henrik Frystyk Nielsen, y
Arthur Secret, The World-Wide Web, Communications of ACM, Volumen 37, nº 8,
Agosto 1994]
11. Web estática o tradicional (Web 1.0)
Origen de la Web
▪ Éxito debido a:
▪Sencillez de implantación (instalar un servidor y copiar y
modificar archivos de texto)
▪ Mejoras en las redes de comunicación (redes con mayor estabilidad)
▪ Coste inferior a la distribución en papel
▪ Accesible a un mayor público
▪ Actualización inmediata
11
12. Web estática o tradicional (Web 1.0)
12
Características:
▪ Definida como Web de sólo lectura (Read Only Web)
▪ La gran mayoría de los usuarios visualizan páginas mediante navegadores
(browsers) de los creadores que, en general, son grandes corporaciones
información
(empresas, administración pública, etc.) que difunden
(comunicación unidireccional)
▪ Pocos emisores vs. muchos consumidores de la información
▪ No existe interacción entre los interlocutores
▪ Búsqueda de información: a través de grandes portales y directorios de
búsqueda: Excite (* 1994), Altavista (* 4/1995), Yahoo! (* 3/1995) que
clasificaban páginas, inicialmente manualmente.
13. Web estática o tradicional (Web 1.0)
https://web.archive.org/
13
14. Web estática o tradicional (Web 1.0)
14
Fuente: http://scaruffi.com
15. Web estática o tradicional (Web 1.0)
15
Fuente: http://edition.cnn.com/EVENTS/1996/year.in.review/
17. Web estática o tradicional (Web 1.0)
17
Fuente: http://www.dmoz.org [proyecto discontinuado a partir de 2017]
https://dmoz-odp.org/
18. Web dinámica o de transición (Web 1.5)
21
Características
▪ Cambio tecnológico respecto a la Web 1.0:
▪ Generación dinámica de los documentos HTML cuando se solicitan a partir
del acceso a información generalmente almacenada en bases de datos y
ficheros plantilla para facilitar la integración de información generada en
sistemas de gestión de las entidades con la Web (evitar la información y
datos obsoletos).
▪ Active Server Pages (ASP) 1996, Java Server Pages (JSP) 1998, Hypertext
Preprocessor (PHP) 1994-1999, Javascript y Applets 1995
• En auge hace unos15-20 años
▪ Ejecución en el cliente VS servidor
▪ La filosofía de la Web continúa siendo la misma (Web de sólo lectura Read
only Web)
▪ Período de transición entre la Web estática o tradicional y la Web social
19. Web dinámica o de transición (Web 1.5)
Características
22
http://www.sbuniv.edu/welcome_message.php?user=Maria
20. Web dinámica o de transición (Web 1.5)
Características
▪ Popularización de la Web
23
Extraída de: http://internetlivestats.com]
21. Web dinámica o de transición (Web 1.5)
24
Características
▪ Búsqueda de información:
▪ Surgen los buscadores Web o motores de búsqueda (indexado automático vs
indexado manual de los directorios de búsqueda)
▪ Analizan e indexan el contenido de los servidores web
▪ Hacen un matching sintáctico entre consultas y documentos
▪ Los de mayor éxito: interfaz basada en palabras clave (Google, * 04/09/1998)
▪ Nuevos modelos de negocio:
▪ Tiendas de comercio electrónico
22. Web social (Web 2.0)
Características
▪ No supone ningún cambio tecnológico respecto a la Web dinámica sino
un cambio de filosofía y uso:
▪ Se usan formularios para recoger datos e información generada por los usuarios
Además, dichos datos se convierten en contenido del propio sitio Web
en la
▪ Aplicaciones centradas en los usuarios que participan activamente
elaboración de contenidos
▪ Web de lectura/escritura (Read-Write Web)
▪ El término Web 2.0 fue acuñado por Darcy DiNucci 1999
26
▪ Tim O’reilly, O’Reilly Media Web 2004
[Fuente: Darcy DiNucci, Fragmented Future, Design and New Media, 1999]
[Fuente: Tim O’Reilly, What isWeb 2.0. Design Patterns and Business Models for
the Next Generation of Software, 30 septiembre de 2005]
23. Web social (Web 2.0)
Wikipedia
▪ Creada en el 2001
▪ Una de las fuentes de
información no
estructurada más usada
▪ Compuesta de artículos
versiones o
(una por
▪ Múltiples
capítulos
lengua)
27
25. Web social (Web 2.0)
Características
▪ En auge 2004-2011:
▪ Blogger 1999
▪ Facebook 2004
▪ YouTube 2005
▪ Twitter 2006
▪ Nuevos modelos de negocio
29
26. Web social (Web 2.0)
30
Características
▪ Búsqueda de información:
▪ El volumen de contenido en la Web crece exponencialmente y llega a ser tal la
cantidad de sitios web y páginas que resulta compleja la localización de la
información y datos (a pesar de estar disponibles)
▪ Necesidad de escalar sistemas de búsqueda (buscadores distribuidos vs
buscadores centralizados, escalabilidad horizontal vs escalabilidad vertical)
▪ Buscadores específicos (para un determinado tema) en contraposición a los
buscadores generalistas (por ejemplo Google o Bing): buscadores verticales vs.
buscadores de propósito general u horizontales
▪ Ejemplos: Google Schoolar, Infojobs, etc.
27. Web social (Web 2.0)
▪ Ejemplo: La tarde que (no) murió Raphael, El mundo, 12 de mayo de 2014
Ataques, amenazas y vulnerabilidades
▪ Necesidad de contrastar la información y analizar la confianza de las
fuentes de los datos:
Fuente: Wikipedia
31
28. Web social (Web 2.0)
Ataques, amenazas y vulnerabilidades
▪ Necesidad de contrastar la información y analizar la confianza de las
fuentes de los datos:
▪ Ejemplo: How to Charge an iPod with an Onion (2007)
https://www.youtube.com/watch?v=k8VKs7fx0Fk
32
29. Web social (Web 2.0)
Ataques, amenazas y vulnerabilidades
▪ Dificultad de localización de contenidos, especialmente cuando no se
busca lo que busca la mayoría de los usuarios
▪ Ejemplo: mouse price en Google
33
30. Web social (Web 2.0)
Ataques, amenazas y vulnerabilidades
▪ Dificultad de localización de contenidos a pesar de estar disponibles
▪ Web oculta o profunda (Hidden Web o Deep Web)
34
31. Web semántica (Web 3.0)
Características
▪ Objetivo:
▪ Una Web orientada a máquinas y personas y no sólo a personas como la Web
tradicional y social
▪ Una Web en la que los agentes SW puedan interactuar de forma automática y
procesar, integrar y reusar información de distintos sitios Web para lograr sus
objetivos
▪ Supone una revolución tecnológica en años posteriores (cambio de filosofía y uso)
36
32. Web semántica (Web 3.0)
37
Características
▪ El término fue acuñado por Tim Berners Lee, Jim Hendler y Ora Lassila
en 2001
▪ Web de lectura, escritura y ejecución (Read-Write and Executed Web)
▪ [Fuente: Tim Berners-Lee, Jim Hendler, Ora Lassila. The semantic web.
Scientific American, 284(5): 34–43, mayo de 2001]
▪ Ejemplo: Solicitar una cita médica para un familiar
▪ Preguntas:
• ¿Qué? Establecer cita médica
• ¿Para quién? Para un familiar
• ¿Cuándo? Lo antes posible
33. Web semántica (Web 3.0)
Características
▪ Ejemplo
▪ Búsqueda de compañías médicas a las que puedo acceder
▪ Qué cuadro médico ofrece
38
34. Web semántica (Web 3.0)
Características
▪ Ejemplo: Qué cuadro médico se encuentra en un sitio cercano
39
35. Web semántica (Web 3.0)
Características
▪ Ejemplo: Compara las agendas de médicos seleccionados y agenda del
paciente para determinar que médico ofrece la cita lo antes posible en la
disponibilidad horaria
40
36. Web semántica (Web 3.0)
Características
▪ Ejemplo: Formalizar la solicitud de la cita, reservar el hueco en la agenda de
médico y paciente e incluso cargar la ruta de cómo llegar al centro médico en el
dispositivo GPS del coche y del teléfono móvil en caso de que el transporte
público no sea la opción más recomendable
41
37. Web semántica (Web 3.0)
42
Características
▪ No persigue tirar todo lo existente sino un cambio tecnológico incremental
basado en tres pilares fundamentales:
▪ Anotación (etiquetar) de recursos con metadatos
▪ Ontologías o vocabularios estandarizados comunes
▪ Uso de reglas y razonadores (motores de inferencia) para deducir nuevos
datos que permitan tomar decisiones
38. Web semántica (Web 3.0)
Características: Anotación semántica
Nombre de persona
Fecha de nacimiento de una persona
43
39. Web semántica (Web 3.0)
44
Características: Anotación semántica
Nombre de persona
Fecha de nacimiento de una persona
40. Web semántica (Web 3.0)
Características: Ontologías
▪ FOAF (Friend Of A Friend) foaf:name, foaf:familyName,
foaf:age
48
44. Web semántica (Web 3.0)
52
Características: Reglas Razonadores
▪ Motores de inferencia automáticos
▪ Ejemplo: Ratón es un animal y los animales son seres vivos entonces un ratón es
un ser vivo
▪ Motores de razonamiento (razonadores)
▪ Pellet (gratuito, Java)
▪ Racer-Pro
▪ Hermet
▪ Fact++
▪ Productos comerciales y libres de redes bayesianas
46. Web semántica (Web 3.0)
Inicios de la Web semántica: La web de datos
▪ Aplicación que demostró la viabilidad de la Web Semántica
▪ Objetivo:
▪ Hacer accesible a los agentes software la información disponible en las
cajas de información de Wikipedia
▪ Integran información de diversos sitios web
▪ http://wiki.dbpedia.org
54
47. Web semántica (Web 3.0)
La web de datos enlazados: DBpedia
Alan_Turing Born 06/23/1912
Alan_Turing Died 06/07/1954
Born_Place_Maida_Vale
Died_Place Wilmslow
Alan_Turing
Alan Turing
…
55
48. Web semántica (Web 3.0)
Inicios de la Web semántica: La web de datos enlazados
▪ Relacionar datos de una fuente de dominio específica con datos de otras fuentes
(datos de diferentes fuentes enlazados entre sí)
2007
58
54. Web semántica (Web 3.0)
Inicios de la Web semántica: La web de datos enlazados
▪ Imágenes extraídas del proyecto: http://lod-cloud.net/ [DataHub]
▪ Imagen extraída del curso visualización de datos de Laura Po:
64
55. Web semántica (Web 3.0)
Interfaces de usuario basadas en voz
Google
Home
65
Alexa Cortana
56. ¿Cuál es la próxima generación? (Web 4.0)
Inicios de la Web semántica: La web de datos enlazados
66
57. ¿Cuál es la próxima generación? (Web 4.0)
67
Inicios de la Web semántica: La web de datos enlazados
▪ “The next step is not realy a new version, but is a alternate version of what
we already have. Web needed to adapt to it’s mobile surroundings.
Web 4.0 connects all devices in the real and virtual world in real-
time”
[Fuente: https://flatworldbusiness.wordpress.com/flat-education/previously/web-
1-0-vs-web-2-0-vs-web-3-0-a-bird-eye-on-the-definition/]
▪ La Web en la que no haga falta preguntar a buscadores de información. En base
a información del contexto que detecten las necesidades de los usuarios y se les
ofrezcan recomendaciones (aproximación push)
[Fuente: https://www.paradigmadigital.com/portfolio/web-4-0/ ]
▪ La Web donde la información se encuentre geo-localizada
▪ 3D Web
▪ La Web de las emociones (emotional Web)
58. ¿Cuál es la próxima generación? (Web 4.0)
▪ “It is the environment where every aspect is holographic, including senses. In
web
1.we are able to interact using special suits using holograms meeting with other
holograms in a virtual but very real world”
[Fuente: http://rayvandenbel.weebly.com/web-10---web-50-evolution.html]
▪ El holograma de Hugh Jackman protagoniza en España una rueda de prensa
histórica
[Fuente: https://www.youtube.com/watch?v=nFObdfYth7I ]
Inicios de la Web semántica: La web de datos enlazados
▪ La información se captura de sensores y se le ofrece a los usuarios en función de
sus emociones (Brain Computer Intefaces)
Fuente: BITBRAIN
68
59. Bibliografía y referencias
69
▪ Tim Berners-lee, Robert Cailliau, Bernd Pollermann; World-Wide Web:
The information universe, Communications of the ACM, 37:76–82,
1992
▪ Tim Berners-Lee, Jim Hendler, Ora Lassila; The Semantic Web,
Scientific American, 284(5):34–43, mayo de 2001
▪ Darcy DiNucci; Fragmented Future, Print 53(4):32+ 1999
▪ Tim O’Reilly; What is Web 2.0. Design patterns and Business
models for the next generation of software, septiembre de 2005
▪ Christian Bizer, Tom Heath, Tim Berners-Lee; Linked data - the story so
far, International Journal Semantic Web and Information Systems, 5(3):1–22,
60. Bibliografía y referencias
70
▪ RDF, W3C: https://www.w3.org/RDF/ [Fecha de último acceso: 5 de febrero de 2017]
▪ RDF Schema 1.1, W3C Recommendation 25th February 2014: https://www.w3.org/TR/rdf-schema [Fecha
de último acceso: 5 de febrero de 2017]
▪ XML RDF W3C Schools: http://www.w3schools.com/xml/xml_rdf.asp [Fecha de último acceso: 5 de febrero
de 2017]
▪ RDF Tutorial, W3C Schools: http://w3schools.sinsixx.com/rdf/rdf_schema.asp.htm [Fecha de último acceso: 5
de febrero de 2017]
▪ Servicio de validación de RDF del W3C: https://www.w3.org/RDF/Validator/ [Fecha de último acceso: 5 de
febrero de 2017]
▪ SPARQL Query Language for RDF, W3C Recommendation 15th January 2008:
https://www.w3.org/TR/rdf- sparql-query/ [Fecha de último acceso: 5 de febrero de 2017]
▪ SPARQL 1.1 Query Language W3C Recommendation 21st March 2013: https://www.w3.org/TR/sparql11-
query/ [Fecha de último acceso: 2 de octubre de 2017]
61. Bibliografía y referencias
71
▪ RDFa Core 1.1 - Third Edition, W3C Recommendation 17th March 2015:
https://www.w3.org/TR/rdfa-syntax/ [Fecha de último acceso: 2 de octubre de
2017]
▪ OWL Web Ontology Language Semantics and Abstract Syntax, W3C
Recommendation 10 February 2004 https://www.w3.org/TR/owl-semantics/ [Fecha
de último acceso: 2 de octubre de 2017]
▪ OWL 2 Web Ontology Language Document Overview (Second
Edition), W3C Recommendation 11 December 2012
https://www.w3.org/TR/owl2-overview/ [Fecha de último acceso: 2 de octubre
de 2017]
▪ Laura Po, curso “Linked Data Visualization”, 3ª International Keystone
Training School on Keyword Search on Big linked Data, Viena, agosto de 2017.
Transp 5:
La Web ha cambiado la forma en la que publicamos y consumimos información, cada vez más optamos por medios digitales para informarnos en lugar de periódicos en papel.
Pero no solo ha cambiado la forma en la que publicamos y consumimos información, sino también la forma en la que nos relacionamos unos con otros y la forma en la que trabajamos. Además la pandemia ha acelerado el cambio.
Esta es una gráfica que nos indica el número de sitios web que hay disponibles. Vemos que ha habido un crecimiento exponencial entre 2008 y 2010 hubo una pequeña recesión que se puede deber a la crisis. Sin embargo, en los últimos años la tendencia parece que está cambiando y ya no se crean tantos sitios web y ya no existe tal aumento. Esto es debido a que los objetivos han cambiado:
-Antes se daba prioridad a crear un sitio web y que los usuarios consultasen tu sitio o página Web- SEO-. Sin embargo, a día de hoy lo que buscan gran parte de los usuarios y organizaciones es posicionarse en una determinada plataforma o entorno como puede ser Twitter o Facebook o Youtube.