Conferencia a cargo de Dña. Raquel Trillo Lado dentro del Curso Extraordinario de la Universidad de Zaragoza "Conocimientos y habilidades para desarrollar la competencia digital", que se celebró online los días 14, 15 y 16 de julio de 2020.
La evolución de la Web y la búsqueda de información: de solo leer al uso de la voz y sistemas de videoconferencia
1. La Web, aplicaciones Web y la búsqueda
de información: de sólo leer al uso de la
voz y sistemas de videoconferencia
Raquel Trillo-Lado
16/07/2020
2. ¡ Fuentes de datos no estructurada
¡ Documentos (ficheros) escritos en lenguaje natural cuyo contenido es
interpretado por las personas
¡ Búsqueda de información: Técnicas de Information Retrieval IR con
matching sintáctico
¡ Interfaces basadas en palabras clave
¡ Fuentes de datos estructuradas
¡ Datos que tienen asociados un conjunto de metadatos, generalmente
información tabular (80-90%)
¡ Búsqueda de información: Localización de la fuente, análisis de su
estructura (metadatos) y consulta con interfaces o lenguajes específicos
¡ Interfaces basadas en SQL (Standard Query Language)
¡ Fuentes de datos semi-estructuradas o híbridas
2
Tipos de fuentes de datos
4. ¡ Web estática o tradicional (Web 1.0)
¡ Internet VS Web
¡ Origen de la Web y características
¡ Ataques, amenazas y vulnerabilidades
¡ Web dinámica (Web 1.5)
¡ Características
¡ Ataques, amenazas y vulnerabilidades
¡ Web social (Web 2.0)
¡ Características
¡ Ataques, amenazas y vulnerabilidades
¡ Web semántica o Web de datos enlazados (Web 3.0)
¡ Pilares de la Web semántica: anotación, ontologías y razonadores
¡ Las tecnologías de Datos enlazados (Abiertos) o (Open) Linked Data
¡ La Web de Datos
¡ ¿Cuál es la próxima generación?
¡ Bibliografía y referencias
4
Guión
5. Web estática o tradicional (Web 1.0)
Internet VS. Web
¡ Internet: Nodos interconectados (red) y conjunto de protocolos (TCP/IP) que
permite comunicar y compartir datos e información entre los diferentes
nodos y compartir recursos (impresora, memoria para almacenamiento,
capacidad de procesamiento, etc.)
¡ Origen:
¡ Proyecto DARPA (Defense Advanced Research Proyect Agency, 1958, USA)
¡ Contexto: Guerra fría
¡ Objetivo: crear una red de conmutación de paquetes para evitar aislamiento de nodos
¡ ARPANET (Advanced Research Projects Agency Network)
¡ En 1969 sólo cuatro nodos conectados: Standford, California Los Angeles, Santa
Bárbara y Utah
5
6. Web estática o tradicional (Web 1.0)
Internet VS. Web
¡ Origen de Internet
7. Web estática o tradicional (Web 1.0)
Internet VS. Web
¡ Evolución de Internet
¡ 1971, 24 nodos
¡ 1973, Vinton Cerf y Robert Kahn lideraron el diseño del conjunto de
protocolos TCP/IP que llegaron a convertirse en el estándar de facto
inicialmente
¡ 1974, 62 nodos consolidados
¡ 1981, se superaron los 200 nodos
¡ 1983, se oficializa el nombre de Internet
¡ Mediados de los ochenta masa crítica suficiente
¡ 1994 se habían incorporado hasta 45.000 redes pequeñas
9. Web estática o tradicional (Web 1.0)
Internet VS. Web
¡ Origen de Internet
• Surgen numerosas aplicaciones (sistemas de
información) gracias a esta infraestructura:
¡ El protocolo de transferencia de
ficheros (FTP)
¡ El correo electrónico (1971)
¡ IRC (Internet Relay Chat, 1988)
¡ Telnet
¡ La World Wide Web (la Web) 1989
• Enorme confusión Internet y la Web
¡ The Internet map
¡ http://internet-map.net CapaTransporte
(enTCP/IP)
Protocolos
(http y https)
10. Web estática o tradicional (Web 1.0)
Origen de la Web
¡ Proyecto impulsado por Tim Berners Lee finales de los 80
¡ CERN (Center of European Organization for Nuclear Research)
¡ Objetivo: Facilitar la “compartición” e intercambio de documentos
entre los diferentes científicos involucrados en un proyecto
¡ 3 elementos clave:
¡ HyperText Markup Language (HTML)
¡ Uniform Resource Locator (URL)
¡ HyperText Transfer Protocol (HTTP)
10
[Fuente: Tim Berners-Lee,Robert Cailliau, Ari Luotonenen, Henrik Frystyk Nielsen, y
Arthur Secret, The World-Wide Web, Communications of ACM, Volumen 37, nº 8,
Agosto 1994]
11. Web estática o tradicional (Web 1.0)
Origen de la Web
¡ Éxito debido a:
¡ Sencillez de implantación (instalar un servidor y copiar y
modificar archivos de texto)
¡ Mejoras en las redes de comunicación (redes con mayor estabilidad)
¡ Coste inferior a la distribución en papel
¡ Accesible a un mayor público
¡ Actualización inmediata
11
12. Web estática o tradicional (Web 1.0)
Características:
¡ Definida como Web de sólo lectura (Read Only Web)
¡ La gran mayoría de los usuarios visualizan páginas mediante navegadores
(browsers) de los creadores que, en general, son grandes corporaciones
(empresas, administración pública, etc.) que difunden información
(comunicación unidireccional)
¡ Pocos emisores vs. muchos consumidores de la información
¡ No existe interacción entre los interlocutores
¡ Búsqueda de información: a través de grandes portales y directorios de
búsqueda: Excite (* 1994), Altavista (* 4/1995), Yahoo! (* 3/1995) que
clasificaban páginas, inicialmente manualmente.
12
13. Web estática o tradicional (Web 1.0)
https://web.archive.org/
13
14. Web estática o tradicional (Web 1.0)
14
Fuente: http://scaruffi.com
15. Web estática o tradicional (Web 1.0)
15Fuente: http://edition.cnn.com/EVENTS/1996/year.in.review/
17. Web estática o tradicional (Web 1.0)
17
Fuente: http://www.dmoz.org [proyecto discontinuado a partir de 2017]
https://dmoz-odp.org/
18. Web estática o tradicional (Web 1.0)
Características:
¡ Mayor problema:
¡ Información generalmente desactualizada
¡ Coste actualización alto (edición de documentos y publicación por el
Webmáster)
¡ Dinamismo:
¡ 1993, Common Gateway Interfaces (CGIs)
¡ Gif animados
18
19. Web estática o tradicional (Web 1.0)
Ataque y amenazas:
¡ Externas:
¡ Contra la disponibilidad: DoS, DDoS, etc.
¡ Contra la integridad (autenticidad y trazabilidad): Alteración del contenido del
servidor Web y sistema de ficheros, etc..
¡ Contra la confidencialidad: En general no se publica contenido confidencial
(robots.txt)
19
20. Web estática o tradicional (Web 1.0)
Ataque y amenazas:
¡ Externas:
¡ Contra la conservación: el contenido Web está disponible y accesible pero no es
posible leerlo (vídeos en formato obsoleto)
¡ Internas (factor humano o fallo técnico):
¡ Contenido de la Web obsoleto: los sistemas de gestión de la información de la
entidad operan de forma aislada al sistema de gestión de la información de la
entidad.
¡ Interfaces pobres: pantalla en blanco entre peticiones, lentitud, páginas
demasiado recargadas, etc.
20
21. Web dinámica o de transición (Web 1.5)
Características
¡ Cambio tecnológico respecto a la Web 1.0:
¡ Generación dinámica de los documentos HTML cuando se solicitan a partir
del acceso a información generalmente almacenada en bases de datos y
ficheros plantilla para facilitar la integración de información generada en
sistemas de gestión de las entidades con la Web (evitar la información y
datos obsoletos).
¡ Active Server Pages (ASP) 1996, Java Server Pages (JSP) 1998, Hypertext
Preprocessor (PHP) 1994-1999, Javascript y Applets 1995
• En auge hace unos 15-20 años
¡ Ejecución en el cliente VS servidor
¡ La filosofía de la Web continúa siendo la misma (Web de sólo lectura Read
only Web)
¡ Período de transición entre la Web estática o tradicional y la Web social
21
22. Web dinámica o de transición (Web 1.5)
Características
22
http://www.sbuniv.edu/welcome_message.php?user=Maria
23. Web dinámica o de transición (Web 1.5)
Características
¡ Popularización de la Web
23Extraída de: http://internetlivestats.com]
24. Web dinámica o de transición (Web 1.5)
Características
¡ Búsqueda de información:
¡ Surgen los buscadores Web o motores de búsqueda (indexado automático vs
indexado manual de los directorios de búsqueda)
¡ Analizan e indexan el contenido de los servidores web
¡ Hacen un matching sintáctico entre consultas y documentos
¡ Los de mayor éxito: interfaz basada en palabras clave (Google, * 04/09/1998)
¡ Nuevos modelos de negocio:
¡ Tiendas de comercio electrónico
24
25. Web dinámica o de transición (Web 1.5)
Ataques y amenazas
¡ Factor humano o fallo técnico (deficiente programación o
configuración de los sistemas)
¡ Comprobación de errores en los parámetros sólo en los clientes, codificar los
parámetros en la URL
¡ BD: SQL Injection, introducción de código SQL, por ejemplo en formularios
(Servidor)
¡ Usar sólo https para la autenticación inicial y después http (el id de sesión viaja
en claro)
¡ Cross Site Scripting (XSS): Modificación del código o base de datos para
incluir código JavaScript
¡ Interfaces pobres: pantalla en blanco, páginas demasiado recargadas ->
Filosofía Asynchronous JavaScript and XML (AJAX)
25
26. Web social (Web 2.0)
Características
¡ No supone ningún cambio tecnológico respecto a la Web dinámica sino
un cambio de filosofía y uso:
¡ Se usan formularios para recoger datos e información generada por los usuarios
Además, dichos datos se convierten en contenido del propio sitio Web
¡ Aplicaciones centradas en los usuarios que participan activamente en la
elaboración de contenidos
¡ Web de lectura/escritura (Read-Write Web)
¡ El término Web 2.0 fue acuñado por Darcy DiNucci 1999
¡ Tim O’reilly, O’Reilly Media Web 2004
26
[Fuente: Darcy DiNucci, Fragmented Future, Design and New Media, 1999]
[Fuente: Tim O’Reilly, What is Web 2.0. Design Patterns and Business Models for
the Next Generation of Software, 30 septiembre de 2005]
27. Web social (Web 2.0)
Wikipedia
¡ Creada en el 2001
¡ Una de las fuentes de
información no
estructurada más usada
¡ Compuesta de artículos
¡ Múltiples versiones o
capítulos (una por
lengua)
27
29. Web social (Web 2.0)
Características
¡ En auge 2004-2011:
¡ Blogger 1999
¡ Facebook 2004
¡ YouTube 2005
¡ Twitter 2006
¡ Nuevos modelos de negocio
29
30. Web social (Web 2.0)
Características
¡ Búsqueda de información:
¡ El volumen de contenido en la Web crece exponencialmente y llega a ser tal la
cantidad de sitios web y páginas que resulta compleja la localización de la
información y datos (a pesar de estar disponibles)
¡ Necesidad de escalar sistemas de búsqueda (buscadores distribuidos vs
buscadores centralizados, escalabilidad horizontal vs escalabilidad vertical)
¡ Buscadores específicos (para un determinado tema) en contraposición a los
buscadores generalistas (por ejemplo Google o Bing): buscadores verticales vs.
buscadores de propósito general u horizontales
¡ Ejemplos: Google Schoolar, Infojobs, etc.
30
31. Web social (Web 2.0)
Ataques, amenazas y vulnerabilidades
¡ Necesidad de contrastar la información y analizar la confianza de las
fuentes de los datos:
¡ Ejemplo: La tarde que (no) murió Raphael, El mundo, 12 de mayo de 2014
31
Fuente: Wikipedia
32. Web social (Web 2.0)
Ataques, amenazas y vulnerabilidades
¡ Necesidad de contrastar la información y analizar la confianza de las
fuentes de los datos:
¡ Ejemplo: How to Charge an iPod with an Onion (2007)
https://www.youtube.com/watch?v=k8VKs7fx0Fk
32
33. Web social (Web 2.0)
Ataques, amenazas y vulnerabilidades
¡ Dificultad de localización de contenidos, especialmente cuando no se
busca lo que busca la mayoría de los usuarios
¡ Ejemplo: mouse price en Google
33
34. Web social (Web 2.0)
Ataques, amenazas y vulnerabilidades
¡ Dificultad de localización de contenidos a pesar de estar disponibles
¡ Web oculta o profunda (Hidden Web o Deep Web)
34
35. Web social (Web 2.0)
Ataques, amenazas y vulnerabilidades
¡ Web oculta o profunda (Hidden Web o Deep Web)
35
36. Web semántica (Web 3.0)
Características
¡ Objetivo:
¡ Una Web orientada a máquinas y personas y no sólo a personas como la Web
tradicional y social
¡ Una Web en la que los agentes SW puedan interactuar de forma automática y
procesar, integrar y reusar información de distintos sitios Web para lograr sus
objetivos
¡ Supone una revolución tecnológica en años posteriores (cambio de filosofía y uso)
36
37. Web semántica (Web 3.0)
Características
¡ El término fue acuñado por Tim Berners Lee, Jim Hendler y Ora Lassila
en 2001
¡ Web de lectura, escritura y ejecución (Read-Write and Executed Web)
¡ [Fuente: Tim Berners-Lee, Jim Hendler, Ora Lassila. The semantic web. Scientific
American, 284(5): 34–43, mayo de 2001]
¡ Ejemplo: Solicitar una cita médica para un familiar
¡ Preguntas:
• ¿Qué? Establecer cita médica
• ¿Para quién? Para un familiar
• ¿Cuándo? Lo antes posible
37
38. Web semántica (Web 3.0)
Características
¡ Ejemplo
¡ Búsqueda de compañías médicas a las que puedo acceder
¡ Qué cuadro médico ofrece
38
39. Web semántica (Web 3.0)
Características
¡ Ejemplo: Qué cuadro médico se encuentra en un sitio cercano
39
40. Web semántica (Web 3.0)
Características
¡ Ejemplo: Compara las agendas de médicos seleccionados y agenda del
paciente para determinar que médico ofrece la cita lo antes posible en la
disponibilidad horaria
40
41. Web semántica (Web 3.0)
Características
¡ Ejemplo: Formalizar la solicitud de la cita, reservar el hueco en la agenda de
médico y paciente e incluso cargar la ruta de cómo llegar al centro médico en el
dispositivo GPS del coche y del teléfono móvil en caso de que el transporte
público no sea la opción más recomendable
41
42. Web semántica (Web 3.0)
Características
¡ No persigue tirar todo lo existente sino un cambio tecnológico incremental
basado en tres pilares fundamentales:
¡ Anotación (etiquetar) de recursos con metadatos
¡ Ontologías o vocabularios estandarizados comunes
¡ Uso de reglas y razonadores (motores de inferencia) para deducir nuevos
datos que permitan tomar decisiones
42
43. Web semántica (Web 3.0)
Características: Anotación semántica
43
Nombre de persona
Fecha de nacimiento de una persona
44. Web semántica (Web 3.0)
Características: Anotación semántica
44
Nombre de persona
Fecha de nacimiento de una persona
45. Web semántica (Web 3.0)
Características: Tecnologías para la anotación de recursos Web
¡ Integrar información semántica en las páginas web y
realizar anotaciones:
¡ RDFa estandarizado 17/03/2015
¡ Recuperar información semántica:
¡ SPARQL estandarizado 15/01/2008 (actualizado
21/03/2013)
45
47. Web semántica (Web 3.0)
Características: Ontologías
¡ No resulta útil que cada desarrollador de contenidos utilice su propio
vocabulario para realizar la anotación persigue tirar:
¡ Ontologías o vocabularios estandarizados comunes
¡ Ejemplo: FOAF (Friend Of A Friend) foaf:name, foaf:familyName, foaf:age
47
48. Web semántica (Web 3.0)
Características: Ontologías
¡ FOAF (Friend Of A Friend) foaf:name, foaf:familyName, foaf:age
48
52. Web semántica (Web 3.0)
Características: Reglas Razonadores
¡ Motores de inferencia automáticos
¡ Ejemplo: Ratón es un animal y los animales son seres vivos entonces un ratón es
un ser vivo
¡ Motores de razonamiento (razonadores)
¡ Pellet (gratuito, Java)
¡ Racer-Pro
¡ Hermet
¡ Fact++
¡ Productos comerciales y libres de redes bayesianas
52
54. Web semántica (Web 3.0)
Inicios de la Web semántica: La web de datos
¡ Aplicación que demostró la viabilidad de la Web Semántica
¡ Objetivo:
¡ Hacer accesible a los agentes software la información disponible en las
cajas de información de Wikipedia
¡ Integran información de diversos sitios web
¡ http://wiki.dbpedia.org
54
55. Web semántica (Web 3.0)
La web de datos enlazados: DBpedia
55
Alan_Turing Born 06/23/1912
Alan_Turing Died 06/07/1954
Alan_Turing Born_Place_Maida_Vale
Alan Turing Died_Place Wilmslow
…
56. Web semántica (Web 3.0)
Inicios de la Web semántica: La web de datos enlazados
¡ El término Dato Enlazado (Linked Data) fue acuñado por Christian Bizer, Tom
Heath y Tim Berners-Lee en 2009
¡ Tres reglas:
¡ Definir una URI para cada entidad:
• p.e.: es.dbpedia.org/pageZaragoza
¡ Formato estándar para mostrar información de la URI mediante http:
• URI ”deferenciables”
¡ Relacionar ese dato con otros:
• Establecer relaciones entre URIs de diferentes
fuentes de datos (p.e., sinonimia)
[http://video-subtitle.tedcdn.com/talk/podcast/2009/None/TimBernersLee_2009-480p-es.mp4
Fuente: Christian Bizer, Tom Heath, Tim Berners-Lee. Linked data - the story so far.
International Journal Semantic Web and Information Systems, 5(3):1–22, 2009]
56
57. Web semántica (Web 3.0)
Inicios de la Web semántica: La web de datos enlazados
¡ URIS ”deferenciables”
57
58. Web semántica (Web 3.0)
Inicios de la Web semántica: La web de datos enlazados
¡ Relacionar datos de una fuente de dominio específica con datos de otras fuentes
(datos de diferentes fuentes enlazados entre sí)
58
2007
64. Web semántica (Web 3.0)
Inicios de la Web semántica: La web de datos enlazados
¡ Imágenes extraídas del proyecto: http://lod-cloud.net/ [DataHub]
¡ Imagen extraída del curso visualización de datos de Laura Po:
64
65. Web semántica (Web 3.0)
Interfaces de usuario basadas en voz
65
Google
Home
Alexa Cortana
66. ¿Cuál es la próxima generación? (Web 4.0)
Inicios de la Web semántica: La web de datos enlazados
66
67. ¿Cuál es la próxima generación? (Web 4.0)
Inicios de la Web semántica: La web de datos enlazados
¡ “The next step is not realy a new version, but is a alternate version of what we
already have. Web needed to adapt to it’s mobile surroundings. Web 4.0
connects all devices in the real and virtual world in real-time”
[Fuente: https://flatworldbusiness.wordpress.com/flat-education/previously/web-
1-0-vs-web-2-0-vs-web-3-0-a-bird-eye-on-the-definition/]
¡ La Web en la que no haga falta preguntar a buscadores de información. En base
a información del contexto que detecten las necesidades de los usuarios y se les
ofrezcan recomendaciones (aproximación push)
[Fuente: https://www.paradigmadigital.com/portfolio/web-4-0/ ]
¡ La Web donde la información se encuentre geo-localizada
¡ 3D Web
¡ La Web de las emociones (emotional Web)
67
68. ¿Cuál es la próxima generación? (Web 4.0)
Inicios de la Web semántica: La web de datos enlazados
¡ La información se captura de sensores y se le ofrece a los usuarios en función de
sus emociones (Brain Computer Intefaces)
¡ “It is the environment where every aspect is holographic, including senses. In web
5.0 we are able to interact using special suits using holograms meeting with other
holograms in a virtual but very real world”
[Fuente: http://rayvandenbel.weebly.com/web-10---web-50-evolution.html]
¡ El holograma de Hugh Jackman protagoniza en España una rueda de prensa
histórica
[Fuente: https://www.youtube.com/watch?v=nFObdfYth7I ]
68
Fuente: BITBRAIN
69. Bibliografía y referencias
¡ Tim Berners-lee, Robert Cailliau, Bernd Pollermann; World-Wide Web: The
information universe, Communications of the ACM, 37:76–82, 1992
¡ Tim Berners-Lee, Jim Hendler, Ora Lassila; The Semantic Web, Scientific
American, 284(5):34–43, mayo de 2001
¡ Darcy DiNucci; Fragmented Future, Print 53(4):32+ 1999
¡ Tim O’Reilly; What is Web 2.0. Design patterns and Business models for the
next generation of software, septiembre de 2005
¡ Christian Bizer, Tom Heath, Tim Berners-Lee; Linked data - the story so far,
International Journal Semantic Web and Information Systems, 5(3):1–22, 2009
69
70. Bibliografía y referencias
¡ RDF, W3C: https://www.w3.org/RDF/ [Fecha de último acceso: 5 de febrero de 2017]
¡ RDF Schema 1.1, W3C Recommendation 25th February 2014: https://www.w3.org/TR/rdf-schema [Fecha de
último acceso: 5 de febrero de 2017]
¡ XML RDF W3C Schools: http://www.w3schools.com/xml/xml_rdf.asp [Fecha de último acceso: 5 de febrero
de 2017]
¡ RDF Tutorial, W3C Schools: http://w3schools.sinsixx.com/rdf/rdf_schema.asp.htm [Fecha de último acceso: 5
de febrero de 2017]
¡ Servicio de validación de RDF del W3C: https://www.w3.org/RDF/Validator/ [Fecha de último acceso: 5 de
febrero de 2017]
¡ SPARQL Query Language for RDF, W3C Recommendation 15th January 2008: https://www.w3.org/TR/rdf-
sparql-query/ [Fecha de último acceso: 5 de febrero de 2017]
¡ SPARQL 1.1 Query Language W3C Recommendation 21st March 2013: https://www.w3.org/TR/sparql11-query/
[Fecha de último acceso: 2 de octubre de 2017]
70
71. Bibliografía y referencias
¡ RDFa Core 1.1 - Third Edition, W3C Recommendation 17th March 2015:
https://www.w3.org/TR/rdfa-syntax/ [Fecha de último acceso: 2 de octubre de
2017]
¡ OWL Web Ontology Language Semantics and Abstract Syntax, W3C
Recommendation 10 February 2004 https://www.w3.org/TR/owl-semantics/ [Fecha
de último acceso: 2 de octubre de 2017]
¡ OWL 2 Web Ontology Language Document Overview (Second Edition), W3C
Recommendation 11 December 2012 https://www.w3.org/TR/owl2-overview/
[Fecha de último acceso: 2 de octubre de 2017]
¡ Laura Po, curso “Linked Data Visualization”, 3ª International Keystone Training
School on Keyword Search on Big linked Data, Viena, agosto de 2017.
71
72. La Web y la búsqueda de información: de
sólo leer al uso de la voz y sistemas de
videoconferencia
Raquel Trillo-Lado
12/07/2018