2. Introducción ¿Qué es XML?
XML eXtensible Markup Language (Lenguaje Extensible de
Marcas)
Lenguaje abierto, estándar (W3 Consortium) derivado de
SGML, optimizado para su uso en la WWW.
Permite describir el sentido o la semántica de los datos.
El XML, a diferencia del HTML, separa el contenido de la
presentación.
XML es un Meta-Lenguaje, que permite la definición de
lenguajes concretos de representación de documentos.
3. ¿Qué no es XML?
XML no es una “versión mejorada de
HTML”.
XML no es un lenguaje para hacer mejores
páginas web.
XML no es “difícil”.
4. Inconvenientes generales de HTML
Está diseñado para presentar información
directamente a los humanos, y esto sin duda es
algo bueno, pero es un lenguaje complicado de
procesar para los programas informáticos.
No es bueno porque no indica lo que está
representando, se preocupa principalmente de que
eso tiene que ir en azul, o con un tipo de letra
determinada, pero no te dice que lo que está
mostrando es el título de un libro o el precio de un
artículo.
5. Problemas de HTML
Define más la presentación que el
contenido.
No es fácilmente procesable por “máquinas”.
Su estructura es “caótica”.
Su interpretación es ambigua según el
software utilizado.
Su uso es la web.
6. Introducción
La idea que subyace bajo el XML es la de
crear un lenguaje muy general que sirva
para muchas cosas.
El XML describe el contenido de lo que
etiqueta.
Cualquier programa de informática puede
trabajar más eficientemente sobre XML que
HTML.
7. ¿Por qué XML?
Es un estándar.
No pertenece a ninguna compañía y su
utilización es libre.
Permite la utilización efectiva de Internet.
9. Características
Utilizo mis propias etiquetas.
La sintaxis es estricta. La especificación XML
determina claramente una serie de reglas que
especifican cuando un documento está bien
formado.
La utilización de una DTD (no es necesario, pero sí
recomendable).
Los elementos vacíos. La propia etiqueta de inicio
llevará una contrabarra al final que los identificará.
10. Ventajas de XML
Un estándar libre.
Un lenguaje extensible.
Fácilmente procesable por humanos y software.
Una tecnología ya implantada en el mercado.
Diseñado para ser utilizado en cualquier lenguaje o
alfabeto.
Separa el contenido de su representación.
11. Ventajas de XML
Un documento muchas formas de
representacíón
HTML
WML
XML RTF
PDF
12. Ventajas de XML
Formato ideal para transacciones B2B.
Permite la aplicación de técnicas de
extracción de información y minería de
datos.
Las estrictas reglas para la composición de
un documento XML permiten su fácil análisis
sintáctico.
13. Reseña histórica
Desarrollado a partir de 1996, como
subconjunto de SGML.
Adoptado como estándar en Febrero 1998
por el World Wide Web Consortium (W3C)
14. World Wide Web Consortium (W3C)
Constituido en 1994 con el objetivo de desarrollar
protocolos comunes para la evolución de Intermet.
Es un consorcio de industrias internacionales, y
está participado por el MIT (EEUU), INRIA
(Francia), y Keio University (Japón).
Cuenta con el soporte oficial de DARPA (EEUU) y
la Comisión Europea.
15. Terminología
XML eXtended Mark-up Language
SGML Standard Generalised Mark-up Language
XML "bien-formado"
Validación
DTD Document Type Definition
Schema
XSL eXtended Stylesheet Language
Parser Analizador sintáctico
16. Terminología
Elemento
Atributo
DOM Document Object Model
RDF Resource Description Frarnework
XLink, XPointer
SML Simple Mark-up Language
SMIL
XHTML
17. Tecnologías XML
Especificación XML v1.0
Definición de documentos DTD o Schemas
Definición de estilos XSL=XSLT+Xpath
Enlazado de documentos XLL=XLink+XPointer
Aplicaciones RDF, SMIL, HTML, etc.
18. ¿Cómo construir documentos XML?
Los fundamentos del XML son muy sencillos
y en principio, para ir empezando, las únicas
herramientas que nos harán falta son:
Un editor de textos, con el que escribir nuestros
documentos XML (el notepad en Windows y el
xemacs en Linux)
Un procesador o parser XML (Explorer 5.X,
Mozilla, XMLWriter)
20. Estructura de un documento XML
Aunque a primera vista, un documento XML puede
parecer similar a HTML, hay una diferencia
principal.
Un documento XML contiene datos que se
autodefinen, exclusivamente.
Un documento HTML contiene datos mal definidos,
mezclados con elementos de formato.
En XML se separa el contenido de la presentación
de forma total.