Este documento compara HTML y XML. HTML es un lenguaje de marcas utilizado para crear páginas web, mientras que XML es un metalenguaje que permite definir lenguajes personalizados para estructurar datos. A diferencia de HTML que mezcla información y formato, XML separa ambos aspectos para facilitar el procesamiento de la información.
2. HTML
El HTML, Hyper Text Markup Language (Lenguaje
de marcación de Hipertexto) es el lenguaje de
marcas de texto utilizado normalmente en la www
(World Wide Web). Estos documentos pueden ser
mostrados por los visores o "browsers" de paginas
Web en Internet, como Netscape Navigator,
Mosaic, Opera yMicrosoft Internet Explorer.
3. …
El entorno para trabajar HTML es simplemente
un procesador de texto, como el que ofrecen
los sistemas operativos Windows (Bloc de
notas), UNIX(el editor vi o ed) o el que ofrece
MS Office (Word).
El conjunto de etiquetas que se creen, se deben
guardar con la extensión .htm o .html
4. Una forma de entender rápidamente la estructura de un
documento XML, es viendo un pequeño ejemplo:
<?xml version="1.0"?>
<!DOCTYPE MENSAJE SYSTEM "mensaje.dtd">
<mensaje>
<remite>
<nombre>Alfredo Reino</nombre>
<email>alf@ibium.com</email>
</remite>
<destinatario>
<nombre>Bill Clinton</nombre>
<email>president@whitehouse.gov</email>
</destinatario>
<asunto>Hola Bill</asunto>
<texto>
<parrafo>¿Hola qué tal? Hace
<enfasis>mucho</enfasis> que no escribes. A
ver si llamas y quedamos para tomar
algo.</parrafo>
</texto>
</mensaje>
5. XML(Lenguajede MarcasExtensible, Extensible MarkupLanguage)
XML es un lenguaje de marcas que ofrece un formato para
la descripción de datos estructurados, el cual conserva
todas las propiedades importantes del SGML.
XML es un metalenguaje, dado que con él podemos definir
nuestro propio lenguaje de presentación y, a diferencia del
HTML, que se centra en la representación de la
información, XML se centra en la información en si misma.
La particularidad más importante del XML es que no posee
etiquetas prefijadas con anterioridad, ya que es el propio
diseñador el que las crea a su antojo, dependiendo del
contenido del documento.
6. De esta forma, los documentos XML con
información sobre libros deberían tener etiquetas
como <AUTOR>, <EDITORIAL>,
<Nº_DE_PÁGINAS>, <PRECIO>, etc., mientras que
los documentos XML relacionados con educación
incluyen etiquetas del tipo de <ASIGNATURA>,
<ALUMNO>, <CURSO>, <NOTA>, etc.
7. Un documento escrito en HTML
contendría básicamente las siguientes
etiquetas :
<HTML> Indica el inicio del documento.
<HEAD> Inicio de la cabecera.
<TITLE> Inicio del título del documento.
</TITLE> Final del título del documento.
</HEAD> Final de la cabecera del
documento.
<BODY> Inicio del cuerpo del
documento.
</BODY> Final del cuerpo del
documento.
</HTML> Final del documento.
8. Este mismo documento puede ser visto de forma gráfica, para
comprender mejor la estructura de un documento XML.
9. Diferencias entre HTML y XML
Tenemos que saber que tanto el XML como el HTML tienen
su base en el SGML.
El SGML (Standard Generalized Markup Language, ISO
8879) es el estándar internacional para la definición de la
estructura y el contenido de diferentes tipos de
documentos electrónicos. Es decir, es un metalenguaje que
nos permite definir lenguajes para definir la estructura y el
contenido de nuestros documentos.
10. ¿Cuál es la diferencia entre ambos?
La diferencia fundamental entre HTML y XML es
que el primero, como ya se mencionó, es
SIMPLEMENTE UN LENGUAJE, y el segundo es UN
METALENGUAJE.
12. Procesar la información en HTML es inviable, por estar
mezclada con los estilos y las etiquetas que formatean la
información.
En XML se puede procesar la información con mucha
facilidad, porque todo está ordenado de una manera
lógica, así mismo el formateo de la información para que
se pueda entender bien por el usuario es viable a través de
un pequeño procesamiento, a través de hojas de estilos o
similares.