1. COMO SE DIFERENCIA EL XML
DEL HTML
Si ya conoces el funcionamiento del HTML, te será muy fácil
entender el XML con esta comparación. Además conocerásel
resultado de su fusión denominado XHTML.
XML y HTML son lenguajes muy diferentes. Ambos nacen de la
misma inspiración llamada SGML por lo que su sintaxis es
similar, aunque cada uno fue diseñado para cumplir distintas
funciones:
El XML (eXtensiveMarkupLanguage) es un lenguaje que fue
concebido para describir información. Su función principal es
ayudarnos a organizar contenidos y eso hace que los documentos
XML sean portables hacia diferentes tipos de aplicaciones.
El HTML (HyperTextMarkupLanguage) por otro lado ha sido
concebido para mostrar información, determinar como actúa y
que hace. Su función radica en ayudarnos a darle formato a los
diversos contenidos de una página.
2. Un dato importante es que al hablar de XML hablamos de
documentos bien formados (wellformed). Mientras en HTML
podemos ser desordenados: <P><B><i>Este texto estará en
negritas e itálicas</b></I><BR>, en XML tenemos que respetar
los tags. Todos deberán ser anidados correctamente:
<TagA><TagB>Contenidos</TagB></TagA>. Algo muy
importante es que son “case sensitive” de tal forma que <B> no es
lo mismo que <b> sino son dos tags diferentes. También debemos
presetar atención importante a que todos los tags deben ser
cerrados. Si usamos un tag independiente como el <br> o <hr>, lo
cerramos incluyéndole un diagonal al final: <br />, <hr />. Por lo
anterior, el XML está ayudando a que seamos más ordenados y
respetemos el lenguaje que gracias a la tolerancia de los
navegadores ha ido decayendo.
3. ¿HACIA DONDE VAN EL XML Y EL HTML?
A pesar de que el HTML tiene sus definiciones, la tolerancia de los
navegadores ha hecho que documentos mal formados funcionen.
Por ello nace el esfuerzo de juntar lo mejor de los dos lenguajes
que hemos analizado para pensar a futuro en XHTML. El XHTML
(eXtensiveHyperTextMarkupLanguage) es una familia de tipos de
documentos y módulos que reproducen, definen y extienden el
HTML reformulando gracias al XML.
Para explicarlo de forma más sencilla, se busca definir estándares
en el lenguaje que le da formato a la información, pero con tags
bien formados, correctamente anidados y que nos permitan
navegar a través de la información de forma comprensible y
sencilla. El XHTML debe ser desde ya una meta para todos
nuestras páginas web. Los invito a que a través del servicio de
validación de documentos del W3C revisen sus páginas y vean que
podrían mejorar para estar conforme a los estándares.
4. QUE ES XML, Y SUS DIFRENCIAS CON HTML:
Las diferencias entre el HTML y el XML son a la
vez mínimas e inmensas. Para entenderlas mejor
tenemos que saber que tanto el XML como el HTML
tienen su base en el SGML.
El SGML (Standard
GeneralizedMarkupLanguage, ISO 8879) es el
estándar internacional para la definición de la
estructura y el contenido de diferentes tipos de
documentos electrónicos. Es decir, es un
metalenguaje que nos permite definir lenguajes para
definir la estructura y el contenido de nuestros
documentos.
5. La definición de la estructura y el contenido de un tipo de documento
se realiza en una DTD. En ella definimos los elementos que
conformarán ese tipo de documentos y como tienen que estar
organizados para que sea correcto. Un ejemplo de DTD es la que
define cómo tendrán que ser los documentos HTML. Por tanto, el
HTML no es más que un tipo de documento SGML que se utiliza en
la Web, y esto es importante, ya que aquí radica su principal
diferencia con el XML.
6. El XML no es ningún tipo de documento SGML, sino que es
una versión abreviada de SGML optimizada para su
utilización en Internet. Esto significa que con él vamos a
poder definir nuestros propios tipos de documentos
(podremos definir nuestras propias etiquetas) y, por
tanto, ya no dependeremos de un único e inflexible tipo de
documento HTML. Por ello, la primera y más importante
diferencia entre le HTML y el XML, es que el HTML es
un lenguaje, mientras que el XML es un metalenguaje.
Esto permite crear nuestras etiquetas.
7. Por ejemplo, si queremos colocar información en nuestra Web sobre
un libro podríamos hacerlo de esta manera:
<libro>
<titulo>El Quijote</titulo>
<autor>Cervantes</autor>
<precio moneda="euro">20</precio>
<portada nombre="portada" tipo="gif"/>
<video nombre="quijote" tipo="avi" duracion="30"/>
</libro>
En lugar de:
<div>
<p><b><fontsize="4">El Quijote</font></b></p>
<p><i>Cervantes</i> ~ <font color="red">20 euros</font></p>
<center><imgsrc="portada.gif"></center>
<p><a href="quijote.avi">Video promocional</a> ~ Duración 30
segundos.</p>
</div>
8. DIFRENCIA
Para los que conozcan también el lenguaje HTML, que espero que seáis muchos, he compilado
aquí una serie de diferencias entre HTML y XML que sirven de muestra para ver hasta dónde
llegan estos dos lenguajes.
El HTML se preocupa por formatear datos y para ello son las etiquetas que tiene el
lenguaje, para formatear la información que se desea mostrar.
El XML se preocupa por estructurar la información que pretende almacenar. La estructura la
marca la lógica propia de la información.
El desarrollo del HTML estuvo marcado la competencia entre los distintos visores del
mercado. Cada uno quería ser el mejor e inventaba etiquetas nuevas que a la larga entraban a
formar parte del estándar del W3C, como la etiqueta <FRAME>.
El desarrollo del XML está siendo llevado a cabo con rigor, siempre ajustado a lo que marca el
estándar que desarrolla el W3C, entidad que está desarrollando el XML con más diligencia que
las empresas con intereses particulares.
Procesar la información en HTML es inviable, por estar mezclada con los estilos y las
etiquetas que formatean la información.
9. En XML se puede procesar la información con mucha
facilidad, porque todo está ordenado de una manera lógica, así
mismo el formateo de la información para que se pueda entender
bien por el usuario es viable a través de un pequeño
procesamiento, a través de hojas de estilos o similares.
10. XML y HTML son lenguajes muy diferentes. Ambos nacen
de la misma inspiración llamada SGML por lo que su
sintaxis es similar, aunque cada uno fue diseñado para
cumplir distintas funciones:
El XML (eXtensiveMarkupLanguage) es un lenguaje que fue
concebido para describir información. Su función principal
es ayudarnos a organizar contenidos y eso hace que los
documentos XML sean portables hacia diferentes tipos de
aplicaciones.
El HTML (HyperTextMarkupLanguage) por otro lado ha
sido concebido para mostrar información, determinar como
actúa y que hace. Su función radica en ayudarnos a darle
formato a los diversos contenidos de una página.
11. Resumiendo, el XML sirve para describir información y el HTML sirve
para darle formato y presentarla a través de un navegador. O sea que el
XML no es ni será nunca un reemplazo del HTML sino un complemento
que sirve para manejar la información separada del formato.
Un dato importante es que al hablar de XML hablamos de documentos bien
formados (wellformed). Mientras en HTML podemos ser desordenados:
<P><B><i>Este texto estará en negritas e itálicas</b></I><BR>, en XML
tenemos que respetar los tags. Todos deberán ser anidados correctamente:
<TagA><TagB>Contenidos</TagB></TagA>. Algo muy importante es que
son "case sensitive" de tal forma que <B> no es lo mismo que <b> sino son
dos tags diferentes. También debemos presetar atención importante a que
todos los tags deben ser cerrados. Si usamos un tag independiente como el
<br> o <hr>, lo cerramos incluyéndole un diagonal al final: <br />, <hr />.
Por lo anterior, el XML está ayudando a que seamos más ordenados y
respetemos el lenguaje que gracias a la tolerancia de los navegadores ha ido
decayendo.
12. OTRA CARACTERISTICA DEL XML
es que es un lenguaje que puede extenderse. Al trabajar con
documentos XML podemos determinar nuestros propios
tags y estructura de documentos para trabajar. En XML el
tag<christian></christian> es válido por que yo lo puedo
definir y utilizar sin ningún problema. Por otro lado en el
HTML todos los tags ya han sido predefinidos y son parte
del estándar HTML definido por el W3C.
13. ¿QUE ES HTML?
Es un lenguaje muy sencillo que permite describir hipertexto, es
decir, texto presentado de forma estructurada y agradable, con
enlaces (hyperlinks) que conducen a otros documentos o fuentes
de información relacionadas, y con inserciones multimedia
(gráficos, sonido...) La descripción se basa en especificar en el
texto la estructura lógica del contenido (títulos, párrafos de texto
normal, enumeraciones, definiciones, citas, etc.) así como los
diferentes efectos que se quieren dar (especificar los lugares del
documento donde se debe poner cursiva, negrita, o un gráfico
determinado) y dejar que luego la presentación final de dicho
hipertexto se realice por un programa especializado (como
Mosaic, o Netscape).
El lenguaje HTML (HyperTextMarkupLanguage; Lenguaje de
marcado de hipertextos), a pesar de su sencillez, es sin duda un
invento importante. Es considerado como el más exitoso
sistema de presentación de documentos desde el surgimiento de
Internet, y gracias al cual se puede publicar y acceder a mucha
información a nivel mundial.
14. Los documentos creados en HTML son visualizados
por distintos clientes, y cada uno de éstos ve los
textos de distinta manera (diversos tipos y tamaños
de letra, espacio entre líneas, y demás). Por
ejemplo, algunas PCs no soportan gráficos, por lo
que al crear se debe dar la responsabilidad a este
tipo de usuarios de que también visualicen la
información.
Cabe destacar que este lenguaje se encuentra en
continua evolución, por lo que existen
“extensiones” que amplían las posibilidades del
mismo. Hoy en día se trabaja con el estándar HTML
4.0.