2. DIFERENCIA ENTRE HTML Y XML
El HTML se preocupa por formatear datos y para ello son las etiquetas que
tiene el lenguaje, para formatear la información que se desea mostrar.
El XML se preocupa por estructurar la información que pretende almacenar. La
estructura la marca la lógica propia de la información.
El desarrollo del HTML estuvo marcado la competencia entre los distintos
visores del mercado. Cada uno quería ser el mejor e inventaba etiquetas
nuevas que a la larga entraban a formar parte del estándar del W3C, como la
etiqueta <FRAME>.
El desarrollo del XML está siendo llevado a cabo con rigor, siempre ajustado a
lo que marca el estándar que desarrolla el W3C, entidad que está
desarrollando el XML con más diligencia que las empresas con intereses
particulares.
Procesar la información en HTML es inviable, por estar mezclada con los
estilos y las etiquetas que formatean la información.
3. En XML se puede procesar la información con mucha facilidad, porque todo
está ordenado de una manera lógica, así mismo el formateo de la información
para que se pueda entender bien por el usuario es viable a través de un
pequeño procesamiento, a través de hojas de estilos o similares.
4. Las diferencias entre el HTML y el XML son a la vez mínimas e
inmensas. Para entenderlas mejor tenemos que saber que tanto el
XML como el HTML tienen su base en el SGML.
El SGML (Standard Generalized Markup Language, ISO 8879) es
el estándar internacional para la definición de la estructura y el
contenido de diferentes tipos de documentos electrónicos. Es
decir, es un metalenguaje que nos permite definir lenguajes para
definir la estructura y el contenido de nuestros documentos.
La definición de la estructura y el contenido de un tipo de documento
se realiza en una DTD. En ella definimos los elementos que
conformarán ese tipo de documentos y como tienen que estar
organizados para que sea correcto. Un ejemplo de DTD es la que
define cómo tendrán que ser los documentos HTML. Por tanto, el
HTML no es más que un tipo de documento SGML que se utiliza en
la Web, y esto es importante, ya que aquí radica su principal
diferencia con el XML.
5. El XML no es ningún tipo de documento SGML, sino que es una versión
abreviada de SGML optimizada para su utilización en Internet. Esto significa que
con él vamos a poder definir nuestros propios tipos de
documentos (podremos definir nuestras propias etiquetas) y, por tanto, ya no
dependeremos de un único e inflexible tipo de documento HTML. Por ello, la
primera y más importante diferencia entre le HTML y el XML, es que el HTML
es un lenguaje, mientras que el XML es un metalenguaje. Esto permite crear
nuestras etiquetas.
Por ejemplo, si queremos colocar información en nuestra Web sobre un libro
podríamos hacerlo de esta manera:
<libro>
<titulo>El Quijote</titulo>
<autor>Cervantes</autor>
<precio moneda="euro">20</precio>
<portada nombre="portada" tipo="gif"/>
<video nombre="quijote" tipo="avi" duracion="30"/>
</libro>
En lugar de:
<div>
<p><b><font size="4">El Quijote</font></b></p>
<p><i>Cervantes</i> ~ <font color="red">20 euros</font></p>
<center><img src="portada.gif"></center>
<p><a href="quijote.avi">Video promocional</a> ~ Duración 30 segundos.</p>
</div>
6. XML y HTML son lenguajes muy diferentes. Ambos nacen de la misma
inspiración llamada SGML por lo que su sintaxis es similar, aunque cada uno
fue diseñado para cumplir distintas funciones:
El XML (eXtensive Markup Language) es un lenguaje que fue concebido para
describir información. Su función principal es ayudarnos a organizar
contenidos y eso hace que los documentos XML sean portables hacia
diferentes tipos de aplicaciones.
El HTML (HyperText Markup Language) por otro lado ha sido concebido para
mostrar información, determinar como actúa y que hace. Su función radica en
ayudarnos a darle formato a los diversos contenidos de una página.
7. Resumiendo, el XML sirve para describir información y el HTML sirve para darle
formato y presentarla a través de un navegador. O sea que el XML no es ni será
nunca un reemplazo del HTML sino un complemento que sirve para manejar la
información separada del formato.
Un dato importante es que al hablar de XML hablamos de documentos bien
formados (well formed). Mientras en HTML podemos ser desordenados:
<P><B><i>Este texto estará en negritas e itálicas</b></I><BR>, en XML
tenemos que respetar los tags. Todos deberán ser anidados correctamente:
<TagA><TagB>Contenidos</TagB></TagA>. Algo muy importante es que son
"case sensitive" de tal forma que <B> no es lo mismo que <b> sino son dos tags
diferentes. También debemos presetar atención importante a que todos los tags
deben ser cerrados. Si usamos un tag independiente como el <br> o <hr>, lo
cerramos incluyéndole un diagonal al final: <br />, <hr />. Por lo anterior, el XML
está ayudando a que seamos más ordenados y respetemos el lenguaje que
gracias a la tolerancia de los navegadores ha ido decayendo.
8. Otra característica del XML es que es un lenguaje que puede extenderse. Al trabajar
con documentos XML podemos determinar nuestros propios tags y estructura de
documentos para trabajar. En XML el tag <christian></christian> es válido por que yo lo
puedo definir y utilizar sin ningún problema. Por otro lado en el HTML todos los tags ya
han sido predefinidos y son parte del estándar HTML definido por el W3C.
¿Hacia donde van el XML y el HTML?
A pesar de que el HTML tiene sus definiciones, la tolerancia de los navegadores ha
hecho que documentos mal formados funcionen. Por ello nace el esfuerzo de juntar lo
mejor de los dos lenguajes que hemos analizado para pensar a futuro en XHTML. El
XHTML (eXtensive HyperText Markup Language) es una familia de tipos de documentos
y módulos que reproducen, definen y extienden el HTML reformulando gracias al XML.
9. Las diferencias entre el HTML y el XML son a la vez mínimas e inmensas. Para
entenderlasmejor tenemos que saber que tanto el XML como el HTML tienen su
base en el SGML. El SGML (StandardGeneralized MarkupLanguage, ISO
8879) es elestándar internacional para ladefinición de la estructura y
elcontenido de diferentes tipos dedocumentos electrónicos
10. El XML es una adaptación del SGML (Standard Generalized Markup
Language), un lenguaje que permite la organización y el etiquetado
dedocumentos. Esto quiere decir que el XML no es un lenguaje en sí
mismo, sino un sistema que permite definir lenguajes de acuerdo a
las necesidades. ElXHTML, el MathML y el SVG son algunos de los lenguajes
que el XML está en condiciones de definir.
Los expertos nombran varias ventajas que derivan de la utilización del XML.
Es extensible (se pueden añadir nuevas etiquetas tras el diseño del
documento), su analizador es estándar (no requiere de cambios para cada
versión del metalenguaje) y facilita el análisis y procesamiento de los
documentos XML creados por terceros.
11. Los elementos son la estructura básica de HTML. Los elementos tienen dos
propiedades básicas: atributos y contenido. Cada atributo y contenido tiene ciertas
restricciones para que se considere válido al documento HTML. Un elemento
generalmente tiene una etiqueta de inicio (por ejemplo, <nombre-de-elemento>) y
una etiqueta de cierre (por ejemplo, </nombre-de-elemento>). Los atributos del
elemento están contenidos en la etiqueta de inicio y el contenido está ubicado
entre las dos etiquetas (por ejemplo, <nombre-de-elemento
atributo="valor">Contenido</nombre-de-elemento>). Algunos elementos, tales
como <br>, no tienen contenido ni llevan una etiqueta de cierre. Debajo se listan
varios tipos de elementos de marcado usados en HTML.
Estructura general de una línea de código en el lenguaje de etiquetas HTML.
El marcado estructural describe el propósito del texto. Por ejemplo, <h2>Golf</h2>
establece «Golf» como un encabezamiento de segundo nivel, el cual se mostraría
en un navegador de una manera similar al título «Marcado HTML» al principio de
esta sección. El marcado estructural no define cómo se verá el elemento, pero la
mayoría de los navegadores web han estandarizado el formato de los elementos.
Puede aplicarse un formato específico al texto por medio de hojas de estilo en
cascada.
12. Códigos HTML básicos
<html>: define el inicio del documento HTML, le indica al navegador que lo que viene a
continuación debe ser interpretado como código HTML. Esto es así de facto, ya que en
teoría lo que define el tipo de documento es el DOCTYPE, que significa la palabra justo
tras DOCTYPE el tag de raíz.
<script>: incrusta un script en una web, o llama a uno mediante src="url del script". Se
recomienda incluir el tipo MIME en el atributo type, en el caso de JavaScript
text/javascript.
<head>: define la cabecera del documento HTML; esta cabecera suele contener
información sobre el documento que no se muestra directamente al usuario como, por
ejemplo, el título de la ventana del navegador. Dentro de la cabecera <head> es posible
encontrar:
Un ejemplo de código HTML con coloreado de sintaxis.
<title>: define el título de la página. Por lo general, el título aparece en la barra de título
encima de la ventana.
<link>: para vincular el sitio a hojas de estilo o iconos. Por ejemplo:<link rel="stylesheet"
href="/style.css" type="text/css">.
<style>: para colocar el estilo interno de la página; ya sea usando CSS u otros
lenguajes similares. No es necesario colocarlo si se va a vincular a un archivo externo
usando la etiqueta <link>.
<meta>: para metadatos como la autoría o la licencia, incluso para indicar parámetros
http (mediante http-equiv="") cuando no se pueden modificar por no estar disponible la
configuración o por dificultades con server-side scripting.
13. <?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE Edit_Mensaje SYSTEM "Edit_Mensaje.dtd">
<Edit_Mensaje>
<Mensaje>
<Remitente>
<Nombre>Nombre del remitente</Nombre>
<Mail> Correo del remitente </Mail>
</Remitente>
<Destinatario>
<Nombre>Nombre del destinatario</Nombre>
<Mail>Correo del destinatario</Mail>
</Destinatario>
<Texto>
<Asunto>
Este es mi documento con una estructura muy sencilla
no contiene atributos ni entidades...
</Asunto>
<Parrafo>
Este es mi documento con una estructura muy sencilla
no contiene atributos ni entidades...
</Parrafo>
</Texto>
</Mensaje>
</Edit_Mensaje>
14. Atributos de HTML y XML
Los elementos pueden tener atributos, que son una manera de incorporar
características o propiedades a los elementos de un documento. Deben ir entre
comillas.
Por ejemplo, un elemento «estudiante» puede tener un atributo «Mario» y un
atributo «tipo», con valores «come croquetas» y «taleno» respectivamente.
<Estudiante Mario="come croquetas" tipo="taleno">Esto es un día que Mario va
paseando…</Estudiante>