SlideShare una empresa de Scribd logo
1 de 31
LENGUAJE DE MARCAS Y SISTEMAS DE
GESTIÓN DE INFORMACIÓN
XML
UT 4. XML. ALMACENAMIENTO DE DATOS
1. Introducción
2. Documentos XML
3. Estructura jerárquica de un documento XML
4. Modelo de datos de un documento XML. Nodos
5. Corrección sintáctica: documento XML bien formado
6. Documentos XML válidos
7. Validación de documentos XML con DTD
8. Validación de documentos XML con esquemas XML
9. Otros mecanismos para validar XML
10. Otros lenguajes basados en XML
11. Otras formas de almacenar información
Contenidos de la unidad
UT 4. XML. ALMACENAMIENTO DE DATOS
 El XML se trata de un formato de almacenamiento de información a base de etiquetas o marcas definidas
por el usuario.
 Por ser un lenguaje de marcas, deberá cumplir una serie de reglas que harán que esté bien formado.
 Se aprenderán mecanismos para validar un documento XML, donde se revisarán fundamentalmente dos
técnicas: los DTD y los esquemas XML
1. Introducción
UT 4. XML. ALMACENAMIENTO DE DATOS
 El XML (eXtensible Markup Language – Lenguaje de Marcado eXtensible es un estándar.
 Es un metalenguaje de marcas, es decir, no dispone de un conjunto fijo de etiquetas que todo el mundo
debe conocer, sino que permite definir a los desarrolladores los elementos que necesiten.
 Define una sintaxis general para maquetar datos con etiquetas sencillas y comprensibles al ojo humano.
 Es un formato flexible, de manera que puede ser adaptado al campo de aplicación que se desee
2. Documentos XML
UT 4. XML. ALMACENAMIENTO DE DATOS
Lo que NO es XML:
 No es un lenguaje de programación. No existen compiladores de XML que generen un ejecutable.
 No es un protocolo de comunicación. No envía datos por nosotros a través de internet
 No es un sistema gestor de bases de datos, aunque una base de datos relacional puede contener
campos del tipo XML e incluso existen bases de datos XML nativas, que todo lo que almacenan son
documentos con formato XML.
 No es propietario, es decir, no pertenece a ninguna compañía.
2. Documentos XML
UT 4. XML. ALMACENAMIENTO DE DATOS
Formato adecuado para el almacenamiento y la transmisión
 Al ser un documento de texto plano, es adecuado para almacenar información y transmitirla.
 Fáciles de editar con un editor de textos
 Son relativamente ligeros para ser almacenados y enviados
 Suelen tener extensión .xml aunque no es imprescindible.
2. Documentos XML
UT 4. XML. ALMACENAMIENTO DE DATOS
En un documento XML la información se organiza de forma jerárquica, de forma que los elementos del
documento se relacionan entre sí mediante relaciones de padres, hijos, hermanos, ascendentes,
descendentes, etc
A esta estructura jerárquica se la denomina árbol del documento XML. A las partes del árbol que tienen hijos
se las denomina nodos intermedios o ramas, mientras que a las que no tienen se les conoce como nodos
finales u hojas.
3. Estructura jerárquica de un documento XML
UT 4. XML. ALMACENAMIENTO DE DATOS
3. Estructura jerárquica de un documento XML
UT 4. XML. ALMACENAMIENTO DE DATOS
3. Estructura jerárquica de un documento XML
UT 4. XML. ALMACENAMIENTO DE DATOS
3. Estructura jerárquica de un documento XML
UT 4. XML. ALMACENAMIENTO DE DATOS
3. Estructura jerárquica de un documento XML
UT 4. XML. ALMACENAMIENTO DE DATOS
Ejemplo
El elemento <persona> es “padre” (contiene) a los elementos <nombre> y <apellido> que son “hermanos”
entre sí.
3. Estructura jerárquica de un documento XML
UT 4. XML. ALMACENAMIENTO DE DATOS
Ejercicio:
En el siguiente árbol de documento XML, identificar: los nodos “padre” con sus respectivos “hijos”, los nodos
“hermanos”, los nodos finales, los nodos ascendentes del nodo “la Mancha” y los nodos descendentes del nodo
<capítulo>
3. Estructura jerárquica de un documento XML
UT 4. XML. ALMACENAMIENTO DE DATOS
En documento XML consta de una determinada estructura, formada por los siguientes tipos de
componentes o nodos:
 Raíz: Por encima de cualquier elemento se ubica el nodo raíz, que se designa como “/”. No es un
componente que tenga representación dentro del documento XML, pero se utilizará más adelante como
punto de partida para recorrer el árbol XML y ubicar el resto de nodos.
 Elementos: Es la unidad básica de un documento XML. Se identifican por una etiqueta de apertura y una
de cierre. Lo que se ubica entre ambas es el contenido de ese elemento, que puede ser textual, otros
elementos o vacío.
4. Modelo de datos de un documento XML. Nodos.
UT 4. XML. ALMACENAMIENTO DE DATOS
Algunos tipos de elementos especiales son:
 Elemento raíz: todo documento XML bien formado debe contener un único elemento raíz que contiene a
todos los demás. También se le llama elemento documento.
 Elemento sin contenido: aunque puede tener atributos, se abre y se cierra con una sola etiqueta.
 Atributos: Son como los atributos en HTML. Permiten especificar datos adicionales de un elemento. Se
ubican en la etiqueta de apertura del elemento. Para asignar un valor a un atributo se utiliza el signo
igual. Todos los atributos, independientemente del tipo de datos que representen, se tratarán como texto
y aparecerán entre comillas simples o dobles.
4. Modelo de datos de un documento XML. Nodos.
UT 4. XML. ALMACENAMIENTO DE DATOS
 Texto: El texto puede aparecer bien como contenido de un elemento, bien como valor de un atributo. No
puede aparecer en ningún otro lugar.
Los espacios en blanco (Tabulador, Nueva línea, Retorno de carro y Espacio) son tratados de una forma especial:
 Dentro del contenido textual de un elemento se mantendrán como están y así serán tratados por el procesador.
 Como valor de un atributo, los espacios en blanco adyacentes se condensarán en uno solo
 Los espacios en blanco entre elementos serán ignorados.
4. Modelo de datos de un documento XML. Nodos.
UT 4. XML. ALMACENAMIENTO DE DATOS
 Comentarios: Son iguales que los de HTML. Empiezan por los caracteres <!-- y se cierran con los
caracteres--> Dentro de ello se puede escribir cualquier signo menos el doble guión. Pueden ubicarse en
cualquier lugar del documento excepto dentro de una etiqueta de apertura o una etiqueta de cierre.
 Espacio de nombres: es un mecanismo para distinguir etiquetas cuando se mezclan distintos
vocabularios. Se verán más adelante.
 Instrucciones de procesamiento: empiezan por <? Y terminan por ?>. Son instrucciones para el
procesador XML, de manera que son dependientes de él. No forman parte del contenido del documento
XML.
4. Modelo de datos de un documento XML. Nodos.
UT 4. XML. ALMACENAMIENTO DE DATOS
 Entidades predefinidas: Representan caracteres especiales de marcado, que son interpretados como
texto por parte del procesador XML.
4. Modelo de datos de un documento XML. Nodos.
Entidad Carácter
&amp; &
&lt; <
&gt; >
&apos; „
&quot; “
UT 4. XML. ALMACENAMIENTO DE DATOS
 Secciones CDATA: Son conjuntos de caracteres que el procesador no debe analizar. La definición de
estas secciones permite agilizar el análisis del documento y deja libertad al autor para introducir
libremente en ellas caracteres como < y &. No pueden aparecer antes del elemento raíz ni después de
su cierre. No pueden contener el propio signo delimitador del final de sección CDATA, es decir, la
combinación de caracteres ]]>
 Definición de Tipo de Documento(DTD): Permite definir reglas que fuercen ciertas restricciones sobre la
estructura de un documento XML. Un documento bien formado que tiene asociado un documento de
declaración de tipos y cumple con las restricciones allí declaradas se dice que es válido. Debe aparecer
en la segunda línea de documento XML, entre la instrucción de procesamiento inicial y el elemento raíz.
4. Modelo de datos de un documento XML. Nodos.
UT 4. XML. ALMACENAMIENTO DE DATOS
En XML se utilizan una serie de reglas para definir nombres correctos de elementos. Son las mismas que
para los atributos:
 Puede empezar con una letra (podría ser de un alfabeto no latino), subrayado o dos puntos (este último
se desaconseja)
 Los siguientes caracteres pueden ser letras, dígitos, subrayados, guiones bajos, comas y dos puntos.
 Los nombres que empiezan por las letras XML, en cualquier combinación de mayúsculas y minúsculas,
se reservan para estandarización.
 No pueden contener:
 Ningún carácter de espaciado
 Ningún otro carácter de puntuación que los ya citados como válidos (comillas, signo dólar, acento circunflejo, signo
de porcentaje…)
4. Modelo de datos de un documento XML. Nombres XML.
UT 4. XML. ALMACENAMIENTO DE DATOS
Los elementos:
 se emplean para representar jerarquías o contenido de unos dentro de otros
 se pueden extender con otros elementos en su interior
 El orden en que aparecen es representativo
 Pueden tener atributos
 Puede haber múltiples ocurrencias de un elemento
4. Modelo de datos de un documento XML. Uso de elementos frente a uso de atributos.
UT 4. XML. ALMACENAMIENTO DE DATOS
Los atributos:
 Van asociados a los elementos
 Son modificadores de la información
 Se suelen usar para registrar metadatos
 El orden en que aparecen dentro del elemento al que van a asociados no es representativo
 No se pueden extender con otros elementos contenidos en su interior
 No puede haber múltiples ocurrencias de un atributo dentro de un mismo elemento
4. Modelo de datos de un documento XML. Uso de elementos frente a uso de atributos.
UT 4. XML. ALMACENAMIENTO DE DATOS
Es un mecanismo para evitar conflictos de nombres, de forma que se puedan diferenciar elementos o
atributos dentro de un mismo documento XML que tengan idénticos nombres pero diferentes definiciones.
Se declaran como atributos de elementos:
<nombre_elemento xmlns:prefijo=“URI_del_espacio_de_nombres”>
Y se usan anteponiendo a elementos y atributos con el prefijo asociado al espacio de nombres además del
carácter dos puntos “:”
Ejemplo:
<info:pedido xmlns:info=“empresa:espacios:info”>
<info:item info:id=“i_13”>Afeitadora eléctrica</info:item>
</info:pedido>
4. Modelo de datos de un documento XML. Espacios de nombres.
UT 4. XML. ALMACENAMIENTO DE DATOS
El ámbito de declaración o uso de un espacio de nombres cubre el elemento donde se ha declarado y sus
elementos descendientes.
Se puede declarar un espacio de nombres diferente para un elemento descendiente de otro, en el cual ya
se ha declarado otro espacio de nombres.
4. Modelo de datos de un documento XML. Espacios de nombres.
UT 4. XML. ALMACENAMIENTO DE DATOS
Espacio de nombres por defecto
 Es aquel en el que no se define un prefijo.
 El ámbito de aplicación de ese espacio de nombres es el del elemento en el que se ha declarado y sus
elementos descendientes, pero no sus atributos
4. Modelo de datos de un documento XML. Espacios de nombres.
UT 4. XML. ALMACENAMIENTO DE DATOS
Hay algunos atributos especiales en XML
 xml:space. Le indica a la aplicación que usa el XML si los espacios en blanco del contenido textual de un
elemento son significativos
 xml:lang. Permite especificar el idioma en el que está escrito el contenido textual de un documento
 xml:base. Permite definir una URI distinta a la del documento.
4. Modelo de datos de un documento XML. Atributos especiales.
UT 4. XML. ALMACENAMIENTO DE DATOS
Un parser o analizador XML es un procesador que lee un documento XML y determina la estructura y
propiedades de los datos en él contenidos.
Un analizador estándar lee el documento XML y genera el árbol jerárquico asociado, lo que permite ver los
datos en un navegador o ser tratados por cualquier aplicación.
Si el analizador comprueba las reglas de buena formación y además valida el documento contra un DTD o
esquema, se dice que se trata de un analizador validador.
Existen validadores XML en línea, como XML Validation (http://www.xmlvalidation.com)
4. Modelo de datos de un documento XML. Parser XML.
UT 4. XML. ALMACENAMIENTO DE DATOS
La especificación de XML define la sintaxis que el lenguaje debe seguir:
 Cómo se delimitan los elementos con etiquetas
 Qué formato puede tener una etiqueta
 Qué nombres son aceptables para los elementos
 Dónde se colocan los atributos
Se dice que un documento XML está bien formado si cumple las reglas establecidas por el W3C en las
especificaciones para XML.
5. Corrección sintáctica: documento XML bien formado
UT 4. XML. ALMACENAMIENTO DE DATOS
Las reglas más significativas son:
1. El documento puede empezar por una instrucción de procesamiento xml que indica la versión del XML y,
opcionalmente, la codificación de caracteres. La instrucción de procesamiento correcta más simplificada
es <?xml versión = “1.0”?>
2. Debe existir un único elemento raín, que “cuelga” del nodo raíz (/). Este elemento tendrá como
descendientes a todos los demás elementos.
3. Los elementos que no sean vacíos deben tener una etiqueta de apertura y otra de cierre.
4. Los elementos vacíos deben cerrarse con />
5. Los elementos deben aparecer correctamente anidados en cuanto a su apertura y su cierre, no
solaparse.
6. Los nombres de los elementos y atributos son sensibles a mayúsculas/minúsculas
5. Corrección sintáctica: documento XML bien formado
UT 4. XML. ALMACENAMIENTO DE DATOS
7. Los valores de los atributos deben aparecer entre comillas simples o dobles, pero del mismo tipo.
8. No puede haber dos atributos con el mismo nombre asociados al mismo elemento
9. No se pueden introducir ni instrucciones de procesamiento ni comentarios en ningún lugar del interior de
las etiquetas de apertura y cierre de los elementos.
10. No puede haber nada antes de la instrucción de procesamiento <?xml … ?>
11. No puede haber texto antes ni después del elemento documento.
12. No pueden aparecer los signos < ni & en el contenido textual de elementos ni atributos.
5. Corrección sintáctica: documento XML bien formado
UT 4. XML. ALMACENAMIENTO DE DATOS
Se puede verificar si un documento XML está bien formado abriéndolo en un navegador como Mozilla
Firefox o Internet Explorer. Si se muestra el árbol de nodos significa que está bien formado.
5. Corrección sintáctica: documento XML bien formado

Más contenido relacionado

La actualidad más candente

Estructura de archivos secuencial indexado
Estructura de archivos secuencial indexadoEstructura de archivos secuencial indexado
Estructura de archivos secuencial indexado
dexter120
 
Temas programacion java_3
Temas programacion java_3Temas programacion java_3
Temas programacion java_3
Wally IG
 
En los recursos de la semana se pueden leer las reglas para planificar una ba...
En los recursos de la semana se pueden leer las reglas para planificar una ba...En los recursos de la semana se pueden leer las reglas para planificar una ba...
En los recursos de la semana se pueden leer las reglas para planificar una ba...
Monytha Roman
 
Organización de los archivos en bases de datos
Organización de los archivos en bases de datosOrganización de los archivos en bases de datos
Organización de los archivos en bases de datos
Miguel Orquera
 
Sist Informacion Clase 12 2009 1 7880
Sist Informacion Clase 12 2009 1 7880Sist Informacion Clase 12 2009 1 7880
Sist Informacion Clase 12 2009 1 7880
Danieltorrealba
 
Identificacion y organizacion de archivos
Identificacion y organizacion de archivosIdentificacion y organizacion de archivos
Identificacion y organizacion de archivos
90070674911
 

La actualidad más candente (19)

Archivo Secuencial-Indexado
Archivo Secuencial-IndexadoArchivo Secuencial-Indexado
Archivo Secuencial-Indexado
 
Archivos
ArchivosArchivos
Archivos
 
Archivo secuencial indexado
Archivo secuencial indexadoArchivo secuencial indexado
Archivo secuencial indexado
 
Archivos secuenciales indexados
Archivos secuenciales indexadosArchivos secuenciales indexados
Archivos secuenciales indexados
 
Estructura de archivos secuencial indexado
Estructura de archivos secuencial indexadoEstructura de archivos secuencial indexado
Estructura de archivos secuencial indexado
 
Biblioteca de clases de
Biblioteca de clases deBiblioteca de clases de
Biblioteca de clases de
 
Temas programacion java_3
Temas programacion java_3Temas programacion java_3
Temas programacion java_3
 
Organización de archivos
Organización de archivosOrganización de archivos
Organización de archivos
 
CURSO DE DB2 DEMO
CURSO DE DB2 DEMOCURSO DE DB2 DEMO
CURSO DE DB2 DEMO
 
Db2 (2)
Db2 (2)Db2 (2)
Db2 (2)
 
En los recursos de la semana se pueden leer las reglas para planificar una ba...
En los recursos de la semana se pueden leer las reglas para planificar una ba...En los recursos de la semana se pueden leer las reglas para planificar una ba...
En los recursos de la semana se pueden leer las reglas para planificar una ba...
 
Organización de los archivos en bases de datos
Organización de los archivos en bases de datosOrganización de los archivos en bases de datos
Organización de los archivos en bases de datos
 
Archivossin
ArchivossinArchivossin
Archivossin
 
Grupo 1 Archivos Secuenciales Indexados en C++
Grupo 1 Archivos Secuenciales Indexados en C++Grupo 1 Archivos Secuenciales Indexados en C++
Grupo 1 Archivos Secuenciales Indexados en C++
 
Lectura de archivos xml ssis
Lectura de archivos xml   ssisLectura de archivos xml   ssis
Lectura de archivos xml ssis
 
Sist Informacion Clase 12 2009 1 7880
Sist Informacion Clase 12 2009 1 7880Sist Informacion Clase 12 2009 1 7880
Sist Informacion Clase 12 2009 1 7880
 
Capitulo 27 (XML: Lenguaje de mercado extendible) y Capítulo 28 (Conceptos de...
Capitulo 27 (XML: Lenguaje de mercado extendible) y Capítulo 28 (Conceptos de...Capitulo 27 (XML: Lenguaje de mercado extendible) y Capítulo 28 (Conceptos de...
Capitulo 27 (XML: Lenguaje de mercado extendible) y Capítulo 28 (Conceptos de...
 
Identificacion y organizacion de archivos
Identificacion y organizacion de archivosIdentificacion y organizacion de archivos
Identificacion y organizacion de archivos
 
Sistemas operativos - Sistemas De Archivos - reporte unidad 5
Sistemas operativos - Sistemas De Archivos - reporte unidad 5Sistemas operativos - Sistemas De Archivos - reporte unidad 5
Sistemas operativos - Sistemas De Archivos - reporte unidad 5
 

Similar a Lenguajes de Marcas XML (20)

Tema 2
Tema 2Tema 2
Tema 2
 
Xml
XmlXml
Xml
 
Xml
XmlXml
Xml
 
Introduccion al xml
Introduccion al  xmlIntroduccion al  xml
Introduccion al xml
 
Xml
XmlXml
Xml
 
infografíaxml
infografíaxmlinfografíaxml
infografíaxml
 
XML Básico DB2
XML Básico DB2XML Básico DB2
XML Básico DB2
 
Lenguajes de marcas
Lenguajes de marcasLenguajes de marcas
Lenguajes de marcas
 
Xml json yaml
Xml json yamlXml json yaml
Xml json yaml
 
Introxml
IntroxmlIntroxml
Introxml
 
Colima2000
Colima2000Colima2000
Colima2000
 
Android de la A a la Z - Unidad 5
Android de la A a la Z - Unidad 5Android de la A a la Z - Unidad 5
Android de la A a la Z - Unidad 5
 
Guía+básica+de+características+de+archivos+.pdf
Guía+básica+de+características+de+archivos+.pdfGuía+básica+de+características+de+archivos+.pdf
Guía+básica+de+características+de+archivos+.pdf
 
UG2011html.pptx
UG2011html.pptxUG2011html.pptx
UG2011html.pptx
 
Diferencias entre XML y HTML
Diferencias entre XML y HTMLDiferencias entre XML y HTML
Diferencias entre XML y HTML
 
Xml
XmlXml
Xml
 
Xsd douglas morales
Xsd douglas moralesXsd douglas morales
Xsd douglas morales
 
XML
XMLXML
XML
 
Xml
XmlXml
Xml
 
Xml presentacin
Xml presentacinXml presentacin
Xml presentacin
 

Más de Anuska González

Más de Anuska González (8)

Seguridad y alta disponibilidad
Seguridad y alta disponibilidadSeguridad y alta disponibilidad
Seguridad y alta disponibilidad
 
Implantación de aplicaciones web
Implantación de aplicaciones webImplantación de aplicaciones web
Implantación de aplicaciones web
 
11. lectura y escritura de información
11. lectura y escritura de información11. lectura y escritura de información
11. lectura y escritura de información
 
Programación de servicios y procesos
Programación de servicios y procesosProgramación de servicios y procesos
Programación de servicios y procesos
 
Programación multimedia y dispositivos móviles
Programación multimedia y dispositivos móvilesProgramación multimedia y dispositivos móviles
Programación multimedia y dispositivos móviles
 
Inicio del curso 2013 2014
Inicio del curso 2013 2014Inicio del curso 2013 2014
Inicio del curso 2013 2014
 
Presentación seguridad informática
Presentación   seguridad informáticaPresentación   seguridad informática
Presentación seguridad informática
 
Presentación de prueba
Presentación de pruebaPresentación de prueba
Presentación de prueba
 

Último

2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
RigoTito
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Fernando Solis
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
jlorentemartos
 
Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdf
patriciaines1993
 
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docxTALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
NadiaMartnez11
 

Último (20)

TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPCTRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
 
Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.
 
Sesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdfSesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdf
 
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024
 
Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdf
 
Usos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicasUsos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicas
 
semana 4 9NO Estudios sociales.pptxnnnn
semana 4  9NO Estudios sociales.pptxnnnnsemana 4  9NO Estudios sociales.pptxnnnn
semana 4 9NO Estudios sociales.pptxnnnn
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdf
 
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docxTALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptx
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024
 
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdfPlan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.pptFUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
 

Lenguajes de Marcas XML

  • 1. LENGUAJE DE MARCAS Y SISTEMAS DE GESTIÓN DE INFORMACIÓN XML
  • 2. UT 4. XML. ALMACENAMIENTO DE DATOS 1. Introducción 2. Documentos XML 3. Estructura jerárquica de un documento XML 4. Modelo de datos de un documento XML. Nodos 5. Corrección sintáctica: documento XML bien formado 6. Documentos XML válidos 7. Validación de documentos XML con DTD 8. Validación de documentos XML con esquemas XML 9. Otros mecanismos para validar XML 10. Otros lenguajes basados en XML 11. Otras formas de almacenar información Contenidos de la unidad
  • 3. UT 4. XML. ALMACENAMIENTO DE DATOS  El XML se trata de un formato de almacenamiento de información a base de etiquetas o marcas definidas por el usuario.  Por ser un lenguaje de marcas, deberá cumplir una serie de reglas que harán que esté bien formado.  Se aprenderán mecanismos para validar un documento XML, donde se revisarán fundamentalmente dos técnicas: los DTD y los esquemas XML 1. Introducción
  • 4. UT 4. XML. ALMACENAMIENTO DE DATOS  El XML (eXtensible Markup Language – Lenguaje de Marcado eXtensible es un estándar.  Es un metalenguaje de marcas, es decir, no dispone de un conjunto fijo de etiquetas que todo el mundo debe conocer, sino que permite definir a los desarrolladores los elementos que necesiten.  Define una sintaxis general para maquetar datos con etiquetas sencillas y comprensibles al ojo humano.  Es un formato flexible, de manera que puede ser adaptado al campo de aplicación que se desee 2. Documentos XML
  • 5. UT 4. XML. ALMACENAMIENTO DE DATOS Lo que NO es XML:  No es un lenguaje de programación. No existen compiladores de XML que generen un ejecutable.  No es un protocolo de comunicación. No envía datos por nosotros a través de internet  No es un sistema gestor de bases de datos, aunque una base de datos relacional puede contener campos del tipo XML e incluso existen bases de datos XML nativas, que todo lo que almacenan son documentos con formato XML.  No es propietario, es decir, no pertenece a ninguna compañía. 2. Documentos XML
  • 6. UT 4. XML. ALMACENAMIENTO DE DATOS Formato adecuado para el almacenamiento y la transmisión  Al ser un documento de texto plano, es adecuado para almacenar información y transmitirla.  Fáciles de editar con un editor de textos  Son relativamente ligeros para ser almacenados y enviados  Suelen tener extensión .xml aunque no es imprescindible. 2. Documentos XML
  • 7. UT 4. XML. ALMACENAMIENTO DE DATOS En un documento XML la información se organiza de forma jerárquica, de forma que los elementos del documento se relacionan entre sí mediante relaciones de padres, hijos, hermanos, ascendentes, descendentes, etc A esta estructura jerárquica se la denomina árbol del documento XML. A las partes del árbol que tienen hijos se las denomina nodos intermedios o ramas, mientras que a las que no tienen se les conoce como nodos finales u hojas. 3. Estructura jerárquica de un documento XML
  • 8. UT 4. XML. ALMACENAMIENTO DE DATOS 3. Estructura jerárquica de un documento XML
  • 9. UT 4. XML. ALMACENAMIENTO DE DATOS 3. Estructura jerárquica de un documento XML
  • 10. UT 4. XML. ALMACENAMIENTO DE DATOS 3. Estructura jerárquica de un documento XML
  • 11. UT 4. XML. ALMACENAMIENTO DE DATOS 3. Estructura jerárquica de un documento XML
  • 12. UT 4. XML. ALMACENAMIENTO DE DATOS Ejemplo El elemento <persona> es “padre” (contiene) a los elementos <nombre> y <apellido> que son “hermanos” entre sí. 3. Estructura jerárquica de un documento XML
  • 13. UT 4. XML. ALMACENAMIENTO DE DATOS Ejercicio: En el siguiente árbol de documento XML, identificar: los nodos “padre” con sus respectivos “hijos”, los nodos “hermanos”, los nodos finales, los nodos ascendentes del nodo “la Mancha” y los nodos descendentes del nodo <capítulo> 3. Estructura jerárquica de un documento XML
  • 14. UT 4. XML. ALMACENAMIENTO DE DATOS En documento XML consta de una determinada estructura, formada por los siguientes tipos de componentes o nodos:  Raíz: Por encima de cualquier elemento se ubica el nodo raíz, que se designa como “/”. No es un componente que tenga representación dentro del documento XML, pero se utilizará más adelante como punto de partida para recorrer el árbol XML y ubicar el resto de nodos.  Elementos: Es la unidad básica de un documento XML. Se identifican por una etiqueta de apertura y una de cierre. Lo que se ubica entre ambas es el contenido de ese elemento, que puede ser textual, otros elementos o vacío. 4. Modelo de datos de un documento XML. Nodos.
  • 15. UT 4. XML. ALMACENAMIENTO DE DATOS Algunos tipos de elementos especiales son:  Elemento raíz: todo documento XML bien formado debe contener un único elemento raíz que contiene a todos los demás. También se le llama elemento documento.  Elemento sin contenido: aunque puede tener atributos, se abre y se cierra con una sola etiqueta.  Atributos: Son como los atributos en HTML. Permiten especificar datos adicionales de un elemento. Se ubican en la etiqueta de apertura del elemento. Para asignar un valor a un atributo se utiliza el signo igual. Todos los atributos, independientemente del tipo de datos que representen, se tratarán como texto y aparecerán entre comillas simples o dobles. 4. Modelo de datos de un documento XML. Nodos.
  • 16. UT 4. XML. ALMACENAMIENTO DE DATOS  Texto: El texto puede aparecer bien como contenido de un elemento, bien como valor de un atributo. No puede aparecer en ningún otro lugar. Los espacios en blanco (Tabulador, Nueva línea, Retorno de carro y Espacio) son tratados de una forma especial:  Dentro del contenido textual de un elemento se mantendrán como están y así serán tratados por el procesador.  Como valor de un atributo, los espacios en blanco adyacentes se condensarán en uno solo  Los espacios en blanco entre elementos serán ignorados. 4. Modelo de datos de un documento XML. Nodos.
  • 17. UT 4. XML. ALMACENAMIENTO DE DATOS  Comentarios: Son iguales que los de HTML. Empiezan por los caracteres <!-- y se cierran con los caracteres--> Dentro de ello se puede escribir cualquier signo menos el doble guión. Pueden ubicarse en cualquier lugar del documento excepto dentro de una etiqueta de apertura o una etiqueta de cierre.  Espacio de nombres: es un mecanismo para distinguir etiquetas cuando se mezclan distintos vocabularios. Se verán más adelante.  Instrucciones de procesamiento: empiezan por <? Y terminan por ?>. Son instrucciones para el procesador XML, de manera que son dependientes de él. No forman parte del contenido del documento XML. 4. Modelo de datos de un documento XML. Nodos.
  • 18. UT 4. XML. ALMACENAMIENTO DE DATOS  Entidades predefinidas: Representan caracteres especiales de marcado, que son interpretados como texto por parte del procesador XML. 4. Modelo de datos de un documento XML. Nodos. Entidad Carácter &amp; & &lt; < &gt; > &apos; „ &quot; “
  • 19. UT 4. XML. ALMACENAMIENTO DE DATOS  Secciones CDATA: Son conjuntos de caracteres que el procesador no debe analizar. La definición de estas secciones permite agilizar el análisis del documento y deja libertad al autor para introducir libremente en ellas caracteres como < y &. No pueden aparecer antes del elemento raíz ni después de su cierre. No pueden contener el propio signo delimitador del final de sección CDATA, es decir, la combinación de caracteres ]]>  Definición de Tipo de Documento(DTD): Permite definir reglas que fuercen ciertas restricciones sobre la estructura de un documento XML. Un documento bien formado que tiene asociado un documento de declaración de tipos y cumple con las restricciones allí declaradas se dice que es válido. Debe aparecer en la segunda línea de documento XML, entre la instrucción de procesamiento inicial y el elemento raíz. 4. Modelo de datos de un documento XML. Nodos.
  • 20. UT 4. XML. ALMACENAMIENTO DE DATOS En XML se utilizan una serie de reglas para definir nombres correctos de elementos. Son las mismas que para los atributos:  Puede empezar con una letra (podría ser de un alfabeto no latino), subrayado o dos puntos (este último se desaconseja)  Los siguientes caracteres pueden ser letras, dígitos, subrayados, guiones bajos, comas y dos puntos.  Los nombres que empiezan por las letras XML, en cualquier combinación de mayúsculas y minúsculas, se reservan para estandarización.  No pueden contener:  Ningún carácter de espaciado  Ningún otro carácter de puntuación que los ya citados como válidos (comillas, signo dólar, acento circunflejo, signo de porcentaje…) 4. Modelo de datos de un documento XML. Nombres XML.
  • 21. UT 4. XML. ALMACENAMIENTO DE DATOS Los elementos:  se emplean para representar jerarquías o contenido de unos dentro de otros  se pueden extender con otros elementos en su interior  El orden en que aparecen es representativo  Pueden tener atributos  Puede haber múltiples ocurrencias de un elemento 4. Modelo de datos de un documento XML. Uso de elementos frente a uso de atributos.
  • 22. UT 4. XML. ALMACENAMIENTO DE DATOS Los atributos:  Van asociados a los elementos  Son modificadores de la información  Se suelen usar para registrar metadatos  El orden en que aparecen dentro del elemento al que van a asociados no es representativo  No se pueden extender con otros elementos contenidos en su interior  No puede haber múltiples ocurrencias de un atributo dentro de un mismo elemento 4. Modelo de datos de un documento XML. Uso de elementos frente a uso de atributos.
  • 23. UT 4. XML. ALMACENAMIENTO DE DATOS Es un mecanismo para evitar conflictos de nombres, de forma que se puedan diferenciar elementos o atributos dentro de un mismo documento XML que tengan idénticos nombres pero diferentes definiciones. Se declaran como atributos de elementos: <nombre_elemento xmlns:prefijo=“URI_del_espacio_de_nombres”> Y se usan anteponiendo a elementos y atributos con el prefijo asociado al espacio de nombres además del carácter dos puntos “:” Ejemplo: <info:pedido xmlns:info=“empresa:espacios:info”> <info:item info:id=“i_13”>Afeitadora eléctrica</info:item> </info:pedido> 4. Modelo de datos de un documento XML. Espacios de nombres.
  • 24. UT 4. XML. ALMACENAMIENTO DE DATOS El ámbito de declaración o uso de un espacio de nombres cubre el elemento donde se ha declarado y sus elementos descendientes. Se puede declarar un espacio de nombres diferente para un elemento descendiente de otro, en el cual ya se ha declarado otro espacio de nombres. 4. Modelo de datos de un documento XML. Espacios de nombres.
  • 25. UT 4. XML. ALMACENAMIENTO DE DATOS Espacio de nombres por defecto  Es aquel en el que no se define un prefijo.  El ámbito de aplicación de ese espacio de nombres es el del elemento en el que se ha declarado y sus elementos descendientes, pero no sus atributos 4. Modelo de datos de un documento XML. Espacios de nombres.
  • 26. UT 4. XML. ALMACENAMIENTO DE DATOS Hay algunos atributos especiales en XML  xml:space. Le indica a la aplicación que usa el XML si los espacios en blanco del contenido textual de un elemento son significativos  xml:lang. Permite especificar el idioma en el que está escrito el contenido textual de un documento  xml:base. Permite definir una URI distinta a la del documento. 4. Modelo de datos de un documento XML. Atributos especiales.
  • 27. UT 4. XML. ALMACENAMIENTO DE DATOS Un parser o analizador XML es un procesador que lee un documento XML y determina la estructura y propiedades de los datos en él contenidos. Un analizador estándar lee el documento XML y genera el árbol jerárquico asociado, lo que permite ver los datos en un navegador o ser tratados por cualquier aplicación. Si el analizador comprueba las reglas de buena formación y además valida el documento contra un DTD o esquema, se dice que se trata de un analizador validador. Existen validadores XML en línea, como XML Validation (http://www.xmlvalidation.com) 4. Modelo de datos de un documento XML. Parser XML.
  • 28. UT 4. XML. ALMACENAMIENTO DE DATOS La especificación de XML define la sintaxis que el lenguaje debe seguir:  Cómo se delimitan los elementos con etiquetas  Qué formato puede tener una etiqueta  Qué nombres son aceptables para los elementos  Dónde se colocan los atributos Se dice que un documento XML está bien formado si cumple las reglas establecidas por el W3C en las especificaciones para XML. 5. Corrección sintáctica: documento XML bien formado
  • 29. UT 4. XML. ALMACENAMIENTO DE DATOS Las reglas más significativas son: 1. El documento puede empezar por una instrucción de procesamiento xml que indica la versión del XML y, opcionalmente, la codificación de caracteres. La instrucción de procesamiento correcta más simplificada es <?xml versión = “1.0”?> 2. Debe existir un único elemento raín, que “cuelga” del nodo raíz (/). Este elemento tendrá como descendientes a todos los demás elementos. 3. Los elementos que no sean vacíos deben tener una etiqueta de apertura y otra de cierre. 4. Los elementos vacíos deben cerrarse con /> 5. Los elementos deben aparecer correctamente anidados en cuanto a su apertura y su cierre, no solaparse. 6. Los nombres de los elementos y atributos son sensibles a mayúsculas/minúsculas 5. Corrección sintáctica: documento XML bien formado
  • 30. UT 4. XML. ALMACENAMIENTO DE DATOS 7. Los valores de los atributos deben aparecer entre comillas simples o dobles, pero del mismo tipo. 8. No puede haber dos atributos con el mismo nombre asociados al mismo elemento 9. No se pueden introducir ni instrucciones de procesamiento ni comentarios en ningún lugar del interior de las etiquetas de apertura y cierre de los elementos. 10. No puede haber nada antes de la instrucción de procesamiento <?xml … ?> 11. No puede haber texto antes ni después del elemento documento. 12. No pueden aparecer los signos < ni & en el contenido textual de elementos ni atributos. 5. Corrección sintáctica: documento XML bien formado
  • 31. UT 4. XML. ALMACENAMIENTO DE DATOS Se puede verificar si un documento XML está bien formado abriéndolo en un navegador como Mozilla Firefox o Internet Explorer. Si se muestra el árbol de nodos significa que está bien formado. 5. Corrección sintáctica: documento XML bien formado