El documento habla sobre la arquitectura de integración de información y los metadatos. Explica que los metadatos son importantes para permitir la interoperabilidad entre sistemas al representar los datos de forma independiente de los sistemas. También describe varios estándares de metadatos como XML, RDF, OWL y ebXML, y cómo estos permiten definir ontologías y representar los datos a diferentes niveles de abstracción.
How to use Redis with MuleSoft. A quick start presentation.
Sio2009 Eq10 L10 Exp Gold Bernstein & Ruh Cap8 Information Integration Architecture
1. INFORMATION INTEGRATION
ARCHITECTURE
EQUIPO 10
Soluciones Integrales en las Organizaciones
Integrantes:
Bretón Cordova Jessica
Hernández Páez Jose Carlos
Ogarrio Pineda Juan José
Olivos Martínez Yair Antonio
2.
3. VISIÓN GENERAL DE EJECUTIVO
Enfoques y prácticas en materia de integración han cambiado en la última
década, pero lo que era viejo es nuevo otra vez.
La Integración de la tecnología y las técnicas relacionadas con la
información no estructurada en los informes y los medios digitales, y los
datos estructurados en bases de datos, se están convirtiendo en una parte
importante de la integración del paisaje, una vez más. Esto se debe a una
variedad de factores, incluida la aparición de XML como un formato de
datos estándar.
El problema que se encuentra en el corazón de todos los proyectos de
integración es la manera de permitir la interoperabilidad entre sistemas
con los datos en diferentes formatos y estructuras. La arquitectura de
Integración de la Información define la infraestructura y los procesos para
que la información sea accesible a través de los sistemas.
4. EAI la solución a este problema consiste en representar los datos en
un formato canónico
El gran formato canónico aumenta la reutilización y disminuye la
aplicación y los gastos operacionales y el tiempo. Cada sistema debe ser
asignado sólo una vez en este formato y luego puede interoperar con
otros sistemas en el mismo formato canónico.El formato es propietario
y no puede interoperar con otros proveedores de soluciones.
La amplia aceptación y adopción del lenguaje XML se ha debido en
gran parte a la enorme necesidad de describir los datos en un formato
común para reducir el tiempo y el coste de la integración
5. El valor de los datos depende de mantener la integridad de los
datos a través de los sistemas. La solución para mantener el
valor, significado, y la integridad de los datos a través de las
aplicaciones son los metadatos.
Los metadatos son la forma en que la información sobre los
sistemas puede ser representada de forma independiente de
todos los sistemas, permitiendo la interoperabilidad entre los
sistemas. Buenos metadatos son la base a largo plazo del éxito de
la integración.
La Arquitectura de Integración de la Información define los
metadatos de la empresa independientemente de las tecnologías
o plataformas, en una forma utilizable por todos los proyectos de
integración.
6. THE EXTENSIBLE MARKUP LANGUAGE
(XML)
Se ha convertido en el estándar de la industria para los metadatos.
XML se inició como un esfuerzo para crear un quot;mejorquot; HTML por el
World Wide Web Consortium (W3C).XML seria un lenguaje de marcas,
que se utiliza para describir el contenido o el formato de un documento.
SGML es la creación de Charles Goldfarb de la IBM que creó el Lenguaje
Generalizado de Marcas en 1969 para mejorar la edición de texto,
ampliar las capacidades de formato, y mejorar la recuperación de la
información.
7. Todo documento XML debe cumplir con las siguientes
reglas:
• Debe haber un abrir y cerrar de la etiqueta para cada uno
de las marcas, por ejemplo, <para>, </ para>.
• Las etiquetas deben ser anidadas, por ejemplo, <para>
<frase> </ frase> </ para>.
• Los atributos son valores de una etiqueta y el uso de un
conjunto de simples o dobles, por ejemplo, <para
sp='double>.
• Debe haber una etiqueta que contiene todas las demás
etiquetas: <html>, </ html>.
8. COMPRENSIÓN DE LOS METADATOS
Representa los datos en los sistemas de las entidades
comerciales, como clientes, empleados, productos, etc., y
proporciona un registro persistente de eventos de negocios.
El valor a largo plazo de los datos de la empresa entera
depende de garantizar la integridad de los sistemas de
información. Esto requiere tanto la validación sintáctica y
semántica.
Un modelo estándar de metadatos no incluye metadatos
que definan el significado semántico, incluyendo el
contexto, relaciones y dependencias, los diagramas
Entidad-Relación (ER) son utilizados a menudo para este
fin.
9. Hay una serie de esfuerzos en curso para definir un
modelo de metadatos semánticos.
Si bien muchos de estos esfuerzos están todavía en las
primeras etapas, es importante saber que existen, aunque
sólo sea para entender que los metadatos creados para los
datos agregados para la integración de aplicaciones y
datos es sólo el comienzo de la Arquitectura de
Integración de la Información.
10. ARQUITECTURA DE METADATOS
Existen diferentes tipos de metadatos para describir los diferentes
aspectos del sistema. La mayoría de los desarrolladores están
familiarizados con los metadatos que describen la información en el
sistema. Sin embargo, este tipo de metadatos no define reglas de
procesamiento y transacciones.
Un marco útil para la comprensión de las diferentes capas de metadatos
es el Grupo de Gestión de Objetos (OMG) Arquitectura de Cuatro Capas
de Metadatos.
La capa inferior, Nivel 0, es la información real y los valores de los datos. El
nivel 1 es la capa de metadatos que se compone de información que describe
estos datos. El modelo de integración de datos compatible con la agregación
de datos de diferentes sistemas de back-end y se definen los atributos de los
datos para permitir la validación automática y la limpieza.
11. Estándares de Metadatos
Los estándares son muy importantes para permitir la
interoperabilidad de los metadatos.
Diferentes estándares de metadatos están definidos por las normas
de organizaciones, entre ellas:
• La World Wide Web Consortium (W3C), liderando el camino
para XML y Web relacionados con los estándares
• La Organización para el progreso de los Estándares de
Información Estructurada (OASIS), un consorcio internacional
enfocado en las normas de comercio electrónico
• El Grupo de Gestión de Objetos (OMG), centrándose en el diseño
y desarrollo
• El Grupo de Aplicación Abierta (OAG), creadora de la industria
enfocada en los modelos de metadatos.
12. World Wide Web Consortium (W3C)
El W3C es el responsable de una serie de estándares Web. Aquí nos
centramos en la evolución de los estándares de metadatos para la Web
Semántica. La Web Semántica garantiza que la información Web tenga
sentido. Parte de la Web Semántica es la noción de una ontología.
Una ontología define un conjunto común de términos para describir y
representar un dominio particular, un tema específico o área de
conocimiento tales como el comercio minorista, la fabricación, o la
medicina.
Las ontologías representan el Nivel 2 de metadatos. Contienen tanto la
estructura y la semántica de los metadatos.
13. W3C Lenguajes para la definición de ontologías: RDF
y OWL
Resource Description Framework (RDF), proporciona un ligero sistema
de ontología para apoyar el intercambio de conocimientos en la Web.
Es una base para el procesamiento de metadatos. RDF permite a las
aplicaciones cambio de información en la Web y automáticamente
procesarla a través de máquina-comprensible de información. RDF es un
ejemplo de Nivel 2 de metadatos. Proporciona significado semántico.
Si bien es bueno RDF para describir la información Web, la Web Ontology
Language (OWL) ofrece una mayor máquina de interpretabilidad de
contenido Web que la apoyada por XML, RDF y esquema RDF (RDF-S)
Se trata de un lenguaje de ontología que puede describir formalmente el
sentido de la terminología. OWL representa el Nivel 3 de metadatos. Es
un lenguaje para la descripción de metadatos.
14. La Organización para el progreso de los Estándares
de Información Estructurada (OASIS)
OASIS es una organización sin fines de lucro, consorcio en
todo el mundo que se centró en el negocio electrónico para
los estándares de quot;seguridad, servicios Web, XML, las
transacciones comerciales, edición electrónica,
interoperabilidad, etc.
OASIS tiene más de 600 empresas y miembros individuales
en 100 países de todo el mundo. Por esa razón, ebXML es un
importante estándar de metadatos B2B.
15. ebXML
Electronic Business Extensible Markup Language (ebXML) es
una iniciativa internacional para la investigación e
identificacion de la base técnica sobre la cual la ejecución
global de XML puede ser normalizado. El objetivo es
proporcionar un marco técnico abierto basado en XML para
el XML que se utiliza en forma coherente y uniforme para el
intercambio de datos en el comercio electrónico entre
aplicaciones, los entornos aplicación-a-humano, y humano-a-
aplicación. El objetivo final de ebXML es crear un único
mercado electrónico mundial.
16. Grupo de Gestión de objetos (OMG)
Arquitectura de de metadatos de la OMG se ha descrito anteriormente
como parte de la Arquitectura Dirigida por Modelos (MDA). El objetivo de
MDA es permitir una tecnología completamente independiente de los
sistemas de diseño y aplicación. Una aplicación desarrollada utilizando
MDA podría ser desplegado en múltiples plataformas sin cambiar el
código.
El OMG es también responsable del estándar UML, que es ampliamente
utilizado para el desarrollo de aplicaciones. Las dos estándares sobre
metadatos OMG son XML, lo que permitirá la portabilidad de los
modelos de diseño UML y el depósito de meta modelo común (CWM)
17. Open Applications Group (OAG)
El OAG es una organización sin fines de lucro, consorcio de la
industria que se centró en la promoción de interoperabilidad entre
las aplicaciones empresariales y la creación de normas de lenguaje
de negocios para apoyar este objetivo. Es el mayor editor de
contenidos basado en XML para la interoperabilidad en el software
empresarial del mundo.
La creación de modelos de metadatos representa una inversión
considerable y un valioso activo empresarial. En última instancia,
la implementación de metadatos disminuye tiempo y el costo.
18. OMG (OBJECT MANAGEMENT GROUP) XMI AND CWM
XMI define uno basado en XML para el formato de
intercambio de modelos UML y estandarizada a
través de formatos de documento XML y DTD. Al
hacerlo, también se define el mapeo de UML a XML.
Esto es importante para obtener información a
través de modelos.
La CWM normaliza un meta modelo que permite la
minería de datos a través de bases de datos. Forma la
MDA a las bases de datos de cartografía esquemas.
19. OPEN APPLICATIONS GROUP INTEGRATION SPECIFICATION
(OAGIS), AND BUSINESS OBJECT DOCUMENTS (BODS)
El centro de OAGIS está permitiendo la
comunicación de la información necesaria para hacer
negocios por vía electrónica.
Utilizando estándares de servicios web, proporciona
una arquitectura que pueden utilizar para quot;conectarquot;
su industria de la información
específica, terminología, contenido y limitaciones.
20. Uno de los objetivos es preservar la terminología
para cada vertical de la industria para aprovechar
las inversiones existentes en los estándares de la
industria.
Entre los ejemplos incluyen órdenes de compra,
facturas, y los traslados, por nombrar unos pocos.
21. BODs puede ser prorrogado por grupos de la
industria para proporcionar campos
adicionales, compuestos, componentes, los
nombres, las limitaciones, y el contexto.
22. OMG
En las cuatro capas de la arquitectura, BODs
representa los metadatos de nivel 1.
Sin embargo, hay un grupo trabajando en la
integración semántica en la OAG, con el propósito
de mejorar el sentido y la utilidad del modelo de
información.
23. La gestión de metadatos se está convirtiendo en
esencial para las empresas para la agilidad y que
permitan una rápida integración y la
interoperabilidad de los sistemas.
Las soluciones basadas en estándares ayudan a
maximizar la reutilización y reducir los costes
operativos. Mientras que la mayoría de las
empresas comenzarán centrándose en las dos
primeras capas de la arquitectura de metadatos, es
importante comprender estándares en otras áreas.
Estos esfuerzos de transformar nuestra forma de
construir y poner en práctica aplicaciones, que
permitan una rápida integración y automatización.
24. La creación de modelos de metadatos representa
una inversión considerable y un valioso activo
empresarial.
En última instancia, la implementación de
metadatos disminuye tiempo y el costo.
25. Patrones de integración de información
Hay dos tipos de integración de la información: la agregación
y publicación.
Información por agregación es reunir información de varias
fuentes en un único modelo de metadatos que proporciona
una vista única de los datos a través de los sistemas.
Un buen ejemplo de la necesidad de la agregación es la
creación de un “call-center” aplicación que proporciona una
visión unificada de la relación con un cliente en lugar de exigir
a los operadores a utilizar una variedad de sistemas y las
interfaces, junto con su propia capacidad innata para agregar
la información para llevar a cabo la misma tarea.
26. Hay varios modelos diferentes para la publicación
“uno a uno”, “uno-a-muchos” . Y la publicación de
varias fases.
Uno-a-uno es la publicación más simple.
Permitiendo un cliente a cambiar su dirección en
Internet y puede requerir la publicación de las
transacciones a través de sistema de apoyo, la
actualización de un sistema con esta información
es un ejemplo común, si hay dependencias que
deben mantenerse.
27. Por ejemplo, si un cliente tiene varias relaciones con
una empresa, tales como tener una cuenta de
cheques y préstamos a través de un banco es
razonable suponer que cada sistema se actualiza con
la información de dirección. Este no puede exigir la
integridad transaccional.
Sin embargo, si el dinero se transfiere de una cuenta
de cheques para pagar un préstamo, la integridad
transaccional se requiere.
28. El modelo final de publicación consta de varias fases
para que se publique la información. Cada paso se
produce sólo después de una exitosa conclusión del
paso previo.
Por ejemplo, una actualización de la dirección
seguida por el envío de una confirmación por escrito
que se podría hacer en dos etapas.
29. Tecnología de integración de información empresarial
Tecnología EII es la más rápida y fácil manera de
consolidar la información proveniente de múltiples
fuentes en una única interfaz, si toda la información
procede de una única base de datos.
Las soluciones de auto-servicio pueden ser mucho más
fáciles de utilizar desde una única vista de los clientes,
pacientes, o de otras entidades comerciales.
La fusión de los metadatos permite a los canales en
tiempo real la gestión de tableros de instrumentos
analíticos. Proporciona un almacén de datos virtual en
tiempo real para la presentación de informes.
30. EII permite a todos los back-end de información que
se ha visto como si se trata de una base de datos.
Acceso unificado a los datos en bases de datos
dispares simplifica muchas aplicaciones, siempre
más rápido, más barato para la integración de una
serie de diferentes soluciones de negocio.
31. EII
EII se centra en los niveles 0 y 1 de la capa de
metadatos OMG. A este nivel, su significado
semántico tiene que ser representado y conservado a
través de las normas de integridad.
Las normas de integridad tendrían que incluir las
relaciones entre la aplicación. Nivel 1 de metadatos
es apropiado para la integración, pero no tanto para
la integración impulsada por la transacción.
32. Las Soluciones EII normalmente contienen un
depósito de metadatos, un servicio de agregación
de datos que puede extraer datos desde múltiples
sistemas de back-end y agregados de acuerdo con
el modelo común de metadatos. Consultar
diferentes datos como si se tratara de una sola
fuente y la capacidad de gestión entre ellos el linaje
de datos y análisis de impacto. El linaje de datos
proporciona la capacidad de rastrear los valores de
los datos a los sistemas de fuente de procedencia.
33. Esto es muy útil para la optimización de los
sistemas y el desempeño de los sistemas de
mantenimiento. El repositorio de metadatos y
capacidades de gestión de la EII son importantes
para todos los tipos de datos integrados de gestión.
Por lo tanto, esperamos EII para convertirse en
una parte importante de la arquitectura integrada.
34. Introducción
Este documento es una guía para la creación de la
especificación de arquitectura de integración de
información para el intercambio de información
impulsado por soluciones de negocio.
35. Alcance
El alcance de la especificación de arquitectura de la
información puede ser de toda la empresa o limitarse
a un único proyecto de integración. El documento
debería definir las necesidades de información
empresarial, los metadatos, y la integración de la
arquitectura subyacente.
El ámbito de aplicación debería describir el ámbito
de la información comercial a la que se refiere, así
como los sistemas y fuentes de datos que participan
en el proceso.
36. Participantes clave
En esta sección se identifican todas las partes
interesadas en el negocio integrado de información,
incluidos los directivos de las empresas que
controlan la totalidad o parte de la información,
diseñadores de sistemas y arquitecto(s), y el equipo
de desarrollo que ejecutará la aplicación. Todos los
demás participantes o interesados también deben ser
identificados, así como también sus funciones.
37. Mapping requirements to information integration
design patterns
Esta sección se utiliza para identificar el mapa y
todos los requisitos de los patrones de diseño para la
integración de la información.
Los dos patrones de diseño son la agregación y
publicación de información.
Para identificar los requisitos de información
comercial que deben ser definidas como parte de una
estrategia de la empresa. Después se usan los
patrones de diseño para determinar el mejor enfoque
para su aplicación.
38. Entre los ejemplos de requisitos que son aptos para
la integración de la información esta la creación de
tableros de gestión, opiniones de los clientes o de
otros recursos comerciales, la difusión de
información para reducir la mecanografía en los
sistemas de información, almacén de datos virtual,
en tiempo real de la alimentación de los
instrumentos de análisis, o automatizar el uso de
documentos de Microsoft Office (o de otras
herramientas de escritorio).
39. Estos tipos de requisitos se centran en la agregación
en tiempo real de las fuentes de información donde
se recoge y se combinan para alimentar la creación
de nuevos bloques de información o la capacidad de
publicar un documento en varias fuentes de
información para proporcionar una única
actualización a través de fuentes de datos.
40.
41. DIAGRAMA DE FLUJO DE DATOS
El diagrama de flujo de datos representa el flujo de
información.
Por lo general el flujo de información se representa en un
único sistema entre los procesos y uno o varios
almacenes de datos, con sistemas externos se muestra
fuera del círculo.
En la integración, estamos principalmente interesados en
el flujo de información entre sistemas, por lo que
esencialmente todos los sistemas son externos. Por lo
tanto, hemos adaptado el tradicional diagrama de flujo
de datos con el fin de identificar los sistemas de tipo de
información.
Sistemas externos son sistemas de fuera de la empresa.
42. El fin de crear el flujo de datos es un diagrama para
determinar qué sistemas están involucrados en el
flujo de datos a fin de determinar posteriormente
la integridad a través de sistemas de normas.
43.
44. El modelo de metadatos se utiliza para definir el acceso y
reglas de transformación. Se establece el linaje de datos y
permite el análisis de las repercusiones.
El modelo también puede ser utilizado como un activo
estratégico, la reducción del costo operacional de la gestión
operacional y nuevas implementaciones.
Ayuda a garantizar la calidad de los datos mediante la gestión de
acceso a los datos y ala integridad. Ayuda a maximizar la
inversión en sistemas de conocimiento. Metadatos de las fuentes
de datos existentes deber ser capturados para cada elemento.
45.
46.
47. Modelo de relación
La relación la definimos como el modelo de las normas
de integridad a través de objetos de datos y sistemas, si
es la aplicación de un modelo de metadatos de nivel 1,
la integridad de normas deberá ser definido
explícitamente en la lógica de enrutamiento o
procedimientos en una base de datos. En el nivel 2 los
metadatos y modelos contienen significados
semánticos en el propio modelo.
48. Relación con el modelo de las dependencias, define las
normas, las transacciones, define el origen de los datos
y permite su análisis. Como se ha indicado
anteriormente, la evolución de estándares de
metadatos se describen con más detalle sus relaciones.
49.
50. Reseñas de información de diseño
El diseño de la información es un factor crítico para el
éxito global y la agilidad del sistema.
El diseño de evaluación debe incluir todas las partes
interesadas, se ha definido anteriormente. Todas las
partes del modelo deben ser examinadas y verificadas.
Los participantes deben comprobar las partes de la
información de la cual son responsables, incluida la
definición de todos los elementos, como se crean y
actualizan, los formatos y mecanismo, como se crean y
actualizan, los formatos y mecanismos de acceso.
51. Para el éxito del diseño se consideran las siguientes
pautas:
• Asegúrese de que todas las partes estén presentes.
• Explicar el proceso y las reglas del juego antes de la
revisión del diseño.
• Critique el diseño, no la persona.
• Los diseñadores sólo puede hablar para aclarar y
facilitar el diseño de la información. No deben
quot;defenderquot; el diseño.
• Identificar los quot;titularesquot; de la información.
• Identificar los sistemas de registro de información.
• Definir un proceso de calidad de los datos.
52. Buenas prácticas en el diseño de la información.
Realizar el diseño de evaluación. Un modelo de
metadatos es una definición global de datos de
diferentes sistemas en un formato canónico. La única
manera de garantizar la correcta definición es que el
modelo sea verificado por todas las partes
interesadas, los que tienen conocimientos de cada
uno de los sistemas, y los que lo necesitan para
utilizar e integrar los datos.
53. Crear un depósito de metadatos. Un repositorio de
metadatos, basado en estándares proporciona una
plataforma para el almacenamiento, acceso, y
gestión de metadatos, y nos brinda acceso a la
información en toda la organización. Es la piedra
angular para la empresa. El depósito puede crecer
con el tiempo, proyecto por proyecto.
Gestionar el depósito en el centro de la competencia.
Existen diferentes tipos de integración, y los
diferentes tipos de metadatos.