Este documento describe el uso de XML y la Web Semántica en la Biblioteca del Congreso Nacional de Chile (BCN). Explica que la BCN tiene tres roles principales: ser un instrumento para los parlamentarios, ser el repositorio del archivo parlamentario, y ser un espacio de conocimiento público. También describe cómo la BCN administra y entrega servicios de contenido usando un sistema de administración de contenido (CMS) y herramientas de búsqueda y relacionamiento de contenido. Finalmente, explica cómo la BCN usa estándares como XML y la
Explotación de Información Geocientífica por Internet. Desde Geo-RSS a WMS, h...Carlos Gabriel Asato
Curso Explotación de Información Geocientífica por Internet. Desde Geo-RSS a WMS, hasta One Geology.
XVIII Congreso Geológico Argentino. Neuquén2 de Mayo de 2011
Iniciativa que pretende identificar el estado de situación del acceso a la información en Asambleas Legislativas Departamentales y el grado de conocimiento de la ciudadanía de sus Asambleas, la información que conocen, la que le gustaría conocer, entre otros; como la identificación de estándares que hacen al cumplimiento efectivo del derecho, la normativa internacional, nacional y local, entre otros.
Selección de fuentes de información jurídica. Elaborada por la sección de Información Bibliográfica de la Biblioteca de Ciències Socials "Gregori Maians" de la Universitat de València.
Estandarización, normalización y regulación de las telecomunicacionesMao Herrera
En el documento se describen las entidades encargadas de estándarizar, normalizar y regular el sector de las telecomunicaciones, tanto en Colombia como a nivel mundial.
Explotación de Información Geocientífica por Internet. Desde Geo-RSS a WMS, h...Carlos Gabriel Asato
Curso Explotación de Información Geocientífica por Internet. Desde Geo-RSS a WMS, hasta One Geology.
XVIII Congreso Geológico Argentino. Neuquén2 de Mayo de 2011
Iniciativa que pretende identificar el estado de situación del acceso a la información en Asambleas Legislativas Departamentales y el grado de conocimiento de la ciudadanía de sus Asambleas, la información que conocen, la que le gustaría conocer, entre otros; como la identificación de estándares que hacen al cumplimiento efectivo del derecho, la normativa internacional, nacional y local, entre otros.
Selección de fuentes de información jurídica. Elaborada por la sección de Información Bibliográfica de la Biblioteca de Ciències Socials "Gregori Maians" de la Universitat de València.
Estandarización, normalización y regulación de las telecomunicacionesMao Herrera
En el documento se describen las entidades encargadas de estándarizar, normalizar y regular el sector de las telecomunicaciones, tanto en Colombia como a nivel mundial.
Esta es la segunda entrega de una curso de Web Semántica. Trata zobre XML y RDF. Existen algunos ejemplos que se subiran por video. BLOG (http://manzamb.wordpress.com/) o Curso (http://pis.unicauca.edu.co/moodle/course/view.php?id=403)
Esta es la segunda entrega de un curso de Web Semántica. Aquí se hace un resumen del XML y RDF, así como de un conjunto de ejemplos. Los ejemplos se podrán obtener del BLOG (http://manzamb.wordpress.com/) o del Curso (http://pis.unicauca.edu.co/moodle/course/view.php?id=403)
Presentación CISTI 2016 "Distinciones Conceptuales para la Trazabilidad de l...Victor Aravena
Presentación de Distinciones conceptuales para la trazabilidad de historia de la ley. Finalmente presenta un caso práctico de implementación de un portal web para la Biblioteca del Congreso Nacional, Chile.
Notas de la sesión de Nils Pharo “XML and information discovery - the semantic web approach”
Facultat Biblioteconomia i Documentació - Universitat de Barcelona 6 mayo 2011
Aprovechamiento de las TIC para mejorar los servicios y promover la creación de redes y el intercambio de conocimientos entre bibliotecas parlamentarias de América Latina.
4. Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los
parlamentarios y el parlamento, para el cabal cumplimiento de sus
compromisos y el atisbamiento de nuevos escenarios posibles de país
5. Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los
parlamentarios y el parlamento, para el cabal cumplimiento de sus
compromisos y el atisbamiento de nuevos escenarios posibles de país
Rol societal, ser el repositorio del Archivo del Parlamento, en especial
de la historia de la Ley y de la labor parlamentaria
6. Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los
parlamentarios y el parlamento, para el cabal cumplimiento de sus
compromisos y el atisbamiento de nuevos escenarios posibles de país
Rol societal, ser el repositorio del Archivo del Parlamento, en especial
de la historia de la Ley y de la labor parlamentaria
Rol público, ser el espacio de conocimiento y comprensión de los
ámbitos de interés social prioritarios para el país con énfasis en lo
político y lo jurídico
7. Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los
parlamentarios y el parlamento, para el cabal cumplimiento de sus
compromisos y el atisbamiento de nuevos escenarios posibles de país
Rol societal, ser el repositorio del Archivo del Parlamento, en especial
de la historia de la Ley y de la labor parlamentaria
Rol público, ser el espacio de conocimiento y comprensión de los
ámbitos de interés social prioritarios para el país con énfasis en lo
político y lo jurídico
11. Énfasis en administrar contenidos y datos: CMS
Búsqueda y relacionamiento de los contenidos:
Autonomy
12. Énfasis en administrar contenidos y datos: CMS
Búsqueda y relacionamiento de los contenidos:
Autonomy
Relacionamiento y apertura de los datos: web
semántica
15. XML
XML (Extensible Markup Language)
es un lenguaje de marcación (markup)
estándar abierto
promovido por el W3C
adoptado ampliamente a nivel mundial para
representar datos y documentos
16. XML
<preface>
<subdivision>
<docProponent>República de Panamá</docProponent>
<docProponent>Ministerio de Desarrolo Agropecuario</docProponent>
<docType>Decreto Ejecutivo</docType>
<docNumber>n. 223</docNumber>
<docDate date="2010-06-29">(De 29 de 06 de 2010)</docDate>
<docTitle>Que reglamenta la Ley 72 de 2008, que establece el procedimento
especial para la adjudicación de la propiedad colectiva de tierras de los pueblo indígenas
que no están dentro de las comarcas.</docTitle>
</subdivision>
</preface>
20. XML
• formato abierto para datos y documentos
• independiente de la tecnología
• separa la información de presentación de la de
representación
• comprensible para máquinas
• jerárquico, riguroso, extensible, preciso y flexible
• constituye una inversión a largo plazo para archivo
21. XML
1. colocación de marcadores (tags) entorno al texto
2. se debe definir un vocabulario de tags y reglas de cómo
deben relacionarse los tags entre sí
3. estas reglas se definen mediante esquemas denominados
DTD (Document Type Definition) o esquemas XML
22. XML
• Legible por la máquina
• interconexión de los documentos
• mejor búsqueda
• múltiples plataformas
• dialogar sistemas informáticos
• aplicaciones heterogéneas (blog, wiki, redes sociales, RSS, etc.)
• reutilizar la información
• comparativa entre diferentes versiones
23. XML en ámbito legislativo
Al representar documentos jurídicos – legislativos o
parlamentarios – (proyectos de ley, leyes, debates, actos
administrativos, etc.) se requieren atenciones especiales:
• contiene información que contribuye a la dirección del workflow (flujo de
trabajo)
• apoya la redacción legislativa nacional (mejores prácticas)
• interoperable con otras instituciones y otros recursos
• se enriquece con las contribuciones de los ciudadanos
• preserva (en el tiempo) el valor jurídico en largos intervalos de tiempo
• accesible a todos por vía multi-canal (accesibilidad y brecha digital)
• abierto a todo el mundo para su inspección
• distribuido sin discriminación (usabilidad)
• utilizable con herramientas comunes y sistemas de gestión documental
24. Algunos estándares XML en ámbito legislativo
Muchos de ellos fueron creados en el pasado sólo para la
publicación web y no distinguen entre representación del
contenido y la presentación (Formex)
Otros son específicos para una nación y difícilmente se
adaptan a otros sistemas jurídicos (LexDania,
NormeInRete)
Otros no distinguen la parte procedural-aplicativa de la mera
representación del documento (House of Representative
XML standard)
25. Algunos estándares XML en ámbito legislativo
Estándares que cumplen las características
mencionadas más arriba: Akoma Ntoso
Una personalización de dicho estándar: LexML Brazil,
(se utiliza en el Senado de Brasil)
Chile ha adoptado en la BCN un estándar XML similar
en algunos aspectos a Akoma Ntoso, pero que
realiza la modelación del documento normativo
ya en su fase conclusiva (promulgado) sin
ocuparse de todo el íter legislativo
26. Estado del arte: XML en ámbito legislativo
Primera generación del estándar de documento legal XML , se
orientó sobre todo a describir el texto legal y su estructura
con un enfoque cercano a las entidades de base de datos o
el procesamiento tipográfico de paradigmas
27. Estado del arte: XML en ámbito legislativo
Segunda generación empleó una mayor atención en la
modelización del documento y la descripción del texto, la
estructura y los metadatos . Sin embargo, el carácter
descriptivo de los elementos no fue precedido por un
análisis abstracto de las clases de datos y el resultado es
una lista demasiado larga de tags, una compleja inclusión
de esquemas XML o DTD, con una frecuente
superposición entre los metadatos y la definición de texto
y unos instrumentos demasiado débiles para unir el texto
con diferentes niveles (layers)
28. Estado del arte: XML en ámbito legislativo
Tercera generación se basa en el patrón (pattern). El patrón
define las propiedades de la clase y su gramática, el
modelo del contenido, el comportamiento y el respeto a la
jerarquía de otras clases, por lo que cualquier tag adicional
pertenece a una clase abstracta ya existente y de esta
manera se preserva la coherencia a través del tiempo.
Dedica especial atención a dividir el texto, la estructura y
los metadatos. Mira a la ontología como un principio
fundamental para realizar un seguimiento en firme de
cualquier nuevo nivel (layer) colocado en la parte superior
del texto puro. Debido a que el patrón define unas reglas
generales que ya no están sujetas a limitaciones reales en
la acción de mark-up, la claridad del diseño favorece su
29. Estado del arte: XML en ámbito legislativo
Cuarta generación utiliza el patrón (pattern) junto con una co-
restricción a modo gramatical, con, entre otros, RELAX
NG, Schematron, DSD, etc. para resolver el problema
anteriormente mencionado de la falta de carácter
prescriptivo
31. Ley 22000
Artículo 1. abc.
Artículo 2. def.
Artículo 3. ghi.
Y por cuanto he tenido a bien
aprobarlo y sancionarlo…
32. Ley 25345
1.- Modifica ley 22000 de la siguiente
forma:
e) reemplázase en el Artículo 1 las
palabras “a” por “xyz”.
Y por cuanto he tenido a bien
aprobarlo y sancionarlo…
38. www.leychile.cl
Acceder a ley 19628
http://www.leychile.cl/Navegar?idNorma=141599
http://www.leychile.cl/Navegar?idLey=19628
Obtener el XML de la norma
http://www.leychile.cl/Consulta/obtxml?opt=7&idLey=19628
http://www.leychile.cl/Consulta/obtxml?opt=7&idNorma=141599
40. www.leychile.cl
Otra opción es mediante un webservice http://www.leychile.cl/Consulta/obtxml?
opt=61&cadena=[texto_a_buscar][&exacta=[1|]&cantidad=[5]]
41. www.leychile.cl
Web Services
Últimas leyes publicadas
http://www.leychile.cl/Consulta/obtxml?opt=3
Dada una norma, obtener sus metadatos
http://www.leychile.cl/Consulta/obtxml?
opt=50&strBusqueda=117%23normal%23on||48%23normal%23on||
53%23normal%23[idNorma]
Vista “plana”
http://www.leychile.cl/Consulta/obtxml?opt=63&idNorma=[idNorma]
Para GLIN
http://www.leychile.cl/Consulta/obtxml?opt=4546&idLey=[idLey]
...
44. Web Semántica
Web
Repleta de información
Orientada al ser humano:
para comprender el contenido de una página
para relacionar contenidos dentro de una página (textos,
imágenes, videos, etc.)
45. Web Semántica
Web
Dificultad en localización de la información (adaptar a una
región específica, por ejemplo, traducir)
Buscadores actuales funcionan bien, pero orientados al
keyword
Por ejemplo: “constitución”
¿la de Chile?
¿ciudad del sur?
46. Web Semántica
Web
Podría pensarse en una búsqueda semántica de
información
48. Web Semántica
Pero el problema es la heterogeneidad de la
información incluso en diferentes capas
• Codificación (ASCII, UNICODE, etc.)
• Lenguaje natural utilizado
• Disposición de la información en la página web
49. Web Semántica
¿Cómo integrar la información?
• La información está implícita (se puede extraer de
la combinación de los datos existentes)
• Se requieren métodos de lógica formal
Razonamiento automático
50. Web Semántica
Soluciones
• ad hoc: usar métodos de IA para analizar la
información no estructurada existente en la Web
• a priori: estructurar la información en la Web para
facilitar el análisis automático Web Semántica
51. Web Semántica
Dos condiciones esenciales para realizar lo anterior:
3. Usar estándares abiertos para describir la
información:
• claramente definidos
• flexibles
• ampliables
4. Métodos para extraer información de estas
descripciones
53. Web Semántica
Open Data: es un idea que impulsa la publicación de
datos de forma libre y asequible a cualquier
persona para usar y republicar sin restricciones de
ningún tipo
Linked Data: es usar la web para conectar datos
relacionados que no estaban enlazados
previamente. Usa algunas de las mejores prácticas
de la Web Semántica
54. http://datos.bcn.cl
Open/Linked data
Normas XML
Tripletas RDF
Ontologías OWL – RDF Schema
LeyChile datos.bcn.cl Endpoint Sparql – Interfaz Web
WS - SOAP
Linked data desde consultas
etc. Herramientas de generación
de mashup del grafo
Internet
56. Modelo documental
Cada documento bibliográfico debe ser pensado bajo tres
puntos de vista siguiendo el estándar FRBR adoptado por
el Grupo de Estudio IFLA sobre Requisitos Funcionales
para Registros Bibliográficos:
Trabajo: una creación intelectual o artística, la obra original producida
por un autor, por ejemplo el Hamlet de Shakespeare
Expresión: una clara realización intelectual o artística de una obra, por
ejemplo la película de Hamlet en 1990 por Zeffirelli
Manifestación: la encarnación física de una expresión concreta, por
ejemplo, el formato DVD de la película
57. Modelo documental
En nuestro caso, el documento legal es interpretado como una
fuente bibliográfica y por esta razón tiene diferentes
nombres:
• Trabajo: el nombre de la ley en sí, por ejemplo, la Ley 34
58. Modelo documental
Por lo tanto, es importante definir en esta fase qué partes de
todo el documento deberían ser convertidas en una
manifestación XML y qué partes es mejor preservar en
otros formatos (PDF, TIFF, etc.)
El documento principal, los anexos y la tabla deben ser objeto
de control y para cada uno de ellos se identifica una
tipología de documento
59. URI
Para cada uno se debe identificar el URI en cualquiera de los
tres aspectos principales: Trabajo, Expresión,
Manifestación.
61. URI
Decreto 341 del 11 de noviembre de 2008 del Ministerio de Educación
http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341
Versión original
http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2008-11-07
Última versión
http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2010-07-20
63. Consulta compleja
Encontrar todas las normas emitidas por una municipalidad
entre los años 1995 y 2000, pero que fueron modificadas
después del año 2005
PREFIX dc: <http://purl.org/dc/elements/1.1/>
PREFIX n: <http://datos.bcn.cl/ontologies/bcn-norms#>
SELECT distinct str(?normTitle) as ?Titulo str(?creatorName) as ?
Municipio ?pubDate as ?Fecha_Publicacion ?pubDateOther as ?
Fecha_modificacion
WHERE {
?norm n:createdBy ?creator .
?creator n:hasName ?creatorName .
?norm dc:title ?normTitle .
?norm n:publishDate ?pubDate .
?norm n:isModifiedBy ?otherNorm .
?otherNorm n:publishDate ?pubDateOther .
FILTER (regex(?creatorName,"MUNICIPALIDAD","i"))
FILTER (?pubDate > xsd:date("1995") &&
?pubDate < xsd:date("2000") &&
?pubDateOther > xsd:date("2005"))
}
ORDER BY (?pubDate)
66. Endpoint Sparql
Grafo de una norma:
PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX dc: <http://purl.org/dc/elements/1.1/>
SELECT ?n ?p ?o
WHERE {
?n ?p ?o .
Filter (?n=<http://datos.bcn.cl/recurso/cl/ley/ministerio-secretaria-
general-de-gobierno/2003-01-04/19846>).
}
67. Endpoint Sparql
Grafo de una norma:
h ttp :/ d atos .b cn.cl/ cu rs o/ le y/ inis te rio-s e cre taria-ge ne ral-d e -
/ re cl/ m
gob ie rno/ 2003-01 -04/ 9846/ atos .h tm l
1 d
68. Endpoint Sparql
Vinculaciones de modificatorias:
P R E F IX rd f:< h ttp :/ www.w3.org/ 999/ 22-rd f-s yntax-ns #>
/ 1 02/
P R E F IX d c: < h ttp :/ p u rl.org/ c/ le m e nts / .1 /
/ d e 1 >
P R E F IX norm s : < h ttp :/ d atos .b cn.cl/
/ ontologie s / cn-norm s #>
b
S E LE C T d is tinct ?n ?p ?m od ificatoria
WH E R E {
?n ?p ?m od ificatoria .
?n norm s :is M od ifie d By ?m od ificatoria .
F ilte r (?n= < h ttp :/ d atos .b cn.cl/ cu rs o/ le y/ inis te rio-s e cre taria-ge ne ral-d e -
/ re cl/ m
gob ie rno/ 2003-01 -04/ 9846> ) .
1
}
71. Otra ontología
Reseñas biográficas
no tenemos todos los años de nacimiento, ni fallecimiento,
ni los lugares
por ejemplo, Salvador de la Cavareda Trucios diputado suplente por
Valparaíso 1824 a 1825 (hermano de Salvador y José Joaquín)
Pero sabemos lo que nos falta
PREFIX bcnbio: <http://datos.bcn.cl/ontologies/bcn-biographies#>
select * where {
?a a foaf:Person .
OPTIONAL {?a bcnbio:hasBorn ?ap } .
FILTER (!bound(?ap)) .
}
72. Uso
Acceso
- datos.bcn.cl
- leer documentación de la ontología
- acceder a endpoint sparql
select ?p as ?Uri str(?n) as ?Nombre_Completo ?pa as ?Apellido_Paterno ?mo
as ?Apellido_Materno where {
?p a foaf:Person .
?p rdfs:label ?n.
?p bcnbio:surnameOfFather ?pa.
?p bcnbio:surnameOfMother ?mo.
}
74. Actualmente
Exponer partes de la norma y su metadata
Incorporar más datasets
Reseñas biográficas
Datos geográficos
Transparencia
Historia de la Ley
Congreso y Recursos legislativos (modelan los documentos del
Congreso Nacional)
Nuevas visualizaciones
75. Referencias
1. Carlos Iglesias (ed.), “Open Government Data: Feasibility Study in Chile”, 2011.
https://public.webfoundation.org/2011/05/OGD_Chile.pdf
3. Cirsfid - Università di Bologna, “XML Legislativo: Principios e instrumentos
técnicos”, documento interno BID, 2011
5. Harth, Rudolph & ul Mehdi, “Semantic Web Technologies I”, 2010,
http://semantic-web-grundlagen.de/w/images/3/3b/WS1011-1-Einleitung_und_XML.pdf