El documento describe el proyecto SAN-LOD para publicar los datos del Sistema Archivístico Nacional Italiano (SAN) como datos enlazados abiertos. El proyecto creó una ontología para formalizar el modelo conceptual del SAN y transformó los datos existentes a OWL usando la ontología. Los datos SAN-LOD ahora incluyen 4.6 millones de triples RDF publicados con licencia abierta en http://dati.san.beniculturali.it para su reutilización.
Aspectos Generales para un programa de Gestión Documental
Similar a SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)
Construcción de bibliotecas y repositorios documentales digitales Parte 4Ángel M. Delgado-Vázquez
Similar a SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia) (20)
Proyecto integrador. Las TIC en la sociedad S4.pptx
SAN-LOD: el Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados por Alessandro Chiaretti (Istituto Centrale per gli Archivi, Italia)
1. Istituto Centrale ppeerr ggllii AArrcchhiivvii
1
SAN-LOD
El Sistema Archivístico Nacional Italiano como
Datos Abiertos Enlazados
http://dati.san.beniculturali.it
Alessandro Chiaretti
InnovaTICS, agosto 2014
2. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
Istituto Centrale per gli Archivi – ICAR
• Mandato institucional:
• Promover soluciones innovadoras para conseguir la
interoperabilidad tecnológica y semántica entre los sistemas
archivísticos del país;
• Realizar herramientas para la interoperabilidad tecnológica
y semántica, y ofrecer servicios de uso avanzado dirigidos a
distintos niveles de usuarios.
InnovaTICS 2014 2
3. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
Datos Abiertos Enlazados
• ¿Qué son? http://vimeo.com/album/2072014/video/49231112
• La Web Semántica y las iniciativas relacionadas
con Datos Abiertos Enlazados estimulan a las
instituciones para que publiquen, compartan y
conecten sus datos;
• Gran potencial para las instituciones de memoria,
proveedores de contenidos muy valiosos, en la
medida que puedan complementar los propios
datos con fuentes externas.
InnovaTICS 2014 3
4. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 4
LOD en Bibliotecas
• Las bibliotecas han reconocido este potencial, y ya
son varias las que han abierto o están abriendo sus
datos.
5. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 5
LOD en archivos
• Todavía pocos ejemplos:
– LOCAH y Linking Lives (Reino Unido);
– ReLoad - Repository for Linked open archival data (Italia).
6. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
SAN - Sistema Archivistico Nazionale
• Sistema Archivístico Nacional de Italia;
• Inaugurado en diciembre de 2011, gestionado por ICAR;
• Portal aglutinador de recursos archivísticos: punto de acceso
integrado al patrimonio archivístico italiano, que pone a
disposición descripciones de archivos y recursos digitales de
naturaleza heterogénea;
• 553.214 recursos archivísticos y digitales, provenientes de 21
sistemas de archivos (estatales y privados);
• www.san.beniculturali.it
InnovaTICS 2014 6
7. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
Catálogo de los recursos archivísticos - CAT
• Repositorio de datos archivísticos:
• Conjuntos archivísticos;
• Productores;
• Instrumentos de descripción;
• Conservadores;
• Los sistemas adheridos a SAN envían los datos en base a un
formato de intercambio (XML schema) definido a nivel central
en el año 2009 (Sottocommissione tecnica per la definizione dei
metadati relativi alle risorse archivistiche rese accessibili attraverso il
Sistema Archivistico Nazionale).
InnovaTICS 2014 7
8. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
SAN-LOD: objetivos
• Convertir los datos de SAN en Datos Abiertos Enlazado para:
• Poner a disposición recursos visibles y reusables en la web,
también fuera de su contexto original de utilización y de
creación;
• Permitir nuevas conexiones entre sujetos, personas,
organizaciones y lugares, con la finalidad de promover la
investigación interdisciplinaria y enriquecer el conocimiento
histórico.
InnovaTICS 2014
8
9. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 9
SAN-LOD: objetivos
schemaEAD.xsd
SAN-LOD.owl
schemaEAC.xsd
strumenti.xsd
scons.xsd
10. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
Primera fase: la ontología
• Ontología: representación de un conjunto de conceptos y
relaciones entre ellos en un dominio determinado,
estructurada formalmente;
• OWL (Ontology Web Language) para formalizar el modelo
conceptual SAN de descripción de objetos archivísticos,
correspondiente a la estructura de los XML schema;
• Extensión de la estructura a través de introducción de
nuevas entidades y relaciones (contextos históricos, perfiles
de instituciones, tesauros SKOS).
InnovaTICS 2014 10
11. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
La Ontología SAN:
27 class y subclass, 50 data properties, 35 object properties
InnovaTICS 2014 11
12. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
Tesauro SAN
• Tesauro en formato SKOS (Simple Knowledge Organisation
System) que reúne a los diccionarios controlados del CAT
SAN, y además agrega la posibilidad de asociar temas a los
conjuntos archivísticos;
• Herramienta de soporte al control de la descripción
archivística, que puede seguir integrando datos de varias
proveniencias y convertirse en un marco de informaciones
indispensables para contextualizar los datos.
InnovaTICS 2014 12
13. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
Segunda fase: los datos
• Transformación de los datos en OWL, en base a la ontología;
• Agregación a los datos originales de las propiedades más
usadas en LOD (Dublin Core, Foaf…);
• Interlinking de los recursos SAN con recursos externos, de
dominio archivístico (ReLoad) o más general (DBpedia,
GeoNames…).
InnovaTICS 2014 14
14. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
Datos Abiertos Enlazados SAN
InnovaTICS 2014 15
Soggetto
produttore
Soggetto
Conservatore
Complesso
Archivistico
Tematismo
Luogo
Strumenti di
ricerca
Profilo
istituzionale
Contesto
storico
istituzionale
GeoNames
DBpedia
Dominio GGASI
Otros dominios externos
SISTAT
Istat
Dominio SIAS
Toponimi
Storici
Persona
ente
Relazione famiglia
CPF
Sito web
Luogo
Cons
Tesauro
SAN
Dominio SAN
15. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
Publicación de los datos SAN-LOD
• http://dati.san.beniculturali.it;
• Licencia Italian Open Data Licence V.2.0;
• Todos los datos disponibles para la descarga, la navegación
y la reutilización:
• 4.607.024 tripletas en Endpoint Sparql (Virtuoso rdf store);
• 97 datasets para descarga en formatos RDF/XML, TTL,
CSV;
• Consulta Html.
InnovaTICS 2014 16
16. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
www.san.beniculturali.it
InnovaTICS 2014 18
17. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
http://dati.san.beniculturali.it
InnovaTICS 2014 19 19
18. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
RAW DATA
InnovaTICS 2014 20
19. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014
21
http://lodlive.it/
DBpedia
SAN
ReLoad
20. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
Próximas evoluciones: Atlas Histórico Institucional
InnovaTICS 2014 22
(ASI)
• Ulterior extensión de la ontología SAN-LOD;
• Datos sobre la historia del territorio italiano, que van a ampliar
y profundizar el conocimiento;
• Repertorio histórico administrativo-territorial, que pretende
poner a disposición de la comunidad un catálogo de
autoridades de topónimos a nivel nacional;
• Los topónimos históricos de ASI van a constituir un marco de
referencia en el entorno LOD, tanto para el SAN como para
cualquier futura operación descriptiva de tipo histórico-geográfica.
21. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
Beneficios
• Aumento considerable de la visibilidad de los datos
archivísticos, gracias a la publicación en formatos abiertos y a
la interconexión con otras fuentes de información;
• Con la publicación centralizada de los datos por parte del
SAN, todos los sistemas que lo componen se ven
beneficiados, sin necesidad de hacer nuevas inversiones en
tecnología;
• Los datos del SAN, como en general los datos de bibliotecas
y archivos, son manejados por profesionales de la
información y tienden a ser de muy alta calidad. Por ello,
tienen el potencial de convertirse en una indispensable
columna vertebral de la creciente Web Semántica.
InnovaTICS 2014 23
22. SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014
Contactos
ICAR (Istituto Centrale per gli Archivi)
Direttore: Marina Giannetto
via di Castro Pretorio 105, 00185 Roma
ic-a@beniculturali.it; mbac-ic-a@mailcert.beniculturali.it;
http://www.icar.beniculturali.it/
24
Alessandro Chiaretti
ale.chiaretti@gmail.com