Linked data de información geográfica Colombia conforme a GeoSPARQL
1. Universidad Politécnica de Madrid
Máster en Tecnologías de la Información
LINKED DATA GEOGRÁFICO
CONFORME A GEOSPARQL
Caso de aplicación: División territorial y
administrativa de Colombia
AUTOR: Jhonny Alexis Saavedra Velásquez
TUTORES: Luis Manuel Vilches Blázquez
Oscar Corcho García
Septiembre, 2011
Jhonny Saavedra
2. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Contenido
• Introducción
• Estado de la cuestión
• Planteamiento
• Contribuciones
• Desarrollo de recursos ontológicos
• Generación y publicación del Linked Data
• Conclusiones resultados y líneas futuras
Jhonny Saavedra 2 Tesis Máster TI
3. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Introducción
80%
Jhonny Saavedra 3 Tesis Máster TI
4. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Introducción
Linked Data Geomática
• Representación gráfica • Accesibilidad
de la localización de • Análisis automáticos
datos • Integración de fuentes
• Análisis espaciales diferentes
Jhonny Saavedra 4 Tesis Máster TI
5. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Contenido
• Introducción
• Estado de la cuestión
• Planteamiento
• Contribuciones
• Desarrollo de recursos ontológicos
• Generación y publicación del Linked Data
• Conclusiones resultados y líneas futuras
Jhonny Saavedra 5 Tesis Máster TI
6. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Estado de la cuestión
Datos Geoespaciales
• Tipos de representación
• Geometría
• Relaciones espaciales
• Sistema de referencia
• Topónimos
• Tipos de objetos
• Metadatos
Jhonny Saavedra 6 Tesis Máster TI
7. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Estado de la cuestión
Caracteristicas geométricas
Formatos de representación Vocabularios RDF
Categoria Geometria WKT GML GeoRSS GeoJSON WGS84 NeoGeo GeoSPARQL
Point X X X X X X X
Curve X X X
LineString X X X X X X
Line X X X
Orientable Curve X X
Solid X X
Orientable Surface X X
Primitive Surface X X X
Polygon X X X X X X
PolyhedralSurface X X X
Triangle X X X
TIN X X X
Circle X X X
ArcString X X
Ring - LinearRing X X X X
Envelope X X X
MultiCurve X X X
MultiLineString X X X X X
MultiPoint X X X X X
Aggregate
MultiSolid X X X
MultiPolygon X X X X X
MultiGeometry X X
Composite X X
CompositePoint X X
Complex CompositeCurve X X
CompositeSurface X X
CompositeSolid X X
Relaciones Espaciales X X X
Sistemas de WGS84 X X X X X X X
Referencia Otros X X X
Jhonny Saavedra 7 Tesis Máster TI
8. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Estado de la cuestión
Iniciativas Linked Data geográfico
Aspectos Dbpedia GeoNames OS OpenDATA LinkedGeoData GeoLinkedData
Punto X X X X X
Geometría Primitivas X X X
Aspectos Agregadas Dbpedia GeoNames OS X
Iniciativas OpenDATA LinkedGeoData GeoLinkedData
Linked Data geográfico
WKT X
Aspectos Territorial Dbpedia GeoNames OS OpenDATA LinkedGeoData GeoLinkedData
Formato
D. GML
de X
X X X
implementación GeoRSS
Punto X X X X X Hidrografía,
X
Geometría WGS84 X X X X X
Topografía,
Geometría Primitivas
Propio X X X X
Geografía
Sistema Agregadas
de WGS84 XX X X
Tipos Referencia
de objetos Otros Información X fisica,
Temáticos
WKT Puntos de interes X
D. Territorial ogeneral Geográfia
Formato de GMLAdm.
A. XX X X
humana,
implementación GeoRSS X Información
Hidrografía,
WGS84
Geometríade objetos X X X X Topografía, X
Tipos Estadistica
Información Geografía fisica,
Temáticos
Propio
SF OGC X Puntos de interes X
general Geográfia humana,
Relaciones
Sistema deERF
WGS84 X X Información X
Estadistica
Espaciales
Referencia RCC8.
Otros X
Otras OGC
SF X X
Relaciones ERF
Topónimos
Espaciales RCC8. X X X
Triple Store Otras Virtuoso RDF Dump Talis Virtuoso X Virtuoso
Topónimos X X X
Triple Store Virtuoso RDF Dump Talis Virtuoso Virtuoso
Jhonny Saavedra 8 Tesis Máster TI
9. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Contenido
• Introducción
• Estado de la cuestión
• Planteamiento
• Contribuciones
• Desarrollo de recursos ontológicos
• Generación y publicación del Linked Data
• Conclusiones resultados y líneas futuras
Jhonny Saavedra 9 Tesis Máster TI
10. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Planteamiento
Objetivo General
Generar y publicar Linked Data
geográfico de la división
territorial y administrativa de
Colombia conforme con la
especificación GeoSPARQL.
Jhonny Saavedra 10 Tesis Máster TI
11. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Planteamiento
Objetivos específicos y resultados
Objetivos Resultados
Desarrollar la red de ontologías base Red de ontologías que integra:
para la generación del Linked Data. - Ontología aspectos geométricos
- Ontología del dominio
Generar conjuntos de datos en Datos en formato RDF
formato RDF
Geometry2RDF (extensión)
Publicar la información conforme a los Linked Data geográfico de la división
requerimientos de Linked Data territorial y administrativa de Colombia
Jhonny Saavedra 11 Tesis Máster TI
12. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Contenido
• Contexto
• Planteamiento
• Estado de la cuestión
• Contribuciones
• Desarrollo de recursos ontológicos
• Generación y publicación del Linked Data
• Conclusiones resultados y líneas futuras
Jhonny Saavedra 12 Tesis Máster TI
13. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Desarrollo de recursos ontológicos
Metodología
Jhonny Saavedra 13 Tesis Máster TI
14. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Desarrollo de recursos ontológicos
Escenario 1
E1
Esp. requerimientos
Búsqueda recursos
Planeación
Jhonny Saavedra 14 Tesis Máster TI
15. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Desarrollo de recursos ontológicos
Recursos
Ontología
Geopolítica. Ontología GML
Catálogo de objetos
(IGAC)
GeoSPARQL
Ley Orgánica de
Ordenamiento
Territorial
Simple Feature
DIVIPOLA
(DANE)
Jhonny Saavedra 15 Tesis Máster TI
16. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Desarrollo de recursos ontológicos
Esp. requerimientos Proceso
E1
Búsqueda recursos
Planeación
DIVIPOLA
Simple
GML Feature GeoSPARQL Geopolitical C.Objetos Ley O.T.
E4 E2
C. formato E2
Extracción Geopolitical Ingeniería inversa
RDF-S
C. URI
Transformación
GeoSPARQL
SimpleFeature Generación
Geopolitical
E3
E3
GeoCol
GeoSPARQL
GeoLinkedCol
Jhonny Saavedra 16 Tesis Máster TI
17. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Desarrollo de recursos ontológicos
Escenario 2
Ley de
Creación
Código
Entidad
Territorial DANE
Territorio Área
País Departamento Distrito Municipio
indígena Metropolitana
estaFormadoPor
esParteDe estaFormadoPor
estaFormadoPor
esParteDe
esParteDe
Asociación E.T.
A. A. Áreas
A. Muncipios A. Distritos Provincia Región
Departamentos Metropolitanas
Jhonny Saavedra 17 Tesis Máster TI
18. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Desarrollo de recursos ontológicos
Escenario 2
Jhonny Saavedra 18 Tesis Máster TI
19. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Desarrollo de recursos ontológicos
Escenario 4
• Ontología en RDF-S GML del OGC.
http://schemas.opengis.net/gml/1.0.0/gml.rdfs
Jhonny Saavedra 19 Tesis Máster TI
20. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Desarrollo de recursos ontológicos
Escenario 3
Territory GML
Geopolitical
rdf:subClassOf
owl:equivalentClass
Geo:hasGeometry Geometry
Feature
SimpleFeature
rdf:subClassOf
GeoCol GeoSPARQL
GeoLinkedCol
Jhonny Saavedra 20 Tesis Máster TI
21. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Contenido
• Contexto
• Planteamiento
• Estado de la cuestión
• Contribuciones
• Desarrollo de recursos ontológicos
• Generación y publicación del Linked Data
• Conclusiones resultados y líneas futuras
Jhonny Saavedra 21 Tesis Máster TI
22. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Generación y publicación del Linked Data
Pasos para el desarrollo del Linked Data
http://geo.linkeddata.es
1. Identificación de recursos
de datos
2. Desarrollo del vocabulario
(recursos ontológicos)
3. Generación de Datos RDF.
4. Publicación de Datos RDF
(Triple store)
5. Vinculación de datos.
De León, Alexander, et al. (2010) Geographical Linked Data: a Spanish Use Case, I-SEMANTICS 6th International Conference on
Semantic Systems. Graz, Austria.
Jhonny Saavedra 22 Tesis Máster TI
23. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Generación y publicación del Linked Data
1. Identificación de recursos de Datos
Datos básicos
de población
Datos división territorial (IGAC) del CENSO
2005 (DANE)
DIVIPOLA
(DANE)
Jhonny Saavedra 23 Tesis Máster TI
24. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Generación y publicación del Linked Data
2. Desarrollo vocabulario
Territory GML
Geopolitical
rdf:subClassOf
owl:equivalentClass
Geo:hasGeometry Geometry
Feature
SimpleFeature
rdf:subClassOf
GeoCol GeoSPARQL
GeoLinkedCol
Jhonny Saavedra 24 Tesis Máster TI
25. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Generación y publicación del Linked Data
3. Generación de datos: Geometrías
GeoSPARQL
Jhonny Saavedra 25 Tesis Máster TI
26. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Desarrollo de recursos ontológicos
Recursos: características geométricas - GeoSPARQL
Especificación OGC (en desarrollo). Establece:
• Un vocabulario para representar objetos,
geometrías, y sus relaciones (RDF-S).
• Las funciones espaciales para su uso en consultas
SPARQL.
• Un conjunto de reglas de transformación de
consulta que permite interactuar con los tipos de
objetos y sus geometrías.
Jhonny Saavedra 26 Tesis Máster TI
27. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Desarrollo de recursos ontológicos
3. Generación de datos: Geometrías (2)
Jhonny Saavedra 27 Tesis Máster TI
28. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
3. Generación de datos en RDF - geometry2RDF
3. Generación de datos: Geometrías (3)
Tesis Máster TI
29. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Generación y publicación del Linked Data
3. Generación de datos: Geometrías (4)
rdf.type geontology:Municipio
http://geo.linkeddata.es/Barranquilla
rdfs:label geo:defaultGeometry
rdf.type simpleFeature:Multipolygon
BARRANQUILLA Geometry1
geo:asWKT
geo:sf-overlaps
geo:sf-intersects
MULTIPOLYGON ((-73.49226890599994
Geometry2 Geometry3
8.422333902000048 ))
rdf.type simpleFeature:WKTLiteral
Jhonny Saavedra 29 Tesis Máster TI
30. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Generación y publicación del Linked Data
3. Generación RDF: otros atributos
Jhonny Saavedra 30 Tesis Máster TI
31. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Generación y publicación del Linked Data
3. Generación RDF: otros atributos (2)
geontology:hombres
rdf.type geontology:Municipio 672700
http://geo.linkeddata.es/Barranquilla
geontology:Población geontology:CódigoDANE
1.345.678 0500345
geontology:mujeres
672980
Jhonny Saavedra 31 Tesis Máster TI
32. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Generación y publicación del Linked Data
4. Publicación de datos
CaracterísticasTriple Store Virtuoso OWLIM AllegroGraph OpenSahara Parliament
Vocabulario WGS84 WGS84 Propio Propio GeoSPARQL
Geometrías Puntos Puntos Primitivas Todas Todas
Serialización No No No Si Si
Relaciones espaciales No No Si Si Si
Funciones espaciales Si Si Si Si Si
Jhonny Saavedra 32 Tesis Máster TI
33. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Generación y publicación del Linked Data
4. Publicación de datos (2)
Triple store Open Source desarrollado por Raytheon
BBN Technologies.
• Compilación e
instalación
• Inserción de datos
RDF generados.
• Pruebas de
funcionamiento.
Jhonny Saavedra 33 Tesis Máster TI
34. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Generación y publicación del Linked Data
4. Publicación de datos (3)
Jhonny Saavedra 34 Tesis Máster TI
35. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Generación y publicación del Linked Data
4. Publicación de datos (4)
Jhonny Saavedra 35 Tesis Máster TI
36. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Generación y publicación del Linked Data
4. Publicación de datos (5)
Jhonny Saavedra 36 Tesis Máster TI
37. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Generación y publicación del Linked Data
SILK 5. Vinculación de datos
Jhonny Saavedra 37 Tesis Máster TI
38. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Generación y publicación del Linked Data
Control de enlaces
5. Vinculación de datos
Jhonny Saavedra 38 Tesis Máster TI
39. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Contenido
• Introducción
• Planteamiento
• Estado de la cuestión
• Desarrollo de recursos ontológicos
• Generación y publicación del Linked Data
• Conclusiones resultados y líneas futuras
Jhonny Saavedra 39 Tesis Máster TI
40. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Conclusiones, resultados, y líneas futuras
Conclusiones: Vocabularios y ontologías geoespaciales
• La especificación mas • Parliament implementa
completa es GeoSPARQL. GeoSPARQL, y puede realizar
Esta recoge muchos de los consultas espaciales.
aspectos desarrollados por
otras iniciativas de Linked • Geometry2RDF, genera RDF
Data geográfico. según GeoSPARQL
• Las divisiones territoriales • El que Geometry2RDF soporte
insumo básico generar Linked archivos de tipo shapefile
Data. simplifica el proceso de conversión
de geometrías a RDF
• La red de ontologías
generada es un recurso
reutilizable en otros
proyectos de Linked Data.
Jhonny Saavedra 40 Tesis Máster TI
41. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Conclusiones, resultados y líneas futuras
Líneas Futuras
• Opción de serializar solo geometrías simples y
representar las compuestas como un conjunto de
estas GeoSPARQL.
• Implementación de GeoSPARQL en otros Triple
store.
• Desarrollo de herramienta de visualización de
datos.
Jhonny Saavedra 41 Tesis Máster TI
42. LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL
Motivation
Gracias
Jhonnysaavedra@gmail.com
Jhonny Saavedra 42 Tesis Máster TI