Este documento analisa o uso da propriedade owl:sameAs na Web de Dados, examinando as redes formadas por declarações sameAs e seus efeitos na inferência entre ontologias. Os autores analisam um grande conjunto de dados com declarações sameAs e encontram redes pouco conectadas e dominadas por poucos recursos populares. Eles também identificam comunidades de dados com interesses em comum.
SameAs Networks and Beyond: Analyzing Deployment Status and Implications of owl:sameAs in Linked Data
1. SameAs Networks and
Beyond: Analyzing
Deployment Status and
Implications of owl:sameAs
in Linked Data
Li Ding, Joshua Shinavier, Zhenning Shangguan,
and Deborah L. McGuinness
Ícaro
globo PUC-RIO
.com
13. SEMÂNTICA
de owl:sameAs
Oficial: URIs se referem a mesma coisa. É uma
relação simétrica e transitiva
Relação simétrica? Em mashups não. Duas URIs só
são consideradas fortemente equivalentes se
existem declarações sameAs recíprocas
Na prática, sameAs é dependente do contexto,
portanto a transitividade raramente é garantida
14. A literatura tem apontado usos
errados de sameAs, divergentes
da semântica original em OWL
[4]
16. Como as redes sameAs tem sido usadas na Web
of Data
Quais são os interesses em comum entre os
datasets da Linked Data? Como e por que eles
publicam mapeamentos usando owl:sameAs
Como as ontologias são afetadas pela inferência a
partir de owl:sameAs
17. DATASET
usado para testes
9 milhões de declarações owl:sameAs
Cobrindo ~7 milhões de recursos RDF
168 mil tipos (rdf:type) diferentes
967 datasets diferentes
19. GRAFO POUCO
conectado
Cada owl:sameAs cobre em média 2.4 URIs
A maioria dos componentes são pares simples de
nós com ligações owl:sameAs (geralmente
recíprocas)
A maioria das redes é na forma de estrela, onde
vários nós apontam para um (e.g. DBPedia)
20.
21. POPULARIDADE:
grau dos nós
Quantidade de inbound links para os recursos
Distribuição Long Tail: A imensa maioria dos
recursos tem 1 inbound link e alguns recursos tem
mais de 4 mil inbound links
38. Para saber como a inferência por owl:sameAs afeta
as ontologias, foi feito um case de ontology
mapping
Duas classes são consideradas similares se
compartilham instâncias em comum (instance-
based mapping)
Com essa rede é possível encontrar clusters de
classes, mapeamentos de ontologias e possíveis
erros de sameAs
41. Halpin et. al [4]: owl:sameAs é um tipo especial de
“link de entidade” e análise dessa entidade no
Linked Data de uma perspectiva filosófica e de
representação de conhecimento
Análise de grafos da Web Semântica e
propriedades como distribuição long tail, tamanho,
diâmetro, etc [13-17]
43. [4] H. Halpin and P. J. Hayes. When owl:sameAs isn’t the
same: An analysis of identity links on the semantic web. In
Proceedings of the International Workshop on Linked Data
on the Web, 2010.
[6] J. McCusker and D. L. McGuinness. owl:sameAs
considered harmful to provenance. In Proceedings of the
ISCB Conference on Semantics in Healthcare and Life
Sciences, 2010.
[13] W. Ge, J. Chen, W. Hu and Y. Qu. Object Link Structure
in the Semantic Web. In Proceedings of the 7th Extended
Semantic Web Conference (ESWC), 2010.
[15] Y. Theoharis, Y. Tzitzikas, D. Kotzinos, and V.
Christophides. On Graph Features of Semantic Web
Schemas. IEEE Transactions on Knowledge and Data
Engineering, Vol. 20, No. 5, May 2008.