O documento descreve o projeto SPUK (SP + UK Project for Design Abertura) que tem como objetivo melhorar o ambiente de negócios em São Paulo por meio da transparência no governo estadual, se inspirando na experiência do Reino Unido. O projeto visa intensificar o programa de transparência do estado, gerenciando dados abertos para uso tanto por negócios quanto pela sociedade civil.
4. Objetivos
• Experiência do Reino Unido (data.gov, Open
Data Institute e UK Bribery Act)
• Intensificação do programa de transparência do
Estado
• Gestão de dados abertos para uso em negócios
e pela sociedade civil
• Aplicação de medidas efetivas de combate à
corrupção.
5. O Projeto
SPUK
É um
SP + UK
Project
for Design
Abertura
Design Thinking
Interconexão
Linked Data
Transparência, Acesso,
Anticorrupção
Tem
Tem
+70% dados
3% dados
6. Publicar informação na Web sob licença de dados
abertos (p. ex. PDF).
Publicar na forma de dados estruturados
(p. ex. planilha Excel).
Formatos não proprietários
(p. ex., tabela CSV).
Identificadores uniformes (URIs/IRIs) para os
RECURSOS*. Uso de metadados.
Conexão entre os seus dados e outros,
provendo CONTEXTO... Dados Conectados!
Graus de Abertura (Berners-Lee)
7. Web Semântica
A-B-C-D do i
Esforço colaborativo global
para inteligência na internet
• Artificial: compreensão por máquina
• Business: ecossistemas de relacionamento
• Conhecimento: representação
• Dados: Metadados, Big Data, Governo
8. Bases para Linked Data
• Recursos – qualquer coisa
• Linguagens de marcação – declarativas (XML)
• Triplas – “Sujeito-Predicado-Objeto” ou
“Recurso-Propriedade-Valor”
• Framework de Descrição de Recursos (RDF)
• GRAFOS – nós/arcos ou vértices/bordas
• Ontologias – conceitos, domínios de
conhecimento
• Vocabulários controlados
9. Framework de Descrição
de Recursos (RDF)
Exemplo: como uma pessoa está
relacionada com outros recursos.
dc: documento
foaf: pessoa
vocab2: empresa
10. Exemplo: Vocabulário FOAF
• O vocabulário Friend of a Friend (FOAF), para a
definição de metadados sobre pessoas, seus
interesses, seus relacionamentos e suas
atividades.
• Possui um conjunto central de classes e
propriedades (ex.: Agent, Person, Name, Title)
12. Grafo Global Gigante
Quando todos os recursos
forem descritos dessa
maneira, a Web se torna
um banco de dados
gigante...
13. Uso da Pilha Tecnológica
Buscas de conceitos
Relacionamento
com Clientes
Gestão da
Conversação &
& Otimização
de busca
Interface do Usuário & Aplicativos
Confiança
Prova
Lógica Unificadora
SPARQL
Ontologia: OWL
RDF-S
RDF
XML
URI/IRI
Criptografia
Regra:RIF
16. Ferramentas x Ciclo de Vida
Etapa
Ferramenta
Modelagem
ontológica
Extração Transformação Carga Publicação
Kettle Não Sim Não Não Não
Protégé Sim Sim Sim Não Não
Open Refine Não Sim Sim Não Não
Drupal Não Sim Sim Sim Sim
Virtuoso Não Sim Sim Sim Sim
CKAN Não Não Não Não Sim
DKAN Não Não Não Não Sim
D2R Não Sim Sim Não Não
Apache Jena /
Fuseki
Não Não Sim Sim Sim
17. Testes
Alternativa Entrada
Modelagem
ontológica
Extração Transformação Carga Sparkl Publicação
1 CSV Protégé Drupal Drupal Drupal Add-in Drupal
2 XML
FlexViz ou
NeOn
Open
Refine
Open Refine Virtuoso Virtuoso
Virtuoso ou
DKAN
3 SQL Protégé Protégé
Protégé (com
Ontop e LOV)
Virtuoso Virtuoso CKAN
4 SQL Protégé D2R D2R D2R D2R
CKAN ou
DKAN
27. Recursos Envolvidos
• Infraestrutura (Hardware / Software)
4 servidores colocation CAT II disponibilizados
pela Prodesp
Ferramentas open source (sem custo)
• Pesquisa
Guias SPUK, Cursos Escola de Políticas Públicas
muita Internet e muitos livros...
30. Próximos Passos
• Transformação semântica de outras bases.
• Estruturação organizacional.
• Validações: sintática, semântica e de
aplicações.
• Aperfeiçoamento no uso de ferramentas e
processos.
• Participação ativa no desenvolvimento
global da WS.