SlideShare una empresa de Scribd logo
1 de 40
Oficina Técnica
                          da
Infraestrutura Nacional de Dados Abertos - INDA


              Nitai Bezerra da Silva
             Brasília, 20 de setembro de 2012
http://br.okfn.org/2012/05/10/novo-portal-dados-gov-br-feito-pela-sociedade/
Agenda
●   O que é a INDA                 ●   Catalogando dados
●   Arquiteturas para publicação   ●   Outros portais com CKAN
    de dados                       ●   Colheita de Metadados
●   Formatos de arquivos               (Harvesting)
●   Caso: API do Siconv            ●   DataStore
●   Web, REST APIs, etc..          ●   Linked Data
●   Aplicativos e Mashups          ●   Desenho de URIs
●   Arquitetura lógica da INDA     ●   As 5 estrelas dos Dados
                                       Abertos
●   Portal dados.gov.br
●   Metadados
Infraestrutura Nacional de Dados
                 Abertos
Objetivos:

Proporcionar aos cidadãos, e ao governo , um ponto de acesso central aos dados públicos,
disponível na web.

Coordenar e orientar a padronização no ciclo de vida da informação, em especial no
momento de sua publicação na web .

Incentivar a agregação de valor aos dados públicos e a colaboração com o cidadão na
implementação de novos serviços à sociedade.

Ser uma iniciativa sustentável de Dados Abertos.

Para isso:

Conjunto de padrões, tecnologias, procedimentos e mecanismos de controle necessários para
se publicar dados abertos governamentais, visando seu reuso não só pela sociedade mas
pelo próprio governo.                                       http://wiki.gtinda.ibge.gov.br/
Arquiteturas de Publicação de Dados
●   Requisitos
    ●   As 3 leis e os 8 princípios!   http://dados.gov.br/dados-abertos/



●   Tipos de publicação
    ●   Arquivo isolado, resultado de pesquisa ou
        levantamento
    ●   Avaliações, balanços, levantamentos recorrentes
        (semanal, mensal, trimestral)
    ●   Publicações em “tempo real” (diária,
        "instantânea”,....)
Publicação manual
●   Os dados são coletados, transformados e
    publicados num processo manual
    ●   Sistematizar não vale a pena! (?)
    ●   O processo manual é confiável? (!)
●   Exemplo:
    ●   Balanço do PAC, quadrimestral
    ●
        http://dados.gov.br/dataset/obras-do-pac-programa-de-aceleracao-do-crescimento
Publicação automatizada (1)




       fonte: http://www.peterkrantz.com/2012/publishing-open-data-api-design/
Publicação automatizada (2)
●   Questões levantadas por Peter
    Krantz:
    ●   Você realmente precisa de
        uma API?
    ●   Sua infraestrutura está
        preparada?
    ●   Torne fácil que
        empreendedores tenham os
        dados mais novos
    ●   Tenha liberdade da
        tecnologia. Não quebre
        URLs...


                         fonte: http://www.peterkrantz.com/2012/publishing-open-data-api-design/
Publicação automatizada (3)
●   Sistema em produção isolado
    ●   Mais seguro
    ●   Maior disponibilidade
    ●   Esquema de dados
        simplificado
    ●   Autenticidade (gov.br)
    ●   custo ~ benefício?
Formatos de arquivos
●   Requisito
    ●   Formato não proprietário
CSV         DOC        MBD           Other Geo   Spreadsheets   WS
XLS         ECW        MDB           PGDB        SQL            WSDL
XML         EXE        Metastock     PNG         TIFF           XHTML
PDF         Geo RSS    Micro Station Design
                                     Portal      TMX            XLS zip+
HTML        Geo TIFF   N3            PPT         TSV            API
JSON        GML        OAI-PMH       RAW         Turtle         ASCII
KML         GPX        ODF           RDFa        TXT+ Zip       Autre
XLSX        JPG        ODS           RDF- XML    URL            CIDR
RDF         JS         ODT           REST        WEB            CSV+Zip
SHP         KMZ        Omega         RTF         Webpage        Datastream
RSS         Mapinfo    Online Database
                                     SOAP        WFS            DBF
TXT         Mathlab    openDataXML SPARQL        WMS            XML-ATOM-RSS
XSD         YAML       Zip           zip+sas
                                                                  fonte: neeta neeta@nic.in
Formatos de arquivos
●   Qual o melhor?
    ●   Depende dos seus dados, e da situação!

●   Algumas orientações:
    ●   Preferir JSON à XML
    ●   Preferir CSV à ODS
    ●   Escolha um formato estável e de amplo uso
    ●   Se possível, publique em mais de um formato
Formatos de arquivos
●   Mais orientações:
    ●   Desaconselhamos compactar os arquivos
    ●   Pesquise pelos formatos com mais audiência
    ●   Para dados geográficos, conheça a INDE –
        Infraestrutura Nacional de Dados Abertos
        –   http://inde.gov.br/
    ●   Sonhe com o RDF!!

    ●   Para mais detalhes:
        –   Cartilha técnica para publicação de dados abertos
                    http://dados.gov.br/cartilha-publicacao-dados-abertos/
Caso: API do SICONV
●   SICONV: Sistema que administra os convênios
    entre APF, estados, municípios, DF e EPSFL.
●   A API está em fase beta
●   Requisitos:
    ●   Dados em tempo “real”
    ●   Replicação dos dados da produção
    ●   Web Service REST
    ●   JSON, CSV, XML, ... e HTML
Caso: API do SICONV
●   Endereço: http://api.convenios.gov.br
    ●   Bonito né?!
●   Outras tecnologias:
    ●   Princípios REST
    ●   CORS - Cross-origin resource sharing
    ●   HATEOAS
●   Exemplo de consulta:
    ●   http://api.convenios.gov.br/siconv/dados/orgao/54000
Web, REST APIs, etc..




Web != Internet
Web, REST APIs, etc.. (2)
●   Internet = infraestrutura, um amontoado de
    computadores, redes e cabos
●   Web = HTTP (hypertext transfer protocol)
    ●   Documentos
    ●   Hiperlinks
    ●   URLs

●   Aprenda os fundamentos e faça melhor uso da
    Web
Web, REST APIs, etc.. (3)
●   REST - Representational State Transfer
●   Alguns princípios
    ●   Separação do Cliente e do Servidor
    ●   Sem estado (stateless)
    ●   Cacheável
    ●   Sistemas em camadas
    ●   Recursos – pedaço específico de informação (URI)
●   Esqueça SOAP
●   Seja RESTful
Web, REST APIs, etc.. (4)
●   HATEOAS - Hypermedia as the engine of application
    state
●   O princípio é de que o cliente interage com a
    aplicação estritamente através das hipermídias
    providas pelo servidor de aplicação.
●   Possibilita um maior desacoplamento servidor-
    cliente
●   Exemplo: navegue em
    http://api.convenios.gov.br/siconv/doc/metodos.html
●   Consulte no google: “dados abertos novo hamburgo”
Aplicativos e Mashups
   http://dados.gov.br/aplicativos
Experimento
1. Baixe os dados do PAC no portal dados.gov.br
2. Abra no LibreOffice e faça a conversão do tipo geográfico
   ●   =CONCATENAR(SE(DIREITA(TIRAR(O2);1)="S";"-";"");EXT.TEXTO(O2;1;PROCURAR("°";O2;1)-1)+
       (EXT.TEXTO(O2;PROCURAR("°";O2;1)+1;PROCURAR("'";O2;1)-PROCURAR("°";O2;1)-
       1)/60)+CONCATENAR((EXT.TEXTO(O2;PROCURAR("'";O2;1)+1;PROCURAR(".";O2;1)-PROCURAR("'";O2;1)-
       1));",";EXT.TEXTO(O2;PROCURAR(".";O2;1)+1;PROCURAR(CARACT(34);O2;1)-PROCURAR(".";O2;1)-
       1))*1/3600)*1

3. Suba os dados para o Google Fusion Tables
4. Mais 2 cliques e ...




Passos: https://groups.google.com/forum/?fromgroups=#!topic/thackday/uJisBSNNgkU
Arquitetura lógica da INDA
●   A INDA está fundamentada na Web
●   É a união dos dados publicado em
    todos os órgãos
●   O portal é um buscador
●   O portal armazena os
    metadados
●   Cada órgão é
    responsável pelos seus
    dados
Portal Brasileiro de Dados Abertos
               dados.gov.br
●
    Utilizamos o CKAN        ●
                                 Outras tecnologias
     ●
         Software Livre          ●
                                     Diazo
         especializado           ●
                                     Varnish
     ●
         Modelo flexível e       ●
                                     HG – Mercurial
         extensível
                                 ●
                                     Solr
●
    Integração com CMS
                                 ●
                                     PortgreSQL
     ●
         Wordpress
                                 ●
                                     Apache
●
    VCGE para organizar
    assuntos
                                 ●
                                     Python
Portal Brasileiro de Dados Abertos
               dados.gov.br
●   É um catálogo
●   Guarda metadados
●   Conceitos básicos:
     ●   Conjuntos de dados
     ●   Recursos
     ●   Grupos
     ●   Etiquetas, licença, ...
CKAN
●   Características:
    ●   Sistema de catálogo de busca de dados
    ●   API para busca e inserção
    ●   Plugins para integração com CMSs (Drupal e WP)
    ●   Visualização de dados e analytics
    ●   Workflow permite orgãos administrarem seus
        dados
    ●   Storage de dados integrado
    ●   Possibilita federação de catálogos
Metadados - catalogação
●   “Dados sobre os dados”
●   Descrevem o conjunto de dados
●   Cobertura, descrição, proveniência, extração, etc..
●   Úteis na classificação e indexação dos dados
●   É o coração do catálogo
●   Metadados:
    ●   Mínimos (obrigatórios)
    ●   Extras (desejáveis)
Metadados - catalogação
●   Mínimos:                           ●   Extras:
    ●   Título                             ●   Etiquetas
    ●   Descrição                          ●   Autoria
    ●   Catálogo de origem                 ●   Cobertura geográfica e
    ●   Órgão responsável                      temporal
    ●   Assuntos do VCGE
                                           ●   Granularidade geográfica
                                               e temporal
    ●   Formato de arquivo                 ●   Atualidade
                                           ●   Referências
                                           ●   Ontologia/vocabulário
                                           ●   ...
                             http://dados.gov.br/cartilha-publicacao-dados-abertos/
Catalogando dados (exemplo)
    http://treino.dados.gov.br
●   Dados?
    ●   Séries estatísticas no IBGE sobre educação
    ●   http://seriesestatisticas.ibge.gov.br/lista_tema.aspx?op=0&no=4
Catalogação pela API
●   CKAN provê uma API para administração
●   Documentação:
    ●   http://docs.ckan.org/en/latest/api.html
Portais com CKAN
●   Senado, Reino Unido, Buenos Aires, ...




                    Mais: http://ckan.org/2012/07/31/new-ckan-data-portals/
Colheita de metadados - Harvesting
●   Plugin que possibilita federação dos dados
●   Replica os metadados entre catálogos
●   Cada estado e município pode ter um portal de
    dados abertos
    ●   dados.rs.gov.br?
    ●   dados.pe.gov.br?


●   Documentação:
    ●   https://github.com/okfn/ckanext-harvest
DataStore
●   Serviço de armazenamento e acesso a dados
    estruturados pela web
●   Software que se integra com o CKAN
●


●   Documentação:
    ●   http://blog.okfn.org/2012/03/27/introducing-the-datastore/
Linked Data
●   Usar a Web para ligar dados relacionados

    ●   Expor dados na web
    ●   Compartilhar esses dados
    ●   Conectar pedaços de dados, informações e
        conhecimento

●   Usando:
    ●   URIs
    ●   RDF – Resource Description Framework
Linked Data(2)
Linked Data(3)
Linked Data (4)
●   Princípios de Linked Data (note de Tim BL):
    ●   usar URIs como nomes para as coisas;
    ●   usar URIs do tipo HTTP, para que as pessoas
        possam recuperar essas coisas;
    ●   quando alguém recuperar uma URI, fornecer
        informações úteis, usando os padrões;
    ●   inclua links para outras URIs, para que as pessoas
        possam descobrir mais coisas [relacionadas]
                       http://www.w3.org/DesignIssues/LinkedData.html
Desenho de URIs
●   “Dar nome às coisas na Web”
●   Nomear coisas concretas ou abstratas
    ●   http://education.data.gov.uk/id/school/123065
    ●   http://reference.data.gov.uk/def/central-government/PermanentSecretary


●   Objetivos
    ●   Nome único
    ●   Ser persistente por muito tempo
    ●   Ser pequeno e legível por humanos
    ●   Incorporar identificadores já em uso
Desenho de URIs(2)




       fonte:http://data.gov.uk/resources/uris
Desenho de URIs(3)
    ●   Templates




Fonte: http://www.cabinetoffice.gov.uk/sites/default/files/resources/designing-URI-sets-uk-public-sector.pdf
As 5 estrelas dos Dados Abertos




           http://5stardata.info/
contato@dados.gov.br
   @dadosgovbr

Más contenido relacionado

Similar a Oficina técnica da Infraestrutura Nacional de Dados Abertos - INDA

Oficina Técnica da INDA em Belém no Consegi
Oficina Técnica da INDA em Belém no ConsegiOficina Técnica da INDA em Belém no Consegi
Oficina Técnica da INDA em Belém no Conseginitaibezerra
 
I Oficina Técnica de Publicação de Dados Abertos e Transparência Ativa
I Oficina Técnica de Publicação de Dados Abertos e Transparência AtivaI Oficina Técnica de Publicação de Dados Abertos e Transparência Ativa
I Oficina Técnica de Publicação de Dados Abertos e Transparência Ativanitaibezerra
 
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...tdc-globalcode
 
Como um grande sistema REST funciona - arquitetura e desempenho
Como um grande sistema REST funciona - arquitetura e desempenhoComo um grande sistema REST funciona - arquitetura e desempenho
Como um grande sistema REST funciona - arquitetura e desempenhoDavid Robert Camargo de Campos
 
Web APIs e dados abertos - API de Compras Governamentais
Web APIs e dados abertos - API de Compras GovernamentaisWeb APIs e dados abertos - API de Compras Governamentais
Web APIs e dados abertos - API de Compras Governamentaisnitaibezerra
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATALeonardo Dias
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dadosElton Meira
 
[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de Dados[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de DadosDeep Tech Brasil
 
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big DataDeep Tech Brasil
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoAmbiente Livre
 
BigQuery Performance Improvements Storage API
BigQuery Performance Improvements Storage APIBigQuery Performance Improvements Storage API
BigQuery Performance Improvements Storage APIAlvaro Viebrantz
 
Considerações técnicas para atlas temáticos digitais e interfaces para dados ...
Considerações técnicas para atlas temáticos digitais e interfaces para dados ...Considerações técnicas para atlas temáticos digitais e interfaces para dados ...
Considerações técnicas para atlas temáticos digitais e interfaces para dados ...Tasso Evangelista Pinto
 
Atlas Digitais e interfaces para dados abertos
Atlas Digitais e interfaces para dados abertosAtlas Digitais e interfaces para dados abertos
Atlas Digitais e interfaces para dados abertosAlligo Web
 
Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Ambiente Livre
 
Big Data como Serviço: da captura à visualização de dados com alto desempenho
Big Data como Serviço: da captura à visualização de dados com alto desempenhoBig Data como Serviço: da captura à visualização de dados com alto desempenho
Big Data como Serviço: da captura à visualização de dados com alto desempenhoRicardo Longa
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharepccdias
 
Python Eve - APIs RESTful Profissionais em poucas linhas
Python Eve - APIs RESTful Profissionais em poucas linhasPython Eve - APIs RESTful Profissionais em poucas linhas
Python Eve - APIs RESTful Profissionais em poucas linhasRuda Filgueiras
 

Similar a Oficina técnica da Infraestrutura Nacional de Dados Abertos - INDA (20)

Oficina Técnica da INDA em Belém no Consegi
Oficina Técnica da INDA em Belém no ConsegiOficina Técnica da INDA em Belém no Consegi
Oficina Técnica da INDA em Belém no Consegi
 
I Oficina Técnica de Publicação de Dados Abertos e Transparência Ativa
I Oficina Técnica de Publicação de Dados Abertos e Transparência AtivaI Oficina Técnica de Publicação de Dados Abertos e Transparência Ativa
I Oficina Técnica de Publicação de Dados Abertos e Transparência Ativa
 
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
 
Como um grande sistema REST funciona - arquitetura e desempenho
Como um grande sistema REST funciona - arquitetura e desempenhoComo um grande sistema REST funciona - arquitetura e desempenho
Como um grande sistema REST funciona - arquitetura e desempenho
 
Web APIs e dados abertos - API de Compras Governamentais
Web APIs e dados abertos - API de Compras GovernamentaisWeb APIs e dados abertos - API de Compras Governamentais
Web APIs e dados abertos - API de Compras Governamentais
 
Conhecendo o Django
Conhecendo o DjangoConhecendo o Django
Conhecendo o Django
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATA
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dados
 
[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de Dados[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de Dados
 
Big Data
Big DataBig Data
Big Data
 
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
 
Construindo um sistema distribuido usando rest
Construindo um sistema distribuido usando restConstruindo um sistema distribuido usando rest
Construindo um sistema distribuido usando rest
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
 
BigQuery Performance Improvements Storage API
BigQuery Performance Improvements Storage APIBigQuery Performance Improvements Storage API
BigQuery Performance Improvements Storage API
 
Considerações técnicas para atlas temáticos digitais e interfaces para dados ...
Considerações técnicas para atlas temáticos digitais e interfaces para dados ...Considerações técnicas para atlas temáticos digitais e interfaces para dados ...
Considerações técnicas para atlas temáticos digitais e interfaces para dados ...
 
Atlas Digitais e interfaces para dados abertos
Atlas Digitais e interfaces para dados abertosAtlas Digitais e interfaces para dados abertos
Atlas Digitais e interfaces para dados abertos
 
Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre
 
Big Data como Serviço: da captura à visualização de dados com alto desempenho
Big Data como Serviço: da captura à visualização de dados com alto desempenhoBig Data como Serviço: da captura à visualização de dados com alto desempenho
Big Data como Serviço: da captura à visualização de dados com alto desempenho
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
Python Eve - APIs RESTful Profissionais em poucas linhas
Python Eve - APIs RESTful Profissionais em poucas linhasPython Eve - APIs RESTful Profissionais em poucas linhas
Python Eve - APIs RESTful Profissionais em poucas linhas
 

Oficina técnica da Infraestrutura Nacional de Dados Abertos - INDA

  • 1. Oficina Técnica da Infraestrutura Nacional de Dados Abertos - INDA Nitai Bezerra da Silva Brasília, 20 de setembro de 2012
  • 3. Agenda ● O que é a INDA ● Catalogando dados ● Arquiteturas para publicação ● Outros portais com CKAN de dados ● Colheita de Metadados ● Formatos de arquivos (Harvesting) ● Caso: API do Siconv ● DataStore ● Web, REST APIs, etc.. ● Linked Data ● Aplicativos e Mashups ● Desenho de URIs ● Arquitetura lógica da INDA ● As 5 estrelas dos Dados Abertos ● Portal dados.gov.br ● Metadados
  • 4. Infraestrutura Nacional de Dados Abertos Objetivos: Proporcionar aos cidadãos, e ao governo , um ponto de acesso central aos dados públicos, disponível na web. Coordenar e orientar a padronização no ciclo de vida da informação, em especial no momento de sua publicação na web . Incentivar a agregação de valor aos dados públicos e a colaboração com o cidadão na implementação de novos serviços à sociedade. Ser uma iniciativa sustentável de Dados Abertos. Para isso: Conjunto de padrões, tecnologias, procedimentos e mecanismos de controle necessários para se publicar dados abertos governamentais, visando seu reuso não só pela sociedade mas pelo próprio governo. http://wiki.gtinda.ibge.gov.br/
  • 5. Arquiteturas de Publicação de Dados ● Requisitos ● As 3 leis e os 8 princípios! http://dados.gov.br/dados-abertos/ ● Tipos de publicação ● Arquivo isolado, resultado de pesquisa ou levantamento ● Avaliações, balanços, levantamentos recorrentes (semanal, mensal, trimestral) ● Publicações em “tempo real” (diária, "instantânea”,....)
  • 6. Publicação manual ● Os dados são coletados, transformados e publicados num processo manual ● Sistematizar não vale a pena! (?) ● O processo manual é confiável? (!) ● Exemplo: ● Balanço do PAC, quadrimestral ● http://dados.gov.br/dataset/obras-do-pac-programa-de-aceleracao-do-crescimento
  • 7. Publicação automatizada (1) fonte: http://www.peterkrantz.com/2012/publishing-open-data-api-design/
  • 8. Publicação automatizada (2) ● Questões levantadas por Peter Krantz: ● Você realmente precisa de uma API? ● Sua infraestrutura está preparada? ● Torne fácil que empreendedores tenham os dados mais novos ● Tenha liberdade da tecnologia. Não quebre URLs... fonte: http://www.peterkrantz.com/2012/publishing-open-data-api-design/
  • 9. Publicação automatizada (3) ● Sistema em produção isolado ● Mais seguro ● Maior disponibilidade ● Esquema de dados simplificado ● Autenticidade (gov.br) ● custo ~ benefício?
  • 10. Formatos de arquivos ● Requisito ● Formato não proprietário CSV DOC MBD Other Geo Spreadsheets WS XLS ECW MDB PGDB SQL WSDL XML EXE Metastock PNG TIFF XHTML PDF Geo RSS Micro Station Design Portal TMX XLS zip+ HTML Geo TIFF N3 PPT TSV API JSON GML OAI-PMH RAW Turtle ASCII KML GPX ODF RDFa TXT+ Zip Autre XLSX JPG ODS RDF- XML URL CIDR RDF JS ODT REST WEB CSV+Zip SHP KMZ Omega RTF Webpage Datastream RSS Mapinfo Online Database SOAP WFS DBF TXT Mathlab openDataXML SPARQL WMS XML-ATOM-RSS XSD YAML Zip zip+sas fonte: neeta neeta@nic.in
  • 11. Formatos de arquivos ● Qual o melhor? ● Depende dos seus dados, e da situação! ● Algumas orientações: ● Preferir JSON à XML ● Preferir CSV à ODS ● Escolha um formato estável e de amplo uso ● Se possível, publique em mais de um formato
  • 12. Formatos de arquivos ● Mais orientações: ● Desaconselhamos compactar os arquivos ● Pesquise pelos formatos com mais audiência ● Para dados geográficos, conheça a INDE – Infraestrutura Nacional de Dados Abertos – http://inde.gov.br/ ● Sonhe com o RDF!! ● Para mais detalhes: – Cartilha técnica para publicação de dados abertos http://dados.gov.br/cartilha-publicacao-dados-abertos/
  • 13. Caso: API do SICONV ● SICONV: Sistema que administra os convênios entre APF, estados, municípios, DF e EPSFL. ● A API está em fase beta ● Requisitos: ● Dados em tempo “real” ● Replicação dos dados da produção ● Web Service REST ● JSON, CSV, XML, ... e HTML
  • 14. Caso: API do SICONV ● Endereço: http://api.convenios.gov.br ● Bonito né?! ● Outras tecnologias: ● Princípios REST ● CORS - Cross-origin resource sharing ● HATEOAS ● Exemplo de consulta: ● http://api.convenios.gov.br/siconv/dados/orgao/54000
  • 15. Web, REST APIs, etc.. Web != Internet
  • 16. Web, REST APIs, etc.. (2) ● Internet = infraestrutura, um amontoado de computadores, redes e cabos ● Web = HTTP (hypertext transfer protocol) ● Documentos ● Hiperlinks ● URLs ● Aprenda os fundamentos e faça melhor uso da Web
  • 17. Web, REST APIs, etc.. (3) ● REST - Representational State Transfer ● Alguns princípios ● Separação do Cliente e do Servidor ● Sem estado (stateless) ● Cacheável ● Sistemas em camadas ● Recursos – pedaço específico de informação (URI) ● Esqueça SOAP ● Seja RESTful
  • 18. Web, REST APIs, etc.. (4) ● HATEOAS - Hypermedia as the engine of application state ● O princípio é de que o cliente interage com a aplicação estritamente através das hipermídias providas pelo servidor de aplicação. ● Possibilita um maior desacoplamento servidor- cliente ● Exemplo: navegue em http://api.convenios.gov.br/siconv/doc/metodos.html ● Consulte no google: “dados abertos novo hamburgo”
  • 19. Aplicativos e Mashups http://dados.gov.br/aplicativos
  • 20. Experimento 1. Baixe os dados do PAC no portal dados.gov.br 2. Abra no LibreOffice e faça a conversão do tipo geográfico ● =CONCATENAR(SE(DIREITA(TIRAR(O2);1)="S";"-";"");EXT.TEXTO(O2;1;PROCURAR("°";O2;1)-1)+ (EXT.TEXTO(O2;PROCURAR("°";O2;1)+1;PROCURAR("'";O2;1)-PROCURAR("°";O2;1)- 1)/60)+CONCATENAR((EXT.TEXTO(O2;PROCURAR("'";O2;1)+1;PROCURAR(".";O2;1)-PROCURAR("'";O2;1)- 1));",";EXT.TEXTO(O2;PROCURAR(".";O2;1)+1;PROCURAR(CARACT(34);O2;1)-PROCURAR(".";O2;1)- 1))*1/3600)*1 3. Suba os dados para o Google Fusion Tables 4. Mais 2 cliques e ... Passos: https://groups.google.com/forum/?fromgroups=#!topic/thackday/uJisBSNNgkU
  • 21. Arquitetura lógica da INDA ● A INDA está fundamentada na Web ● É a união dos dados publicado em todos os órgãos ● O portal é um buscador ● O portal armazena os metadados ● Cada órgão é responsável pelos seus dados
  • 22. Portal Brasileiro de Dados Abertos dados.gov.br ● Utilizamos o CKAN ● Outras tecnologias ● Software Livre ● Diazo especializado ● Varnish ● Modelo flexível e ● HG – Mercurial extensível ● Solr ● Integração com CMS ● PortgreSQL ● Wordpress ● Apache ● VCGE para organizar assuntos ● Python
  • 23. Portal Brasileiro de Dados Abertos dados.gov.br ● É um catálogo ● Guarda metadados ● Conceitos básicos: ● Conjuntos de dados ● Recursos ● Grupos ● Etiquetas, licença, ...
  • 24. CKAN ● Características: ● Sistema de catálogo de busca de dados ● API para busca e inserção ● Plugins para integração com CMSs (Drupal e WP) ● Visualização de dados e analytics ● Workflow permite orgãos administrarem seus dados ● Storage de dados integrado ● Possibilita federação de catálogos
  • 25. Metadados - catalogação ● “Dados sobre os dados” ● Descrevem o conjunto de dados ● Cobertura, descrição, proveniência, extração, etc.. ● Úteis na classificação e indexação dos dados ● É o coração do catálogo ● Metadados: ● Mínimos (obrigatórios) ● Extras (desejáveis)
  • 26. Metadados - catalogação ● Mínimos: ● Extras: ● Título ● Etiquetas ● Descrição ● Autoria ● Catálogo de origem ● Cobertura geográfica e ● Órgão responsável temporal ● Assuntos do VCGE ● Granularidade geográfica e temporal ● Formato de arquivo ● Atualidade ● Referências ● Ontologia/vocabulário ● ... http://dados.gov.br/cartilha-publicacao-dados-abertos/
  • 27. Catalogando dados (exemplo) http://treino.dados.gov.br ● Dados? ● Séries estatísticas no IBGE sobre educação ● http://seriesestatisticas.ibge.gov.br/lista_tema.aspx?op=0&no=4
  • 28. Catalogação pela API ● CKAN provê uma API para administração ● Documentação: ● http://docs.ckan.org/en/latest/api.html
  • 29. Portais com CKAN ● Senado, Reino Unido, Buenos Aires, ... Mais: http://ckan.org/2012/07/31/new-ckan-data-portals/
  • 30. Colheita de metadados - Harvesting ● Plugin que possibilita federação dos dados ● Replica os metadados entre catálogos ● Cada estado e município pode ter um portal de dados abertos ● dados.rs.gov.br? ● dados.pe.gov.br? ● Documentação: ● https://github.com/okfn/ckanext-harvest
  • 31. DataStore ● Serviço de armazenamento e acesso a dados estruturados pela web ● Software que se integra com o CKAN ● ● Documentação: ● http://blog.okfn.org/2012/03/27/introducing-the-datastore/
  • 32. Linked Data ● Usar a Web para ligar dados relacionados ● Expor dados na web ● Compartilhar esses dados ● Conectar pedaços de dados, informações e conhecimento ● Usando: ● URIs ● RDF – Resource Description Framework
  • 35. Linked Data (4) ● Princípios de Linked Data (note de Tim BL): ● usar URIs como nomes para as coisas; ● usar URIs do tipo HTTP, para que as pessoas possam recuperar essas coisas; ● quando alguém recuperar uma URI, fornecer informações úteis, usando os padrões; ● inclua links para outras URIs, para que as pessoas possam descobrir mais coisas [relacionadas] http://www.w3.org/DesignIssues/LinkedData.html
  • 36. Desenho de URIs ● “Dar nome às coisas na Web” ● Nomear coisas concretas ou abstratas ● http://education.data.gov.uk/id/school/123065 ● http://reference.data.gov.uk/def/central-government/PermanentSecretary ● Objetivos ● Nome único ● Ser persistente por muito tempo ● Ser pequeno e legível por humanos ● Incorporar identificadores já em uso
  • 37. Desenho de URIs(2) fonte:http://data.gov.uk/resources/uris
  • 38. Desenho de URIs(3) ● Templates Fonte: http://www.cabinetoffice.gov.uk/sites/default/files/resources/designing-URI-sets-uk-public-sector.pdf
  • 39. As 5 estrelas dos Dados Abertos http://5stardata.info/
  • 40. contato@dados.gov.br @dadosgovbr