Dados abertos, Python e PostgreSQL: a combinação perfeita
1. Dados abertos, Python eDados abertos, Python e
PostgreSQL: a combinaçãoPostgreSQL: a combinação
perfeitaperfeita
TuricasTuricas akaaka Álvaro JustenÁlvaro Justen
PGConf.Brasil 2019PGConf.Brasil 2019
02 de agosto de 201902 de agosto de 2019
3. AgendaAgenda
Dados abertos
O que são
Aplicações
Problemas
Python
Ferramentas para trabalhar com dados
Live coding
Brasil.IO
O que é
Como usamos o PostgreSQL
Futuro: melhorias, grafos etc.
7. -- (definição de )
Dados AbertosDados Abertos
“ Dados abertos são dados que podem
ser livremente usados, reutilizados e
redistribuídos por qualquer pessoa -
sujeitos, no máximo, à exigência de
atribuição da fonte e
compartilhamento pelas mesmas
regras. ”
OpenData Handbook Open Definition
Mais detalhes:
Lei de Acesso à Informação: 12.527/2011
kit.dados.gov.br
escoladedados.org
8. --
“ De acordo com o governo brasileiro, o
controle social é a participação da
sociedade civil nos processos de
planejamento, acompanhamento,
monitoramento e avaliação das ações
da gestão pública e na execução das
políticas e programas públicos. ”
Wikipedia
9. Operação Serenata de AmorOperação Serenata de Amor
#civictech#civictech
serenata.ai
10. R$ 191 em um restaurante cujos pratos não custam R$ 40,
deputado?
Rosie, a robôRosie, a robô
twitter.com/tOa_D/status/1058495655184871425
11. (em conjunto com Juan Torres, para )correio24horas.com.br
Acesse a matéria
12. (em conjunto com Giulliana Biaconi, para )generonumero.media
Leia a matéria
13. (em conjunto com Adriano Belisário, para )apublica.org
Acesse a matéria
14. (em conjunto com Voltdatalab, para )
Aplicações ÚteisAplicações Úteis
EleiçõesEleições
poder360.com.br
15. Maior parte do tempo dos projetos deMaior parte do tempo dos projetos de
análise de dados:análise de dados:
19. Migram-se os ministérios, sem dadosMigram-se os ministérios, sem dados
Estrelando:Estrelando: Ministério da JustiçaMinistério da Justiça
twitter.com/turicas/status/1112491956314259457
20. Dados dispersos e sem índiceDados dispersos e sem índice
Estrelando:Estrelando: IBGEIBGE
22. Lentidão ao baixar (ETA: 4d)Lentidão ao baixar (ETA: 4d)
Estrelando:Estrelando: Receita FederalReceita Federal
twitter.com/turicas/status/1114185311372873729
26. Problemas de Usabilidade deProblemas de Usabilidade de
DadosDados
Formato (qualidade técnica)
Exemplo: Boletim de balneabilidade em PDF (INEMA/BA)
Dispersão
Exemplo: Filiações partidárias em 945 ZIPs com CSVs (TSE)
Quantidade de dados
Exemplo: 18 milhões de sócios (RFB)
Domínio da área
Exemplo: o que é unidade eleitoral? (TSE)
40. Importando dadosImportando dados
Deleta tabela se já existir
Cria tabela com base nos metadados
Cria triggers (FTS)
django.contrib.postgres.search.SearchVectorField
Executa rows pgimport
Executa VACUUM ANALYZE na tabela
Cria índices para filtros
Preenche "choices"
49. Contribua com o Brasil.IO!Contribua com o Brasil.IO!
brasil.io/colaborebrasil.io/colabore
Sugerindo otimizações no banco
Melhorando os scripts de coleta
Coletando novos datasets
Publicando tutoriais no
Doando no
blog.brasil.io
apoia.se/brasilio
50. 23 a 28 de outubro, Ribeirão Preto/SP
PythonBrasil 2019PythonBrasil 2019
pythonbrasil.com.br
51. 23 e 24 de novembro, São Paulo/SP
CODA.BR 2019CODA.BR 2019
coda.escoladedados.org
52. --
Dúvidas?Dúvidas?
“ Restringir acesso a dados públicos é
elitizar a democracia. ”
Manifesto Brasil.IO
{{ ,,
,,
,,
,,
}}
//turicasturicas
twittertwitter
githubgithub
youtubeyoutube
slideshareslideshare
instagraminstagram
turicas@brasil.ioturicas@brasil.io