Governança de dados refere-se a projetar uma arquitetura de dados que garanta rastreabilidade, segurança e qualidade dos dados. Isso inclui estruturas de banco de dados, modelos de dados e processos para limpeza e organização dos dados. A governança de dados busca resolver problemas como inconsistências, descentralização e baixa performance causados por análises de dados descentralizadas.
3. Agenda
Desafios da análise de dados
Análise de dados na maioria das
empresas
Análise de dados na maioria das empresas, com o Self-
Service BI
Problemas do cenário atual
Como resolver estes problemas?
Governança de dados. O que é?
Governança de dados. O que come?
Governança de dados. Onde Vive?
4. Desafios da análise de dados
Gerir dados de diversas fontes
Dados com qualidade de ponta a ponta.
Utopia?
Processar dados para prover tomadas decisão com agilidade
Área de TI e de Negócio como atores principais da gestão do
Dado
Segurança da informação. Confidencialidade ao dado.
Quanto vou gastar para gerenciar meus dados? OPEX?
CAPEX?
Escalabilidade e disponibilidade
5. Análise de dados na maioria das empresas
ERP
Sistemas
Legados
Extrai e
carrega
Transforma e
cria análises
6. Análise de dados na maioria das empresas, com o Self-
Service BI
ERP
Sistemas
Legados
Extrai e
carrega
Conecta
Transforma
Transforma e
cria análises
7. Problemas do cenário atual
ERP
Extrai e
carrega
Conecta
Transforma
Transforma e cria
análises
Marketing
Sistema A
Extrai e
carrega
Conecta
Transforma
Transforma e cria
análises
Comercial
ERP
Sistema A
Extrai e
carrega
Conecta
Transforma
Transforma e cria
análises
Controladoria
Sistema B
Sistema B
Extrai e
carrega
RH
Transforma e cria
análises
ERP
Sistema A
Extrai e
carrega
Operações
Transforma e cria
análises
Diretoria
8. Problemas do cenário atual
Inconsistências nas informações
apresentadas
Fontes de dados descentralizadas. Cada área
tem a sua
Regras de negócios e cálculos descentralizados.
Cada área cria sua própria regra de negócio
Segurança de informação prejudicada
Qualidade de dados comprometida
Dados sem rastreabilidade. De onde vem o dado que
cada área utiliza, por onde passa e pra onde vai?
Performance com “prazo de validade”. Conforme o
volume do dado aumenta, mais lento fica
Conflitos entre os gestores. Quem está certo?
9. Por que esses problemas acontecem
no Self-Service BI?
12. Governança de Dados – O que é? Projetar uma arquitetura que garanta o
rastreamento do dado, dentro do melhor custo-
benefício. A Engenharia de Software é sua aliada.
Levantar requisitos com qualidade para garantir
somente os dados essenciais para sua solução.
Garantir uma estrutura de BD que atenda as
necessidades da sua solução, bem como
manutenção, disaster recovery, integrações,
desde a origem até a eliminação do dado.
Garantir confidencialidade e segurança ao dado
em todo o seu ciclo de vida.
Projetar modelos de dados (DW e DM) que
garantam uma central única da verdade,
performance, agilidade e resultado.
Garantir que os dados estejam saneados e de alta
qualidade. Afinal Dados sem qualidade =
Decisões erradas.
Garantir que dados não estruturados, como por
exemplo (*.xls, *.txt, *.csv) sejam organizados e
de acesso simplificado
13. Governança de Dados – O que é?
Qualidade de Dados
Extremamente importante.
Dados sem qualidade = Informação sem qualidade = Decisão Errada
Dependendo do volume de dados e da baixa qualidade, deve-se fazer um projeto a
parte, antes de começar o Business Intelligence.
Deve-se planejar e projetar o saneamento ao dado, para prover qualidade ao mesmo
Cidade Qtde Vendida
Rio de Janeiro 100
RioDeJaneiro 30
Rio_De_Janeiro 70
São Paulo 80
SaoPaulo 20
Dados sem qualidade
Cidade Qtde Vendida
Rio de Janeiro 200
São Paulo 100
Dados Saneados
Qualidade de
dados