O documento descreve as principais etapas de um projeto de Business Intelligence utilizando a ferramenta Microsoft Integration Services para criar um data warehouse. Ele aborda conceitos como ETL, modelagem dimensional, carga de dimensões e fatos, e implementação de Slowly Changing Dimension.
3. Business Intelligence
Business Intelligence é um sistema de
suporte a tomada de decisão.
É necessário determinar, que decisão
queremos tomar com o sistema a ser
desenvolvido.
6. Neste caso, Business Intelligence foi
usado como fonte de informação
PREDITIVA
7. Data Warehouse
Banco de dados que servirá de
repositório de todas as informações
importantes a organização, instituídos
em um modelo dimensional.
8. Tabelas Fato
As tabelas Fato são o ponto focal de um
modelo dimensional, onde os dados de
medição numérica são armazenados.
Se podemos contar, sumarizar ou realizar
algum tipo de agregação com dados de um
evento, então este evento é um bom
candidato a se tornar um fato.
9. Tabelas Dimensão
As tabelas dimensão sempre se
relacionam com tabelas fato e de modo
geral contém descrições sobre
informações de dados de uma
organização.
Como exemplo de tabelas dimensão de
uma empresa do varejo, podemos
mencionar Tempo, Produto ou até mesmo
Clientes.
10. Star Schema
“O Star Schema, ou “esquema estrela” é
o exemplo mais simples de modelagem
dimensional de Data Warehouse. Este
modelo consiste de poucas, ou quando
possível, apenas uma tabela “Fato”
ligada a diversas tabelas dimensão.”
11.
12. SnowFlake
O Snowflake se assemelha muito ao
modelo Star Schema, porém a diferença
crucial em relação ao outro modelo é que
as dimensões no modelo SnowFlake são
(ou podem ser) normalizadas, ou seja,
podem ser quebradas em tabelas menores
geralmente até a segunda forma normal. A
modelagem SnowFlake geralmente
normaliza as dimensões até a segunda
forma normal pois apesar dos benefícios
da normalização, sua utilização pode
comprometer o desempenho.
13.
14. ETL
“ETL é uma sigla para Extract,
Transform and Load, ou seja, extração,
transformação e carga. ETL, em uma
definição mais completa é uma técnica
ou processo de banco de dados, onde
os dados propriamente ditos são
movidos das mais diversas origens e
armazenadas em outros locais. “
29. Hello World no SSIS
Adicione um Script Task no Control
Flow
30. Adicionar o seguinte código
public void Main()
{
// TODO: Add your code here
MessageBox.Show("Olá mundo");
Dts.TaskResult =
(int)ScriptResults.Success;
}
33. Control Flow
“Control Flow é o segmento do SSIS
que nos permite definir o fluxo de
trabalho do pacote, determinando sua
seqüência e eventuais mudanças de
fluxo em caso de sucesso, fracasso ou
devido a uma pré-condição estabelecida
pelo usuário. “
34. Data Flow
“O Data Flow, é uma Task do pacote
SSIS onde as extrações,
transformações e eventuais cargas de
dados propriamente ditas ocorrem. Um
pacote pode ter apenas um Control
Flow, porém diversos Data Flows, com
diversas operações de carga e
transformação em cada um deles. “
38. Referênciando a variável no
pacote
public void Main()
{
// TODO: Add your code here
MessageBox.Show(Dts.Variables["StrTexto"].
Value.ToString());
Dts.TaskResult = (int)ScriptResults.Success;
}
61. Slowly Changing Dimension
Slowly Changing Dimension, em uma
tradução literal “Dimensões que mudam
lentamente”, são os grupos de dados
que se alteram em ciclos de tempo
maiores e de maneira irregular.
62. Um ótimo vendedor, com excelentes
resultados em uma área de vendas
mais receptiva mas que é transferido
para uma filial com um público diferente.
Se o relatório de vendas não for
corretamente trabalhado e a mudança de
filial do vendedor não for contextualizada, o
relatório poderá levar a informações
confusas ou incorretas sobre o desempenho
deste vendedor.
63. Podemos desenvolver SCD, utilizando
campos de data início e data fim,
determinando a vigência de cada
registro.
Identificamos cada registro na dimensão
SCD, através de Surrogate Keys.
Código Fornecedor Nome Cidade Ativo Data Inicial Data Final
1 1236 Industria 01 Florianópolis 0 01/01/2008 01/10/2010
2 1236 Industria 01 São José 1 02/10/2010 Null