SlideShare una empresa de Scribd logo
1 de 43
Descargar para leer sin conexión
Data Science e Business
       Analytics
    Prof. Ms. Petrônio Cândido
Tópicos
● Business Intelligence

● Big Data

● NoSQL

● Data Mining

● Data Science

● Business Analytics
Business Intelligence
"Um termo guarda-chuva que encobre ferramentas,
 arquiteturas, metodologias, bancos de dados, etc.
        integradas em um suíte de software"
                        (Turban et al., 2007 apud Chee, 2009)


● Objetivos

  ○ Auxiliar o processo de tomada de decisão gerencial;

  ○ Gerar Diferencial competitivo;
Business Intelligence
● ERP - Enterprise Resource Planning

● DSS - Decision Support Systems

● EIS - Executive Information Systems

● CRM - Customer Relationship Management
http://jp4.r0tt.com/l_5013ce00-5c4a-11e1-ba5f-a9c495600004.jpg
O macro processo da informação
                                            Sistemas de
             DADOS                           Produção            DADOS         BD
                                               OLTP                         Operacional




       Clientes        Funcionários
                                                          CICLO DO BI
Ofertas                      Planejamento
Promoções                    Metas
etc                          Promoções


       CONHECIMENTO
                                                Relatórios
  Gerentes                                       Cubos                         Data
                        INFORMAÇÃO                             INFORMAÇÃO
                                               Dashboards                    Warehouse
                                               Data Mining

             DECISÃO
O macro processo da informação
                                            Sistemas de
             DADOS                           Produção         DADOS          BD
                                               OLTP                       Operacional




       Clientes        Funcionários

Ofertas                      Planejamento
Promoções                    Metas
etc                          Promoções


       CONHECIMENTO
                                                Relatórios
  Gerentes                                       Cubos                       Data
                        INFORMAÇÃO                           INFORMAÇÃO
                                               Dashboards                  Warehouse
                                               Data Mining

             DECISÃO
Business Intelligence
● KPI - Key Performance Indicators

● Data Warehouse

● Integration Process / ETL

● Reporting

● OLAP

● Dashboards
Processo Pentaho

                  BI Server     Data
                              Warehouse
    Clientes

       R
       E
       Q
       U
       I
       S                         PDI
       T
       O
       S


                     PRD

                   Schema        BD
                  Workbench   Operacional
Analistas de BI
                    Spoon
Processo Pentaho
                                                      SGDB
            Servidor de Aplicação                                           BD
Clientes                                                                 Operacional
                  BI Server
               PUC       JReport                    Data
   R                                              Warehouse
   E                                                                     Documentos
   Q           PAC        JPivot

   U
   I           CDE     Repositorios
   S                   Meta Dados
   T                                                   PDI
   O                                              PAN, KITCHEN,             Web
   S              Mondrian                           CARTE




                                      FERRAMENTAS ADMINISTRATIVAS

Analistas     PRD       PME                     PDI
                                       PSW     SPOON         PDS   CDE    PAD
 de BI
Business Intelligence
● Exemplos

  ○ http://www.paraondefoiomeudinheiro.org.
    br/dataset/estado-sao-paulo-2012

  ○ http://ison.stratebi.es/aerobrasil/

  ○ http://www.it4biz.com.br/apps/dados.gov.br/obrasdopac/

  ○ http://www.estatisticasfutebolbrasileiro.com/
Business Intelligence
● Data Warehouses

  ○ (Inmon, 2002) e (Kimball, 2002)

  ○ Conjunto de dados orientado à assunto, integrados,
    não voláteis, variáveis em relação ao tempo;

  ○ Dados agregados/sintetizados;

  ○ Estruturado;
Business Intelligence
● De onde vêm os dados?

  ○ ERP's

  ○ Planilhas

  ○ Arquivos de Texto

  ○ Em sua maioria os dados são estruturados
http://www.kdnuggets.com/images/big-data-cartoon-100000-warehouses.jpg
Business Intelligence
● Novas fontes de dados
Business Intelligence
● Novas fontes de dados

  ○ Monitoramento da marca;

  ○ Monitoramento de campanhas de marketing;

  ○ Relacionamento com o consumidor;

  ○ Análise de tendências;
Business Intelligence
● Novas fontes de dados

  ○ Dados estruturados/semi estruturados e não
    estruturados;

  ○ Fluxo contínuo;

  ○ Alta dimensionalidade;

  ○ Esquema flexível;
Processo de integração - ETL
http://www.priv.gc.ca/information/ar/images/cartoon3.jpg
Big Data
● Buzzword da moda...

● Quando o tamanho do dados faz parte do
  problema!

● Alta Dimensionalidade

  ○ Entidades / Atributos / Instâncias
Big Data
● 4 V's (Stapleton, 2011)

  ○ Volume
    ■ Terabytes para Petabytes de dados

  ○ Velocidade
    ■ Fluxo contínuo e rápido de novos dados

  ○ Variedade
    ■ Dados estruturados, semi e não estruturados

  ○ Veracidade
    ■ Governança de dados e qualificação entre
       Consistente, Inconsistente, Incompleto, Ambíguo, ...
https://devcentral.f5.com/blogs/us/the-four-v-rsquos-of-big-data
Big Data
● Exemplos

  ○ Social Media

  ○ Web Logs

  ○ Sensor Networks

  ○ Cadeias de DNA

  ○ LHC
Big Data
● SGBD's relacionais (Codd, 1970) têm
  capacidade de lidar com esse problema?

● ACID x BASE (Pritchett, 2008)

● Teorema CAP (Brewer, 2000)

   ○ Consistency / Availability / Partition Tolerant

   ○ Escolha apenas 2!
NoSql
● Esquemas de dados não relacionais

  ○ Key-Value Store

  ○ Document Store

  ○ Graph Databases

  ○ Wide Column / Column Oriented

  ○ ...
NoSql
● Esquema flexível

● Alta escalabilidade
  ○ Replicação
  ○ Particionamento vertical e horizontal
  ○ Sharding

● MapReduce (Dean, 2008)
Juntando tudo
● Utilizando NoSQL's como backend para
  Data Warehouses com Big Data...


● Mais dados, mais demandas!


● O que fazer com tantos dados?
http://dilbert.com/dyn/str_strip/000000000/00000000/0000000/000000/00000/6000/600/6644/6644.strip.gif
Data Mining

           Banco de dados
                   +
               Estatística
                   +
         Inteligência Artificial
                   +
                   ...
Data Mining
● KDD - Knowledge Discovery in Databases
  (Fayyad, Piatetsky-Shapiro, 1996)

● SEMMA (SAS, 2000)
  ○ Sample, Explore, Modify, Model, Assess

● CRISP/DM (Chapman et al., 2000)
  ○ CRoss-Industry Standard Process for Data Mining
Data Mining




              (Azevedo, 2008)
Data Science
● Indo além do KDD...

● Espectro mais amplo do que o KDD;

● Enquando a DM é uma metodologia
  específica, a DS é a aplicação do método
  científico
Data Science
Data Science
● Banco de Dados
● Simulação
● Inteligência Artificial
● Otimização
● Inferência Estatística
● Análise Multivariada
● Séries Temporais
● ...
Data Science
● Descritive
  ○ Descreve e modela os dados

● Diagnostic
  ○ Identifica uma ou mais CAUSAS nos dados

● Preditive
  ○ Modela as tendências apontadas pelos dados

● Prescritive
  ○ Indica a melhor tendência a seguir
Business Analytics
● Data Science dentro do Business Intelligence

● O BI tem um foco mais informativo e
  descritivo;

  ○ Acompanhamento da situação do negócio

● O BA tem um foco mais preditivo e
  diagnóstico;

  ○ Projeção do negócio
BI vs BA

            Business Intelligence   Business Analytics
              Relatórios            Projeções
Métodos       Gráficos              Modelos
              Indicadores           Cenários
              O que aconteceu?      Por que aconteceu?

              Quando ?              Acontecerá
                                    novamente?
Perguntas     Onde?
                                    Quando?
              Como?
                                    O que mais poderá
              Quem?                 acontecer?
https://community.jivesoftware.com/docs/DOC-30464
Tendências
● Genética

● Séries Espaço-Temporais
  ○ Trajetórias
  ○ Wireless Sensor Networks

● Data Warehouses Multimídia

● Ubiquitous

● Real Time Analysis
Conclusão                 Intelligence




 ERP's




                Data
              Warehouse
  Logs
Arquivos
 E-mail        Big Data    Analytics


               NoSQL


  Web
 Social
 Media



                  INFORMAÇÃO
       DADO                              CONHECIMENTO
Referências
●   Azevedo, A.; Santos, M.F. KDD, SEMMA, and CRISP-DM: A Parallel Overview.
    Proceedings of the IADIS European Conference on Data Mining, Amsterdam,
    2008, pp. 182-185. Disponível em http://recipp.ipp.pt/handle/10400.22/136.
    Acesso em 28/01/2013.
●   Brewer, Eric A.: Towards Robust Distributed Systems. Portland, Oregon, July
    2000. – Keynote at the ACM Symposium on Principles of Distributed Computing
    (PODC). Disponível em http://www.cs.berkeley.edu/~brewer/cs262b-2004/PODC-
    keynote.pdf Acesso em 27/01/2013.
●   Chapman, P. et al. CRISP-DM 1.0 - Step-by-step data mining guide. 2000.
    Disponível em http://www.crisp-dm.org/CRISPWP-0800.pdf. Acesso em
    27/01/2013.
●   Chee, Timothy; Chan, Lee-Kwun et al. Business Intelligence Systems: State-of-
    the-art review and contemporary applications. In Symposium on Progress in
    Information & Communication Technology 2009. p. 96-101.
●   Codd, Edgar F.: A Relational Model of Data for Large Shared Data Banks. In:
    Communications of the ACM 13 (1970), June, No. 6, p. 377–387
●   Dean, J. and Ghemawat, S. MapReduce: simplified data processing on large
    clusters. Communications of the ACM. p. 107-113. 2008.
Referências
●   Fayyad, U. M. et al. From data mining to knowledge discovery: an overview.
    In Fayyad, U. M.et al (Eds.), Advances in knowledge discovery and data mining.
    AAAI Press / The MIT Press.
●   Fayyad, U. and Piatetsky-Shapiro, G. and Smyth, P. The KDD process for
    extracting useful knowledge from volumes of data. Communications of the
    ACM v. 39, n. 11, p. 27-34. 1996.
●   Inmon, W.H. Building the data warehouse. J. Wiley. 2002.
●   MacVittie, Lori. The Four V’s of Big Data. Disponível em https://devcentral.f5.
    com/blogs/us/the-four-v-rsquos-of-big-data. Acesso em 27/01/2013.
●   Pritchett, Dan. BASE: An ACID alternative. ACM Queue. 2008. Disponível em
    http://queue.acm.org/detail.cfm?id=1394128. Acesso em 27/01/2013.
●   Kimball, R.; Ross, M. et al. The data warehouse toolkit: the complete guide to
    dimensional modelling. New York: 2002.
●   SAS Institute. SAS Enterprise Miner – SEMMA. Disponível em http://www.sas.
    com/technologies/analytics/datamining/miner/semma.html. Acessado em
    27/01/2013.
●   Stapleton, Lisa K. Taming big data. Disponível em http://www.ibm.
    com/developerworks/data/library/dmmag/DMMag_2011_Issue2/BigData/index.
    html?cmp=dw&cpb=dwinf&ct=dwnew&cr=dwnen&ccy=zz&csr=051211. Acesso
    em 27/01/2013.
Perguntas?

 Dúvidas?

 Críticas?

Sugestões?

Más contenido relacionado

La actualidad más candente

Big Data: Seus problemas estão apenas começando
Big Data: Seus problemas estão apenas começandoBig Data: Seus problemas estão apenas começando
Big Data: Seus problemas estão apenas começandoThiago Gonzaga
 
Bigdata - Leandro Wanderley
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro WanderleyLeandro Couto
 
TDC2017 | POA Trilha BigData - Como integrar as soluções dos times de Data En...
TDC2017 | POA Trilha BigData - Como integrar as soluções dos times de Data En...TDC2017 | POA Trilha BigData - Como integrar as soluções dos times de Data En...
TDC2017 | POA Trilha BigData - Como integrar as soluções dos times de Data En...tdc-globalcode
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big Data
Mini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big DataMini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big Data
Mini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big DataDiego Nogare
 
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaPalestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaMarcio Junior Vieira
 

La actualidad más candente (10)

Diálogos entre cientistas de dados e cientistas sociais
Diálogos entre cientistas de dados e cientistas sociais Diálogos entre cientistas de dados e cientistas sociais
Diálogos entre cientistas de dados e cientistas sociais
 
Big Data: Seus problemas estão apenas começando
Big Data: Seus problemas estão apenas começandoBig Data: Seus problemas estão apenas começando
Big Data: Seus problemas estão apenas começando
 
Bigdata - Leandro Wanderley
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro Wanderley
 
Qmeeting 2015 Big Data
Qmeeting 2015 Big DataQmeeting 2015 Big Data
Qmeeting 2015 Big Data
 
Data Science For Dummies From a Dummy
Data Science For Dummies From a DummyData Science For Dummies From a Dummy
Data Science For Dummies From a Dummy
 
Big data
Big dataBig data
Big data
 
TDC2017 | POA Trilha BigData - Como integrar as soluções dos times de Data En...
TDC2017 | POA Trilha BigData - Como integrar as soluções dos times de Data En...TDC2017 | POA Trilha BigData - Como integrar as soluções dos times de Data En...
TDC2017 | POA Trilha BigData - Como integrar as soluções dos times de Data En...
 
BigData
BigDataBigData
BigData
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big Data
Mini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big DataMini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big Data
Mini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big Data
 
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaPalestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
 

Destacado

SpagoBI - Plataforma BI livre e aberta
SpagoBI - Plataforma BI livre e abertaSpagoBI - Plataforma BI livre e aberta
SpagoBI - Plataforma BI livre e abertaFabrício Basto
 
Gestão administrativa de pessoal
Gestão administrativa de pessoalGestão administrativa de pessoal
Gestão administrativa de pessoalRodrigo Cristóvão
 
Tableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with TableauTableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with TableauXpand IT
 
Dashboards maneiros: Performance
Dashboards maneiros: PerformanceDashboards maneiros: Performance
Dashboards maneiros: PerformanceWagner Alves
 
Apresentação - QlikView
Apresentação - QlikViewApresentação - QlikView
Apresentação - QlikViewJDSBD
 
Como participar de projetos Open Source no Github?
Como participar de projetos Open Source no Github?Como participar de projetos Open Source no Github?
Como participar de projetos Open Source no Github?Guilherme Farias
 
Pentaho: inteligência de negócios utilizando software livre
Pentaho: inteligência de negócios utilizando software livrePentaho: inteligência de negócios utilizando software livre
Pentaho: inteligência de negócios utilizando software livreCaio Moreno
 
Conceitos gerais de etl - Qlikview
Conceitos gerais de etl - QlikviewConceitos gerais de etl - Qlikview
Conceitos gerais de etl - QlikviewRoberto Oliveira
 
Visual Analytics 101 - Princípios, práticas e ferramentas
Visual Analytics 101 - Princípios, práticas e ferramentasVisual Analytics 101 - Princípios, práticas e ferramentas
Visual Analytics 101 - Princípios, práticas e ferramentasLuis__Rodrigues
 
Slides Google Analytics - SEO Marketing
Slides Google Analytics - SEO MarketingSlides Google Analytics - SEO Marketing
Slides Google Analytics - SEO MarketingPapos na rede
 
Brasil, Open Source e o Mundo dos Negócios
Brasil, Open Source e o Mundo dos NegóciosBrasil, Open Source e o Mundo dos Negócios
Brasil, Open Source e o Mundo dos NegóciosOpenBossa
 
QMeeting / SP - Um Evento de Bi e QlikView para poucos.
QMeeting / SP - Um Evento de Bi e QlikView para poucos. QMeeting / SP - Um Evento de Bi e QlikView para poucos.
QMeeting / SP - Um Evento de Bi e QlikView para poucos. Roberto Oliveira
 
Qlikview com Google Maps
Qlikview com Google MapsQlikview com Google Maps
Qlikview com Google Mapscarlos_h_ramos
 

Destacado (20)

Treinamento hadoop - dia3
Treinamento hadoop - dia3Treinamento hadoop - dia3
Treinamento hadoop - dia3
 
SpagoBI - Plataforma BI livre e aberta
SpagoBI - Plataforma BI livre e abertaSpagoBI - Plataforma BI livre e aberta
SpagoBI - Plataforma BI livre e aberta
 
Apresentação QlikView
Apresentação QlikViewApresentação QlikView
Apresentação QlikView
 
Gestão administrativa de pessoal
Gestão administrativa de pessoalGestão administrativa de pessoal
Gestão administrativa de pessoal
 
Tableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with TableauTableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with Tableau
 
Dashboards maneiros: Performance
Dashboards maneiros: PerformanceDashboards maneiros: Performance
Dashboards maneiros: Performance
 
Apresentação - QlikView
Apresentação - QlikViewApresentação - QlikView
Apresentação - QlikView
 
Como participar de projetos Open Source no Github?
Como participar de projetos Open Source no Github?Como participar de projetos Open Source no Github?
Como participar de projetos Open Source no Github?
 
Pentaho: inteligência de negócios utilizando software livre
Pentaho: inteligência de negócios utilizando software livrePentaho: inteligência de negócios utilizando software livre
Pentaho: inteligência de negócios utilizando software livre
 
Conceitos gerais de etl - Qlikview
Conceitos gerais de etl - QlikviewConceitos gerais de etl - Qlikview
Conceitos gerais de etl - Qlikview
 
Documento SpagoBI
Documento SpagoBIDocumento SpagoBI
Documento SpagoBI
 
Pentaho
PentahoPentaho
Pentaho
 
Visual Analytics 101 - Princípios, práticas e ferramentas
Visual Analytics 101 - Princípios, práticas e ferramentasVisual Analytics 101 - Princípios, práticas e ferramentas
Visual Analytics 101 - Princípios, práticas e ferramentas
 
Microsoft Power BI
Microsoft Power BIMicrosoft Power BI
Microsoft Power BI
 
Slides Google Analytics - SEO Marketing
Slides Google Analytics - SEO MarketingSlides Google Analytics - SEO Marketing
Slides Google Analytics - SEO Marketing
 
Brasil, Open Source e o Mundo dos Negócios
Brasil, Open Source e o Mundo dos NegóciosBrasil, Open Source e o Mundo dos Negócios
Brasil, Open Source e o Mundo dos Negócios
 
QMeeting / SP - Um Evento de Bi e QlikView para poucos.
QMeeting / SP - Um Evento de Bi e QlikView para poucos. QMeeting / SP - Um Evento de Bi e QlikView para poucos.
QMeeting / SP - Um Evento de Bi e QlikView para poucos.
 
Treinamento hadoop - dia1
Treinamento hadoop - dia1Treinamento hadoop - dia1
Treinamento hadoop - dia1
 
QlikBrand
QlikBrandQlikBrand
QlikBrand
 
Qlikview com Google Maps
Qlikview com Google MapsQlikview com Google Maps
Qlikview com Google Maps
 

Similar a Business Analytics

PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoAmbiente Livre
 
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...fabiolagrijo
 
Big Data para Leigos
Big Data para LeigosBig Data para Leigos
Big Data para LeigosPedro Neto
 
Pentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesPentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesAmbiente Livre
 
Governança de Dados-Uma abordagem via Canvas MGD_v02
Governança de Dados-Uma abordagem via Canvas MGD_v02Governança de Dados-Uma abordagem via Canvas MGD_v02
Governança de Dados-Uma abordagem via Canvas MGD_v02Carlos Barbieri
 
Gd canvas v01_slideshare_parte03
Gd canvas v01_slideshare_parte03Gd canvas v01_slideshare_parte03
Gd canvas v01_slideshare_parte03Carlos Barbieri
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoAmbiente Livre
 
Apresentacao Vertical De Alocacao Consultor Adriana
Apresentacao Vertical De Alocacao   Consultor AdrianaApresentacao Vertical De Alocacao   Consultor Adriana
Apresentacao Vertical De Alocacao Consultor Adrianacleveranjos
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningDenodo
 
Ecosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoftEcosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoftDennes Torres
 
TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosAmbiente Livre
 
Conceitos básicos e aplicações dos sistemas de informações ivaldo
Conceitos básicos e aplicações dos sistemas de informações ivaldoConceitos básicos e aplicações dos sistemas de informações ivaldo
Conceitos básicos e aplicações dos sistemas de informações ivaldoIvaldo Santos Barbosa
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowareMarcos Vinicius Fidelis
 
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptxApresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptxdataRain
 
Slides da Palestra - Designing de Soluções de BI - PASS DevSQL RJ - 05/06/2018
Slides da Palestra - Designing de Soluções de BI - PASS DevSQL RJ - 05/06/2018Slides da Palestra - Designing de Soluções de BI - PASS DevSQL RJ - 05/06/2018
Slides da Palestra - Designing de Soluções de BI - PASS DevSQL RJ - 05/06/2018Claudio Bonel
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivreAmbiente Livre
 

Similar a Business Analytics (20)

PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
 
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
Aplicação de Business Intelligence em Laboratórios Clínicos como ferramenta p...
 
Oficina Pentaho
Oficina PentahoOficina Pentaho
Oficina Pentaho
 
Big Data para Leigos
Big Data para LeigosBig Data para Leigos
Big Data para Leigos
 
Pentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesPentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data Lakes
 
Governança de Dados-Uma abordagem via Canvas MGD_v02
Governança de Dados-Uma abordagem via Canvas MGD_v02Governança de Dados-Uma abordagem via Canvas MGD_v02
Governança de Dados-Uma abordagem via Canvas MGD_v02
 
Gd canvas v01_slideshare_parte03
Gd canvas v01_slideshare_parte03Gd canvas v01_slideshare_parte03
Gd canvas v01_slideshare_parte03
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
 
GUBI: Agile Analytics [pt-br]
GUBI: Agile Analytics [pt-br]GUBI: Agile Analytics [pt-br]
GUBI: Agile Analytics [pt-br]
 
Adeus BI, Seja Bem Vindo a Era do Analytics?
Adeus BI, Seja Bem Vindo a Era do Analytics?Adeus BI, Seja Bem Vindo a Era do Analytics?
Adeus BI, Seja Bem Vindo a Era do Analytics?
 
Apresentacao Vertical De Alocacao Consultor Adriana
Apresentacao Vertical De Alocacao   Consultor AdrianaApresentacao Vertical De Alocacao   Consultor Adriana
Apresentacao Vertical De Alocacao Consultor Adriana
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine Learning
 
Ecosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoftEcosistema de data warehouse com ferramentas microsoft
Ecosistema de data warehouse com ferramentas microsoft
 
TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativos
 
Conceitos básicos e aplicações dos sistemas de informações ivaldo
Conceitos básicos e aplicações dos sistemas de informações ivaldoConceitos básicos e aplicações dos sistemas de informações ivaldo
Conceitos básicos e aplicações dos sistemas de informações ivaldo
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinoware
 
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptxApresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
 
SA-Business Intelligence
SA-Business IntelligenceSA-Business Intelligence
SA-Business Intelligence
 
Slides da Palestra - Designing de Soluções de BI - PASS DevSQL RJ - 05/06/2018
Slides da Palestra - Designing de Soluções de BI - PASS DevSQL RJ - 05/06/2018Slides da Palestra - Designing de Soluções de BI - PASS DevSQL RJ - 05/06/2018
Slides da Palestra - Designing de Soluções de BI - PASS DevSQL RJ - 05/06/2018
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
 

Más de Petronio Candido

Licenças de software livre
Licenças de software livreLicenças de software livre
Licenças de software livrePetronio Candido
 
Big Data e Data Science: admirável mundo novo - IV SIC IFNMG
Big Data e Data Science: admirável mundo novo - IV SIC IFNMGBig Data e Data Science: admirável mundo novo - IV SIC IFNMG
Big Data e Data Science: admirável mundo novo - IV SIC IFNMGPetronio Candido
 
Java 8 - A Evolução da Linguagem
Java 8 - A Evolução da LinguagemJava 8 - A Evolução da Linguagem
Java 8 - A Evolução da LinguagemPetronio Candido
 
Minicurso de estatística experimental com o R - III SIC IFNMG
Minicurso de estatística experimental com o R  - III SIC IFNMGMinicurso de estatística experimental com o R  - III SIC IFNMG
Minicurso de estatística experimental com o R - III SIC IFNMGPetronio Candido
 
ARS - Análise de Redes Sociais - VIII ERI MG
ARS - Análise de Redes Sociais - VIII ERI MGARS - Análise de Redes Sociais - VIII ERI MG
ARS - Análise de Redes Sociais - VIII ERI MGPetronio Candido
 

Más de Petronio Candido (6)

Licenças de software livre
Licenças de software livreLicenças de software livre
Licenças de software livre
 
Big Data e Data Science: admirável mundo novo - IV SIC IFNMG
Big Data e Data Science: admirável mundo novo - IV SIC IFNMGBig Data e Data Science: admirável mundo novo - IV SIC IFNMG
Big Data e Data Science: admirável mundo novo - IV SIC IFNMG
 
Java 8 - A Evolução da Linguagem
Java 8 - A Evolução da LinguagemJava 8 - A Evolução da Linguagem
Java 8 - A Evolução da Linguagem
 
Minicurso de estatística experimental com o R - III SIC IFNMG
Minicurso de estatística experimental com o R  - III SIC IFNMGMinicurso de estatística experimental com o R  - III SIC IFNMG
Minicurso de estatística experimental com o R - III SIC IFNMG
 
ARS - Análise de Redes Sociais - VIII ERI MG
ARS - Análise de Redes Sociais - VIII ERI MGARS - Análise de Redes Sociais - VIII ERI MG
ARS - Análise de Redes Sociais - VIII ERI MG
 
Novas Tendências Em TI
Novas Tendências Em TINovas Tendências Em TI
Novas Tendências Em TI
 

Business Analytics

  • 1. Data Science e Business Analytics Prof. Ms. Petrônio Cândido
  • 2. Tópicos ● Business Intelligence ● Big Data ● NoSQL ● Data Mining ● Data Science ● Business Analytics
  • 3. Business Intelligence "Um termo guarda-chuva que encobre ferramentas, arquiteturas, metodologias, bancos de dados, etc. integradas em um suíte de software" (Turban et al., 2007 apud Chee, 2009) ● Objetivos ○ Auxiliar o processo de tomada de decisão gerencial; ○ Gerar Diferencial competitivo;
  • 4. Business Intelligence ● ERP - Enterprise Resource Planning ● DSS - Decision Support Systems ● EIS - Executive Information Systems ● CRM - Customer Relationship Management
  • 6. O macro processo da informação Sistemas de DADOS Produção DADOS BD OLTP Operacional Clientes Funcionários CICLO DO BI Ofertas Planejamento Promoções Metas etc Promoções CONHECIMENTO Relatórios Gerentes Cubos Data INFORMAÇÃO INFORMAÇÃO Dashboards Warehouse Data Mining DECISÃO
  • 7. O macro processo da informação Sistemas de DADOS Produção DADOS BD OLTP Operacional Clientes Funcionários Ofertas Planejamento Promoções Metas etc Promoções CONHECIMENTO Relatórios Gerentes Cubos Data INFORMAÇÃO INFORMAÇÃO Dashboards Warehouse Data Mining DECISÃO
  • 8. Business Intelligence ● KPI - Key Performance Indicators ● Data Warehouse ● Integration Process / ETL ● Reporting ● OLAP ● Dashboards
  • 9. Processo Pentaho BI Server Data Warehouse Clientes R E Q U I S PDI T O S PRD Schema BD Workbench Operacional Analistas de BI Spoon
  • 10. Processo Pentaho SGDB Servidor de Aplicação BD Clientes Operacional BI Server PUC JReport Data R Warehouse E Documentos Q PAC JPivot U I CDE Repositorios S Meta Dados T PDI O PAN, KITCHEN, Web S Mondrian CARTE FERRAMENTAS ADMINISTRATIVAS Analistas PRD PME PDI PSW SPOON PDS CDE PAD de BI
  • 11. Business Intelligence ● Exemplos ○ http://www.paraondefoiomeudinheiro.org. br/dataset/estado-sao-paulo-2012 ○ http://ison.stratebi.es/aerobrasil/ ○ http://www.it4biz.com.br/apps/dados.gov.br/obrasdopac/ ○ http://www.estatisticasfutebolbrasileiro.com/
  • 12. Business Intelligence ● Data Warehouses ○ (Inmon, 2002) e (Kimball, 2002) ○ Conjunto de dados orientado à assunto, integrados, não voláteis, variáveis em relação ao tempo; ○ Dados agregados/sintetizados; ○ Estruturado;
  • 13. Business Intelligence ● De onde vêm os dados? ○ ERP's ○ Planilhas ○ Arquivos de Texto ○ Em sua maioria os dados são estruturados
  • 16. Business Intelligence ● Novas fontes de dados ○ Monitoramento da marca; ○ Monitoramento de campanhas de marketing; ○ Relacionamento com o consumidor; ○ Análise de tendências;
  • 17. Business Intelligence ● Novas fontes de dados ○ Dados estruturados/semi estruturados e não estruturados; ○ Fluxo contínuo; ○ Alta dimensionalidade; ○ Esquema flexível;
  • 20. Big Data ● Buzzword da moda... ● Quando o tamanho do dados faz parte do problema! ● Alta Dimensionalidade ○ Entidades / Atributos / Instâncias
  • 21. Big Data ● 4 V's (Stapleton, 2011) ○ Volume ■ Terabytes para Petabytes de dados ○ Velocidade ■ Fluxo contínuo e rápido de novos dados ○ Variedade ■ Dados estruturados, semi e não estruturados ○ Veracidade ■ Governança de dados e qualificação entre Consistente, Inconsistente, Incompleto, Ambíguo, ...
  • 23. Big Data ● Exemplos ○ Social Media ○ Web Logs ○ Sensor Networks ○ Cadeias de DNA ○ LHC
  • 24. Big Data ● SGBD's relacionais (Codd, 1970) têm capacidade de lidar com esse problema? ● ACID x BASE (Pritchett, 2008) ● Teorema CAP (Brewer, 2000) ○ Consistency / Availability / Partition Tolerant ○ Escolha apenas 2!
  • 25. NoSql ● Esquemas de dados não relacionais ○ Key-Value Store ○ Document Store ○ Graph Databases ○ Wide Column / Column Oriented ○ ...
  • 26. NoSql ● Esquema flexível ● Alta escalabilidade ○ Replicação ○ Particionamento vertical e horizontal ○ Sharding ● MapReduce (Dean, 2008)
  • 27. Juntando tudo ● Utilizando NoSQL's como backend para Data Warehouses com Big Data... ● Mais dados, mais demandas! ● O que fazer com tantos dados?
  • 29. Data Mining Banco de dados + Estatística + Inteligência Artificial + ...
  • 30. Data Mining ● KDD - Knowledge Discovery in Databases (Fayyad, Piatetsky-Shapiro, 1996) ● SEMMA (SAS, 2000) ○ Sample, Explore, Modify, Model, Assess ● CRISP/DM (Chapman et al., 2000) ○ CRoss-Industry Standard Process for Data Mining
  • 31. Data Mining (Azevedo, 2008)
  • 32. Data Science ● Indo além do KDD... ● Espectro mais amplo do que o KDD; ● Enquando a DM é uma metodologia específica, a DS é a aplicação do método científico
  • 34. Data Science ● Banco de Dados ● Simulação ● Inteligência Artificial ● Otimização ● Inferência Estatística ● Análise Multivariada ● Séries Temporais ● ...
  • 35. Data Science ● Descritive ○ Descreve e modela os dados ● Diagnostic ○ Identifica uma ou mais CAUSAS nos dados ● Preditive ○ Modela as tendências apontadas pelos dados ● Prescritive ○ Indica a melhor tendência a seguir
  • 36. Business Analytics ● Data Science dentro do Business Intelligence ● O BI tem um foco mais informativo e descritivo; ○ Acompanhamento da situação do negócio ● O BA tem um foco mais preditivo e diagnóstico; ○ Projeção do negócio
  • 37. BI vs BA Business Intelligence Business Analytics Relatórios Projeções Métodos Gráficos Modelos Indicadores Cenários O que aconteceu? Por que aconteceu? Quando ? Acontecerá novamente? Perguntas Onde? Quando? Como? O que mais poderá Quem? acontecer?
  • 39. Tendências ● Genética ● Séries Espaço-Temporais ○ Trajetórias ○ Wireless Sensor Networks ● Data Warehouses Multimídia ● Ubiquitous ● Real Time Analysis
  • 40. Conclusão Intelligence ERP's Data Warehouse Logs Arquivos E-mail Big Data Analytics NoSQL Web Social Media INFORMAÇÃO DADO CONHECIMENTO
  • 41. Referências ● Azevedo, A.; Santos, M.F. KDD, SEMMA, and CRISP-DM: A Parallel Overview. Proceedings of the IADIS European Conference on Data Mining, Amsterdam, 2008, pp. 182-185. Disponível em http://recipp.ipp.pt/handle/10400.22/136. Acesso em 28/01/2013. ● Brewer, Eric A.: Towards Robust Distributed Systems. Portland, Oregon, July 2000. – Keynote at the ACM Symposium on Principles of Distributed Computing (PODC). Disponível em http://www.cs.berkeley.edu/~brewer/cs262b-2004/PODC- keynote.pdf Acesso em 27/01/2013. ● Chapman, P. et al. CRISP-DM 1.0 - Step-by-step data mining guide. 2000. Disponível em http://www.crisp-dm.org/CRISPWP-0800.pdf. Acesso em 27/01/2013. ● Chee, Timothy; Chan, Lee-Kwun et al. Business Intelligence Systems: State-of- the-art review and contemporary applications. In Symposium on Progress in Information & Communication Technology 2009. p. 96-101. ● Codd, Edgar F.: A Relational Model of Data for Large Shared Data Banks. In: Communications of the ACM 13 (1970), June, No. 6, p. 377–387 ● Dean, J. and Ghemawat, S. MapReduce: simplified data processing on large clusters. Communications of the ACM. p. 107-113. 2008.
  • 42. Referências ● Fayyad, U. M. et al. From data mining to knowledge discovery: an overview. In Fayyad, U. M.et al (Eds.), Advances in knowledge discovery and data mining. AAAI Press / The MIT Press. ● Fayyad, U. and Piatetsky-Shapiro, G. and Smyth, P. The KDD process for extracting useful knowledge from volumes of data. Communications of the ACM v. 39, n. 11, p. 27-34. 1996. ● Inmon, W.H. Building the data warehouse. J. Wiley. 2002. ● MacVittie, Lori. The Four V’s of Big Data. Disponível em https://devcentral.f5. com/blogs/us/the-four-v-rsquos-of-big-data. Acesso em 27/01/2013. ● Pritchett, Dan. BASE: An ACID alternative. ACM Queue. 2008. Disponível em http://queue.acm.org/detail.cfm?id=1394128. Acesso em 27/01/2013. ● Kimball, R.; Ross, M. et al. The data warehouse toolkit: the complete guide to dimensional modelling. New York: 2002. ● SAS Institute. SAS Enterprise Miner – SEMMA. Disponível em http://www.sas. com/technologies/analytics/datamining/miner/semma.html. Acessado em 27/01/2013. ● Stapleton, Lisa K. Taming big data. Disponível em http://www.ibm. com/developerworks/data/library/dmmag/DMMag_2011_Issue2/BigData/index. html?cmp=dw&cpb=dwinf&ct=dwnew&cr=dwnen&ccy=zz&csr=051211. Acesso em 27/01/2013.