SlideShare una empresa de Scribd logo
1 de 21
Detecção Preventiva de Fracionamento de Compras
Brasil 100% Digital: 1º Seminário sobre Análise de Dados na Administração Pública | 11/09/2015 @ TCU
Dr. Rommel Novaes Carvalho – Coordenador-Geral do ODP/DIE/CGU | https://about.me/rommelnc
2
USING BAYESIAN NETWORKS TO IDENTIFY
AND PREVENT SPLIT PURCHASES IN BRAZIL
Rommel N. Carvalho, Leonardo J. Sales, Henrique A. da Rocha, and Gilson L. Mendes
Coordenador-Geral do ODP / Cientista de Dados / Professor
https://about.me/rommelnc
Departamento de Pesquisas e Informações Estratégicas (DIE) / Departamento de Ciência da Computação (CIC)
Controladoria-Geral da União (CGU) / Universidade de Brasília (UnB)
BMAW workshop @ UAI 2014
Quebec City, Quebec, Canada - 07/27/2014
Artigo: http://ceur-ws.org/Vol-1218/bmaw2014_paper_7.pdf
Slides: http://pt.slideshare.net/rommelnc/bmaw-2014-using-bayesian-networks-to-identify-and-prevent-split-purchases-in-brazil
Apresentação: https://www.youtube.com/watch?v=UVOsztdSQ3A
Baseado no Artigo
Introdução
Metodologia
Entendimento e Preparação dos Dados
Modelagem e Avaliação
Implantação
Conclusão
Agenda
3
Introdução
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
4
Trilha de Fracionamento
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
R$ 9.890,00
5
Será que vai fracionar?
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
?
6
Metodologia
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
7
CRISP-DM
CRoss Industry Standard Process for Data Mining
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
8
Entendimento e Preparação
dos Dados
Entendimento para levantar hipóteses sobre
o melhor uso dos dados e preparação para
transformar os dados brutos em um conjunto
de dados utilizados para criação do modelo
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
9
Dados Utilizados
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
SIASG CPF CNPJ CNAE
2005 a
2010
Compras de materiais e
serviços de TI
42 atributos ~ 70 mil registros
‘
?
IDs ?
26 atributos
~ 50 mil registros
centavos e bilhões
análise do especialista
10
Modelagem e Avaliação
Aprendizagem de modelos a partir dos conjunto
de dados finais, ajuste de parâmetros para
melhorar performance, escolha do melhor
modelo baseado na validação e teste com
conjunto desconhecido de dados
Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
11
Será que vai fracionar?
?
12Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
De Volta à Preparaçao
13Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
Naïve Bayes vs Bayes Net (K2) –
com e sem Resampling
14Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
Mudando algoritmos e
número de pais
15Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
Tem como melhorar?
16Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
Implantação
Descoberta de novas regras, validação das regras
existentes, documentação e elaboração de
relatório com resultados finais, e implantação do
modelo final em produção
17Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
Possível Fracionamento
O sistema identificou que há outras
compras semelhantes a essa, que
podem caracterizar um fracionamento.
Usuário XXXX, matrícula YYYY, tem
certeza que deseja continuar?
Confirmar operação?
18Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
?
Conclusão
19Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
Conclusões
É possível usar Mineração de Dados para prevenção
Resultados satisfatórios
Todos fracionamentos foram classificados corretamente
AUROC bastante alta (.999)
Acurácia bastante alta (99.197%)
É preciso fortalecer integração entre diferentes Órgãos
Entender e avaliar resultados com dados mais atuais
Avaliar tabelas de probabilidades da rede
Cuidado com overfitting
Aplicar técnicas em novos problemas governamentais
20Introdução – Metodologia – Entendimento e Preparação dos Dados –
Modelagem e Avaliação – Implantação – Conclusão
Painel 03   01 - Rommel Carvalho - detecção preventiva de fracionamento de compras

Más contenido relacionado

Similar a Painel 03 01 - Rommel Carvalho - detecção preventiva de fracionamento de compras

Similar a Painel 03 01 - Rommel Carvalho - detecção preventiva de fracionamento de compras (20)

Haroldo salgado araujo cv tp1
Haroldo salgado araujo cv tp1Haroldo salgado araujo cv tp1
Haroldo salgado araujo cv tp1
 
Apresentação Pentacorp Group
Apresentação Pentacorp GroupApresentação Pentacorp Group
Apresentação Pentacorp Group
 
Status Report dos TCCs (SIN-NA8)
Status Report dos TCCs (SIN-NA8)Status Report dos TCCs (SIN-NA8)
Status Report dos TCCs (SIN-NA8)
 
Reimplantação de Sistema ERP
Reimplantação de Sistema ERPReimplantação de Sistema ERP
Reimplantação de Sistema ERP
 
Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?
 
Ementa curso de dados
Ementa curso de dadosEmenta curso de dados
Ementa curso de dados
 
Métricas - Maratona Digital
Métricas - Maratona DigitalMétricas - Maratona Digital
Métricas - Maratona Digital
 
CV Ednaldo José Pinheiro - TI - Vendas
CV Ednaldo José Pinheiro - TI -  VendasCV Ednaldo José Pinheiro - TI -  Vendas
CV Ednaldo José Pinheiro - TI - Vendas
 
Auditoria Eletrônica: Automatização de procedimentos de auditoria através do ...
Auditoria Eletrônica: Automatização de procedimentos de auditoria através do ...Auditoria Eletrônica: Automatização de procedimentos de auditoria através do ...
Auditoria Eletrônica: Automatização de procedimentos de auditoria através do ...
 
[SIN-NA7] Gestão de Projetos e Empreendedorismo - Atividade: Status Report
[SIN-NA7] Gestão de Projetos e Empreendedorismo - Atividade: Status Report[SIN-NA7] Gestão de Projetos e Empreendedorismo - Atividade: Status Report
[SIN-NA7] Gestão de Projetos e Empreendedorismo - Atividade: Status Report
 
Congresso AE Rio 2011 - Petrobras Francisco Aquino
Congresso AE Rio 2011 - Petrobras Francisco AquinoCongresso AE Rio 2011 - Petrobras Francisco Aquino
Congresso AE Rio 2011 - Petrobras Francisco Aquino
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisões
 
Introdução às ferramentas de Business Intelligence do ecossistema Hadoop
Introdução às ferramentas de Business Intelligence do ecossistema HadoopIntrodução às ferramentas de Business Intelligence do ecossistema Hadoop
Introdução às ferramentas de Business Intelligence do ecossistema Hadoop
 
Um Passo além da Implantação do BI
Um Passo além da Implantação do BIUm Passo além da Implantação do BI
Um Passo além da Implantação do BI
 
Tcc - Work control
Tcc - Work controlTcc - Work control
Tcc - Work control
 
Gestão de Projetos e Empreendedorismo - Atividade: Status Report
Gestão de Projetos e Empreendedorismo - Atividade: Status ReportGestão de Projetos e Empreendedorismo - Atividade: Status Report
Gestão de Projetos e Empreendedorismo - Atividade: Status Report
 
governanc3a7a-de-ti.pptx
governanc3a7a-de-ti.pptxgovernanc3a7a-de-ti.pptx
governanc3a7a-de-ti.pptx
 
Diversas Ferramentas de dados
Diversas Ferramentas de dadosDiversas Ferramentas de dados
Diversas Ferramentas de dados
 
Business Analytics
Business AnalyticsBusiness Analytics
Business Analytics
 
Ulbra tcc sistema de informaçao getúlio de oliveira valentim
Ulbra tcc sistema de informaçao getúlio de oliveira valentimUlbra tcc sistema de informaçao getúlio de oliveira valentim
Ulbra tcc sistema de informaçao getúlio de oliveira valentim
 

Más de Tribunal de Contas da União - TCU (Oficial)

Más de Tribunal de Contas da União - TCU (Oficial) (20)

La visión del ministerio de planificación- TCU
La visión del ministerio de planificación- TCULa visión del ministerio de planificación- TCU
La visión del ministerio de planificación- TCU
 
Presentación del instituto serzedello corrêa - TCU
Presentación del instituto serzedello corrêa  - TCUPresentación del instituto serzedello corrêa  - TCU
Presentación del instituto serzedello corrêa - TCU
 
Presentación del ccc - TCU
Presentación del ccc   - TCUPresentación del ccc   - TCU
Presentación del ccc - TCU
 
Innovación como solución para problemas complejos -2016- TCU - 2
Innovación como solución para problemas complejos -2016-   TCU - 2Innovación como solución para problemas complejos -2016-   TCU - 2
Innovación como solución para problemas complejos -2016- TCU - 2
 
Geotecnologías - 2016 - la visión del ministerio del medio ambiente.
Geotecnologías - 2016 - la visión del ministerio del medio ambiente.Geotecnologías - 2016 - la visión del ministerio del medio ambiente.
Geotecnologías - 2016 - la visión del ministerio del medio ambiente.
 
Design thinking 2016 - Herramientas
Design thinking 2016 -  HerramientasDesign thinking 2016 -  Herramientas
Design thinking 2016 - Herramientas
 
Control social 2016 - la visión del Tribunal de Cuentas de la Unión.
Control social 2016 -  la visión del Tribunal de Cuentas de la Unión.Control social 2016 -  la visión del Tribunal de Cuentas de la Unión.
Control social 2016 - la visión del Tribunal de Cuentas de la Unión.
 
Control social 2016 - la visión del Tribunal de Cuentas de la Unión - 1
Control social 2016 - la visión del Tribunal de Cuentas de la Unión - 1Control social 2016 - la visión del Tribunal de Cuentas de la Unión - 1
Control social 2016 - la visión del Tribunal de Cuentas de la Unión - 1
 
Control social 2016 - la visión de la cámara de diputados.
Control social 2016 -  la visión de la cámara de diputados.Control social 2016 -  la visión de la cámara de diputados.
Control social 2016 - la visión de la cámara de diputados.
 
Análisis de datos 2016 - la visión del tribunal de cuentas de la unión.
Análisis de datos 2016 -  la visión del tribunal de cuentas de la unión.Análisis de datos 2016 -  la visión del tribunal de cuentas de la unión.
Análisis de datos 2016 - la visión del tribunal de cuentas de la unión.
 
Taller Innovación - Innovación como solución para problemas complejos - TCU
Taller Innovación - Innovación como solución para problemas complejos - TCUTaller Innovación - Innovación como solución para problemas complejos - TCU
Taller Innovación - Innovación como solución para problemas complejos - TCU
 
Lancamento do Portal de inovação do TCU
Lancamento do Portal de inovação do TCULancamento do Portal de inovação do TCU
Lancamento do Portal de inovação do TCU
 
Painel 05 03 - Gustavo - Markus - Busca de vínculos na Administração Pública
Painel 05   03 - Gustavo - Markus - Busca de vínculos na Administração PúblicaPainel 05   03 - Gustavo - Markus - Busca de vínculos na Administração Pública
Painel 05 03 - Gustavo - Markus - Busca de vínculos na Administração Pública
 
Painel 05 02 - Remis Balaniuk - modelo bayesiano de analise de risco de con...
Painel 05   02 - Remis Balaniuk - modelo bayesiano de analise de risco de con...Painel 05   02 - Remis Balaniuk - modelo bayesiano de analise de risco de con...
Painel 05 02 - Remis Balaniuk - modelo bayesiano de analise de risco de con...
 
Painel 05 01 - ricardo carvalho - Filiação Partidária e Risco de Corrupção ...
Painel 05   01 - ricardo carvalho - Filiação Partidária e Risco de Corrupção ...Painel 05   01 - ricardo carvalho - Filiação Partidária e Risco de Corrupção ...
Painel 05 01 - ricardo carvalho - Filiação Partidária e Risco de Corrupção ...
 
Painel 04 03 - leon - Construção de modelos preditivos para melhoria na sel...
Painel 04   03 - leon - Construção de modelos preditivos para melhoria na sel...Painel 04   03 - leon - Construção de modelos preditivos para melhoria na sel...
Painel 04 03 - leon - Construção de modelos preditivos para melhoria na sel...
 
Painel 04 02 - Jedson Passos - Análise Sistêmica de Orçamentos de Obras Púb...
Painel 04   02 - Jedson Passos - Análise Sistêmica de Orçamentos de Obras Púb...Painel 04   02 - Jedson Passos - Análise Sistêmica de Orçamentos de Obras Púb...
Painel 04 02 - Jedson Passos - Análise Sistêmica de Orçamentos de Obras Púb...
 
Painel 04 01 - Rommel Carvalho - uso de mineração de dados e textos para cá...
Painel 04   01 - Rommel Carvalho - uso de mineração de dados e textos para cá...Painel 04   01 - Rommel Carvalho - uso de mineração de dados e textos para cá...
Painel 04 01 - Rommel Carvalho - uso de mineração de dados e textos para cá...
 
Painel 03 04 - André Vital - Avaliação de Risco em Contratos de Obras Rodov...
Painel 03   04 - André Vital - Avaliação de Risco em Contratos de Obras Rodov...Painel 03   04 - André Vital - Avaliação de Risco em Contratos de Obras Rodov...
Painel 03 04 - André Vital - Avaliação de Risco em Contratos de Obras Rodov...
 
Painel 03 03 - lucas freire - Filtros econômicos e combate a cartéis em lic...
Painel 03   03 - lucas freire - Filtros econômicos e combate a cartéis em lic...Painel 03   03 - lucas freire - Filtros econômicos e combate a cartéis em lic...
Painel 03 03 - lucas freire - Filtros econômicos e combate a cartéis em lic...
 

Último

Assessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdfAssessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdf
Natalia Granato
 

Último (6)

Assessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdfAssessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdf
 
Boas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsBoas práticas de programação com Object Calisthenics
Boas práticas de programação com Object Calisthenics
 
Padrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploPadrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemplo
 
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docxATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
 
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docxATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
 
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docxATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
 

Painel 03 01 - Rommel Carvalho - detecção preventiva de fracionamento de compras

  • 1. Detecção Preventiva de Fracionamento de Compras Brasil 100% Digital: 1º Seminário sobre Análise de Dados na Administração Pública | 11/09/2015 @ TCU Dr. Rommel Novaes Carvalho – Coordenador-Geral do ODP/DIE/CGU | https://about.me/rommelnc
  • 2. 2 USING BAYESIAN NETWORKS TO IDENTIFY AND PREVENT SPLIT PURCHASES IN BRAZIL Rommel N. Carvalho, Leonardo J. Sales, Henrique A. da Rocha, and Gilson L. Mendes Coordenador-Geral do ODP / Cientista de Dados / Professor https://about.me/rommelnc Departamento de Pesquisas e Informações Estratégicas (DIE) / Departamento de Ciência da Computação (CIC) Controladoria-Geral da União (CGU) / Universidade de Brasília (UnB) BMAW workshop @ UAI 2014 Quebec City, Quebec, Canada - 07/27/2014 Artigo: http://ceur-ws.org/Vol-1218/bmaw2014_paper_7.pdf Slides: http://pt.slideshare.net/rommelnc/bmaw-2014-using-bayesian-networks-to-identify-and-prevent-split-purchases-in-brazil Apresentação: https://www.youtube.com/watch?v=UVOsztdSQ3A Baseado no Artigo
  • 3. Introdução Metodologia Entendimento e Preparação dos Dados Modelagem e Avaliação Implantação Conclusão Agenda 3
  • 4. Introdução Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão 4
  • 5. Trilha de Fracionamento Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão R$ 9.890,00 5
  • 6. Será que vai fracionar? Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão ? 6
  • 7. Metodologia Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão 7
  • 8. CRISP-DM CRoss Industry Standard Process for Data Mining Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão 8
  • 9. Entendimento e Preparação dos Dados Entendimento para levantar hipóteses sobre o melhor uso dos dados e preparação para transformar os dados brutos em um conjunto de dados utilizados para criação do modelo Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão 9
  • 10. Dados Utilizados Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão SIASG CPF CNPJ CNAE 2005 a 2010 Compras de materiais e serviços de TI 42 atributos ~ 70 mil registros ‘ ? IDs ? 26 atributos ~ 50 mil registros centavos e bilhões análise do especialista 10
  • 11. Modelagem e Avaliação Aprendizagem de modelos a partir dos conjunto de dados finais, ajuste de parâmetros para melhorar performance, escolha do melhor modelo baseado na validação e teste com conjunto desconhecido de dados Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão 11
  • 12. Será que vai fracionar? ? 12Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão
  • 13. De Volta à Preparaçao 13Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão
  • 14. Naïve Bayes vs Bayes Net (K2) – com e sem Resampling 14Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão
  • 15. Mudando algoritmos e número de pais 15Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão
  • 16. Tem como melhorar? 16Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão
  • 17. Implantação Descoberta de novas regras, validação das regras existentes, documentação e elaboração de relatório com resultados finais, e implantação do modelo final em produção 17Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão
  • 18. Possível Fracionamento O sistema identificou que há outras compras semelhantes a essa, que podem caracterizar um fracionamento. Usuário XXXX, matrícula YYYY, tem certeza que deseja continuar? Confirmar operação? 18Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão ?
  • 19. Conclusão 19Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão
  • 20. Conclusões É possível usar Mineração de Dados para prevenção Resultados satisfatórios Todos fracionamentos foram classificados corretamente AUROC bastante alta (.999) Acurácia bastante alta (99.197%) É preciso fortalecer integração entre diferentes Órgãos Entender e avaliar resultados com dados mais atuais Avaliar tabelas de probabilidades da rede Cuidado com overfitting Aplicar técnicas em novos problemas governamentais 20Introdução – Metodologia – Entendimento e Preparação dos Dados – Modelagem e Avaliação – Implantação – Conclusão