SlideShare una empresa de Scribd logo
1 de 31
Descargar para leer sin conexión
Mineração de	dados	com	
Classificação de	Dados
Um	estudo de	caso sobre o	Churn	Rate	em serviços de	telefonia
PROF.	JOÃO GABRIEL	LIMA
@JGABRIEL_LIMA
LINKEDIN.COM/IN/JOAOGABRIELLIMA
Mineração de	dados	com	RapidMiner - Prof.	João Gabriel	Lima
Prof.	João Gabriel	Lima
• Pesquisador em Mineração de	dados	e	Inteligência Computacional;	
• Engenheiro da	Computação,	especialista em Software	e	Hardware;	
• Doutorando em Computação Aplicada;
Mineração de	dados	com	RapidMiner - Prof.	João Gabriel	Lima
Processo de	Extração do	conhecimento
Mineração de	dados	com	RapidMiner - Prof.	João Gabriel	Lima
Conhecendo nossa base	de	dados
ENTENDER O	DOMÍNIO E	O	CONHECIMENTO QUE	PODEMOS
EXTRAIR
Mineração de	dados	com	RapidMiner - Prof.	João Gabriel	Lima
Serviço de	telefonia
Nesta base	de	dados,	temos os dados	dos	clientes de	uma empresa de	telefonia.	
Vamos focar no	Churn	Rate
O	que	é o	Churn	Rate?	
◦ Trata-se	de	uma métrica que	avalia a	quantidade de	clientes que	abandonam/cancelam um	
determinado serviço.	
◦ Para	uma empresa expandir é imprescindível que	o	seu Growth	Rate	(índice de	crescimento)	supere o	
seu Churn	Rate.
◦ Objetivo é criar estratégias para	lidar com	os clientes de	modo a	compreender e	diminuir o	Churn	Rate.
Mineração de	dados	com	RapidMiner - Prof.	João Gabriel	Lima
Serviço de	telefonia
Nesta base	temos as	seguintes informações:
- TECNOLOGIA:		4G,	Telefone Móvel,	Telefone Fixo,	Fibra
- IDADE
- DATA	DE	ADESÃO
- LIGACOES_SUPORTE_ULTIMO_ANO:	quantidade total	de	ligações feitas para	ao
suporte
- MEDIA_FATURA_MENSAL
- TAXA_DE_CHURN:	probabilidade de	cancelamento
Mineração de	dados	com	RapidMiner - Prof.	João Gabriel	Lima
Qual o	objetivo chave?
EM MINERAÇÃO DE	DADOS,	TRAÇAR O	OBJETIVO É O	PRIMEIRO
PASSO.	É FUNDAMENTAL!
Mineração de	dados	com	RapidMiner - Prof.	João Gabriel	Lima
Classificar e	prever o	Churn	Rate	de	
acordo com	o	perfil e	comportamento
dos	clientes.
Mineração de	dados	com	RapidMiner - Prof.	João Gabriel	Lima
Ótimo!	Vamos aos negócios!
Conhecendo nossa
ferramenta!
AWESOME	DATA	MINE	TOOL
Passo 1	– Abrindo nossos dados	na ferramenta
Abra o	arquivo telefonia_churn_rate.csv com	o	componente Load	Data.
Passo 2	– ETL	e	preparação de	dados
Precisamos marcar a	coluna que	será o	alvo
das	análises (	TAXA_DE_CANCELAMENTO)	e	
convetê-la	de	numérica para	binária.
Componentes:
- Set	Rule
- Numerical	to	Binomial
Passo 3	– Preparando a	validação do	modelo
Validar seu modelo é a	chave do	sucesso.	O	cross-validation	separa o	conjunto de	dados	em
consjunto de	treinamento e	de	teste.
Componente:
*	X-Validation
Passo 3.1– Preparando o	grupo de	treinamento
A maioria dos clientes querem ficar com um
serviço ao invés de abandoná-lo (rsrsr)
Para isso precisamos equilibrar nosso
conjunto de treinamento para focar sobre o
caso que estamos interessados. Como se
estivéssemos colocando uma lupa sobre a
taxa de cancelamento.
Componentes:
- Sample
Passo 3.1– Preparando o	grupo de	treinamento
Passo 3.2– Preparando o	grupo de	treinamento
Em vez de apenas fazer a configuração manual, vamos otimizá-lo.
Utilizando o modelo Wisdom of the Crowd para uma árvore de decisão nós vamos otimizar a
profundidade máxima no intervalo [20-29]
Componente:
- Optimize Parameters (Grid)
Passo 4– Preparando nosso classificador
Abrindo o ”Otimizador de Parâmetros”, o modelo será treinado e avaliado.
Leitura recomendada:
Wisdom of the Crowd
Componentes:
- Decision Tree; Apply Model; Performance
Passo 3.3	– Configurando o	otimizador
Passo 3.2– Preparando o	grupo de	teste
O modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados
Componentes:
- Apply Model
- Performance (Binominal Classification)
Passo 3.3– Preparando o	grupo de	teste
O modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados
Componentes:
- Apply Model
- Performance (Binominal Classification)
Passo 3.3– Preparando o	grupo de	teste
O modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados
Componentes:
- Apply Model
- Performance (Binominal Classification)
Interpretando os
resultados
ENTENDENDO O	PODER DE	NOSSA MODELAGEM
Interpretando as	saídas
- Um	modelo	de	árvore	(treinado	com	os	dados),	que	analisa	o	comportamento	do	churn e	pode	
ser	aplicada	a	qualquer	cliente	individual	para	estimar	a	probabilidade	de	churn.
- Os	dados	de	entrada	original
- A	estimativa	(isto	é	cross-validado)	do	desempenho	do	modelo.
Utilizando o	modelo
Queremos prever o	comportamento de	novos clientes.	Para	isso vamos utilizar o	dataset:	
telefonia_churn_rate_final.csv
Componentes:
- Read	CSV
- Nominal	to	Date
- Set	Role
Apply	Model
Analisando os
Resultados
Analisando os Resultados
Mano…	que	louco	isso!
Agora	é
minha vez!
Atividade
A	partir de	uma base	de	dados	de	sua escolha,	com,	no	mínimo 100.000	registros,	aplique a	
classificação de	dados	de	modo que	seja possível prever o	comportamento do	seu objeto de	
estudo,	destacando a	interpretação dos	resultados.
Devem apresentar de	acordo com	o	exporto em sala de	aula.
Mineração de	dados	com	
Classificação de	Dados
Um	estudo de	caso sobre o	Churn	Rate	em serviços de	telefonia
PROF.	JOÃO GABRIEL	LIMA
@JGABRIEL_LIMA
LINKEDIN.COM/IN/JOAOGABRIELLIMA
Mineração de	dados	com	RapidMiner - Prof.	João Gabriel	Lima

Más contenido relacionado

La actualidad más candente

Inovação
InovaçãoInovação
Inovaçãolaikboy
 
Noções de Administração: Gestão por Processos (aula 3)
Noções de Administração: Gestão por Processos (aula 3)Noções de Administração: Gestão por Processos (aula 3)
Noções de Administração: Gestão por Processos (aula 3)Gustavo Zimmermann
 
Transformação Digital (DX) das Organizações
Transformação Digital (DX) das OrganizaçõesTransformação Digital (DX) das Organizações
Transformação Digital (DX) das OrganizaçõesAndre Zeferino
 
Guia completo planejamento-de-mídias-digitais-1
Guia completo planejamento-de-mídias-digitais-1Guia completo planejamento-de-mídias-digitais-1
Guia completo planejamento-de-mídias-digitais-1Lucas Modesto
 
Introdução ao Design Thinking
Introdução ao Design Thinking   Introdução ao Design Thinking
Introdução ao Design Thinking Priscila Machado
 
Estratégia e intervenção em marketing digital o caso empresarial doce sabor p...
Estratégia e intervenção em marketing digital o caso empresarial doce sabor p...Estratégia e intervenção em marketing digital o caso empresarial doce sabor p...
Estratégia e intervenção em marketing digital o caso empresarial doce sabor p...HELENO FAVACHO
 
Tdic na prática docente i
Tdic na prática docente   iTdic na prática docente   i
Tdic na prática docente iEduardo Lima
 
Apostila briefing espm
Apostila briefing espmApostila briefing espm
Apostila briefing espmAndré Felix
 
Gerenciamento de Projetos
Gerenciamento de ProjetosGerenciamento de Projetos
Gerenciamento de ProjetosMarcos Abreu
 
DIAGNÓSTICO DE TECNOLOGIA DA INFORMAÇÃO – TI PARA O MUNICÍPIO DE CARUARU
DIAGNÓSTICO DE TECNOLOGIA DA INFORMAÇÃO – TI  PARA O MUNICÍPIO DE CARUARUDIAGNÓSTICO DE TECNOLOGIA DA INFORMAÇÃO – TI  PARA O MUNICÍPIO DE CARUARU
DIAGNÓSTICO DE TECNOLOGIA DA INFORMAÇÃO – TI PARA O MUNICÍPIO DE CARUARUUniversidade de Pernambuco
 
Slides
SlidesSlides
Slidestarles
 
Heurística, Principios e Usabilidade na web
Heurística, Principios e Usabilidade na webHeurística, Principios e Usabilidade na web
Heurística, Principios e Usabilidade na webDaniel Brandão
 
Apresentação modelo pitch
Apresentação modelo pitchApresentação modelo pitch
Apresentação modelo pitchRafaella Cavalca
 

La actualidad más candente (20)

Inovação
InovaçãoInovação
Inovação
 
Noções de Administração: Gestão por Processos (aula 3)
Noções de Administração: Gestão por Processos (aula 3)Noções de Administração: Gestão por Processos (aula 3)
Noções de Administração: Gestão por Processos (aula 3)
 
Transformação Digital (DX) das Organizações
Transformação Digital (DX) das OrganizaçõesTransformação Digital (DX) das Organizações
Transformação Digital (DX) das Organizações
 
Guia completo planejamento-de-mídias-digitais-1
Guia completo planejamento-de-mídias-digitais-1Guia completo planejamento-de-mídias-digitais-1
Guia completo planejamento-de-mídias-digitais-1
 
Introdução ao Design Thinking
Introdução ao Design Thinking   Introdução ao Design Thinking
Introdução ao Design Thinking
 
Estratégia e intervenção em marketing digital o caso empresarial doce sabor p...
Estratégia e intervenção em marketing digital o caso empresarial doce sabor p...Estratégia e intervenção em marketing digital o caso empresarial doce sabor p...
Estratégia e intervenção em marketing digital o caso empresarial doce sabor p...
 
E book rodolfo nakamura
E book rodolfo nakamuraE book rodolfo nakamura
E book rodolfo nakamura
 
Tdic na prática docente i
Tdic na prática docente   iTdic na prática docente   i
Tdic na prática docente i
 
Paradigmas de Linguagem
Paradigmas de LinguagemParadigmas de Linguagem
Paradigmas de Linguagem
 
Apostila briefing espm
Apostila briefing espmApostila briefing espm
Apostila briefing espm
 
Gerenciamento de Projetos
Gerenciamento de ProjetosGerenciamento de Projetos
Gerenciamento de Projetos
 
DIAGNÓSTICO DE TECNOLOGIA DA INFORMAÇÃO – TI PARA O MUNICÍPIO DE CARUARU
DIAGNÓSTICO DE TECNOLOGIA DA INFORMAÇÃO – TI  PARA O MUNICÍPIO DE CARUARUDIAGNÓSTICO DE TECNOLOGIA DA INFORMAÇÃO – TI  PARA O MUNICÍPIO DE CARUARU
DIAGNÓSTICO DE TECNOLOGIA DA INFORMAÇÃO – TI PARA O MUNICÍPIO DE CARUARU
 
Custo Brasil
Custo Brasil Custo Brasil
Custo Brasil
 
Slides
SlidesSlides
Slides
 
Gestão de Projetos
Gestão de ProjetosGestão de Projetos
Gestão de Projetos
 
Heurística, Principios e Usabilidade na web
Heurística, Principios e Usabilidade na webHeurística, Principios e Usabilidade na web
Heurística, Principios e Usabilidade na web
 
Apresentação TCC
Apresentação TCCApresentação TCC
Apresentação TCC
 
Modelo de briefing
Modelo de briefingModelo de briefing
Modelo de briefing
 
FERRAMENTA 5W2H
FERRAMENTA 5W2HFERRAMENTA 5W2H
FERRAMENTA 5W2H
 
Apresentação modelo pitch
Apresentação modelo pitchApresentação modelo pitch
Apresentação modelo pitch
 

Destacado

Mineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e WekaMineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e WekaJoão Gabriel Lima
 
Segurança na Internet - Estudos de caso
Segurança na Internet - Estudos de casoSegurança na Internet - Estudos de caso
Segurança na Internet - Estudos de casoJoão Gabriel Lima
 
Weka – Ferramenta Livre para Mineração de Dados
Weka – Ferramenta Livre para Mineração de DadosWeka – Ferramenta Livre para Mineração de Dados
Weka – Ferramenta Livre para Mineração de DadosRubem Ventura Alves
 
Boas práticas para aplicativos android
Boas práticas para aplicativos androidBoas práticas para aplicativos android
Boas práticas para aplicativos androidJuliana Akemi
 
Segurança na Internet - Google Hacking
Segurança na Internet - Google  HackingSegurança na Internet - Google  Hacking
Segurança na Internet - Google HackingJoão Gabriel Lima
 
Ferramentas Java para Recuperação e Mineração de Informações
Ferramentas Java para Recuperação e Mineração de InformaçõesFerramentas Java para Recuperação e Mineração de Informações
Ferramentas Java para Recuperação e Mineração de InformaçõesFabrício Barth
 
De dev para data scientist 3 coisas que aprendi
De dev para data scientist  3 coisas que aprendiDe dev para data scientist  3 coisas que aprendi
De dev para data scientist 3 coisas que aprendiRodrigo Vieira
 
MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...
MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...
MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...Igor Steinmacher
 
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abreBig Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abreVivaldo Jose Breternitz
 
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???Alessandro Binhara
 
Usabilidade de interface para busca e recuperação de informação na web
Usabilidade de interface para busca e recuperação de informação na webUsabilidade de interface para busca e recuperação de informação na web
Usabilidade de interface para busca e recuperação de informação na webRobson Santos
 
Palestra MVP living lab ms
Palestra MVP   living lab msPalestra MVP   living lab ms
Palestra MVP living lab msBonoBee
 
Primeiros passos com o Cassandra
 Primeiros passos com o Cassandra  Primeiros passos com o Cassandra
Primeiros passos com o Cassandra Otávio Santana
 
Mantendo seu Tempo a salvo com Python e Git
Mantendo seu Tempo a salvo com Python e GitMantendo seu Tempo a salvo com Python e Git
Mantendo seu Tempo a salvo com Python e GitMatheus Pereira
 
Mineração de dados e novas oportunidades de análise para sistemas de informação
Mineração de dados e novas oportunidades de análise para sistemas de informaçãoMineração de dados e novas oportunidades de análise para sistemas de informação
Mineração de dados e novas oportunidades de análise para sistemas de informaçãoDalton Martins
 
Análise de Redes Sociais com Python
Análise de Redes Sociais com PythonAnálise de Redes Sociais com Python
Análise de Redes Sociais com PythonAna Paula Gomes
 
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013PentahoBrasil
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Carlos Barbieri
 

Destacado (20)

Mineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e WekaMineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e Weka
 
Segurança na Internet - Estudos de caso
Segurança na Internet - Estudos de casoSegurança na Internet - Estudos de caso
Segurança na Internet - Estudos de caso
 
Weka – Ferramenta Livre para Mineração de Dados
Weka – Ferramenta Livre para Mineração de DadosWeka – Ferramenta Livre para Mineração de Dados
Weka – Ferramenta Livre para Mineração de Dados
 
Boas práticas para aplicativos android
Boas práticas para aplicativos androidBoas práticas para aplicativos android
Boas práticas para aplicativos android
 
Segurança na Internet - Google Hacking
Segurança na Internet - Google  HackingSegurança na Internet - Google  Hacking
Segurança na Internet - Google Hacking
 
Ferramentas Java para Recuperação e Mineração de Informações
Ferramentas Java para Recuperação e Mineração de InformaçõesFerramentas Java para Recuperação e Mineração de Informações
Ferramentas Java para Recuperação e Mineração de Informações
 
De dev para data scientist 3 coisas que aprendi
De dev para data scientist  3 coisas que aprendiDe dev para data scientist  3 coisas que aprendi
De dev para data scientist 3 coisas que aprendi
 
MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...
MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...
MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...
 
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abreBig Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
 
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???
 
Usabilidade de interface para busca e recuperação de informação na web
Usabilidade de interface para busca e recuperação de informação na webUsabilidade de interface para busca e recuperação de informação na web
Usabilidade de interface para busca e recuperação de informação na web
 
Palestra MVP living lab ms
Palestra MVP   living lab msPalestra MVP   living lab ms
Palestra MVP living lab ms
 
Primeiros passos com o Cassandra
 Primeiros passos com o Cassandra  Primeiros passos com o Cassandra
Primeiros passos com o Cassandra
 
Mantendo seu Tempo a salvo com Python e Git
Mantendo seu Tempo a salvo com Python e GitMantendo seu Tempo a salvo com Python e Git
Mantendo seu Tempo a salvo com Python e Git
 
Mineração de dados e novas oportunidades de análise para sistemas de informação
Mineração de dados e novas oportunidades de análise para sistemas de informaçãoMineração de dados e novas oportunidades de análise para sistemas de informação
Mineração de dados e novas oportunidades de análise para sistemas de informação
 
Análise de Redes Sociais com Python
Análise de Redes Sociais com PythonAnálise de Redes Sociais com Python
Análise de Redes Sociais com Python
 
Bigadata casese opotunidades
Bigadata casese opotunidadesBigadata casese opotunidades
Bigadata casese opotunidades
 
Cases big data
Cases big dataCases big data
Cases big data
 
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02
 

Similar a Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Mineração de dados com RapidMiner + WEKA - Clusterização
Mineração de dados com RapidMiner + WEKA - ClusterizaçãoMineração de dados com RapidMiner + WEKA - Clusterização
Mineração de dados com RapidMiner + WEKA - ClusterizaçãoJoão Gabriel Lima
 
Anpad 2010 Eso 193 EstratéGia, CompetêNcias Profissionais E Performance
Anpad 2010   Eso 193  EstratéGia, CompetêNcias Profissionais E PerformanceAnpad 2010   Eso 193  EstratéGia, CompetêNcias Profissionais E Performance
Anpad 2010 Eso 193 EstratéGia, CompetêNcias Profissionais E PerformanceJose Gava Neto
 
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine LearningPalestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine LearningJosias Oliveira
 
Presentation yros | aws solution provider
Presentation yros | aws solution providerPresentation yros | aws solution provider
Presentation yros | aws solution providerYros
 
Tre Punti Soluções Industriais
Tre Punti Soluções IndustriaisTre Punti Soluções Industriais
Tre Punti Soluções IndustriaisConsultor Tre Punti
 
Teste de Desempenho, muito além do JMeter
Teste de Desempenho, muito além do JMeterTeste de Desempenho, muito além do JMeter
Teste de Desempenho, muito além do JMeterJuliano Santos
 
Curso de Google anaytics Avancado
Curso de Google anaytics AvancadoCurso de Google anaytics Avancado
Curso de Google anaytics Avancadoaluni_ead
 
Teste A/B - O que fazer para extrair o máximo de um teste - Marcell Almeida -...
Teste A/B - O que fazer para extrair o máximo de um teste - Marcell Almeida -...Teste A/B - O que fazer para extrair o máximo de um teste - Marcell Almeida -...
Teste A/B - O que fazer para extrair o máximo de um teste - Marcell Almeida -...Marcell Almeida
 
DESENVOLVIMENTO DE PROJETO PARA IMPLANTAÇÃO DO CMMI NIVEL DOIS DE MATURIDADE ...
DESENVOLVIMENTO DE PROJETO PARA IMPLANTAÇÃO DO CMMI NIVEL DOIS DE MATURIDADE ...DESENVOLVIMENTO DE PROJETO PARA IMPLANTAÇÃO DO CMMI NIVEL DOIS DE MATURIDADE ...
DESENVOLVIMENTO DE PROJETO PARA IMPLANTAÇÃO DO CMMI NIVEL DOIS DE MATURIDADE ...Diogo Rocha Ferreira de Menezes
 
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidadeCarlos Augusto Oeiras
 
Estratégias para Otimização de Consultas do Hibernate em uma Aplicação Web
Estratégias para Otimização de Consultas do Hibernate em uma Aplicação WebEstratégias para Otimização de Consultas do Hibernate em uma Aplicação Web
Estratégias para Otimização de Consultas do Hibernate em uma Aplicação WebAllan Silva
 
TDC2016SP - Colocando modelos de Machine Learning em produção.
TDC2016SP - Colocando modelos de Machine Learning em produção.TDC2016SP - Colocando modelos de Machine Learning em produção.
TDC2016SP - Colocando modelos de Machine Learning em produção.tdc-globalcode
 
Teste de Software - Especialização Univem
Teste de Software - Especialização UnivemTeste de Software - Especialização Univem
Teste de Software - Especialização UnivemAndré Abe Vicente
 
Tesla ADS - Além da fraude com inteligência artificial
Tesla ADS - Além da fraude com inteligência artificialTesla ADS - Além da fraude com inteligência artificial
Tesla ADS - Além da fraude com inteligência artificialJonathan Baraldi
 

Similar a Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia (20)

Mineração de dados com RapidMiner + WEKA - Clusterização
Mineração de dados com RapidMiner + WEKA - ClusterizaçãoMineração de dados com RapidMiner + WEKA - Clusterização
Mineração de dados com RapidMiner + WEKA - Clusterização
 
Anpad 2010 Eso 193 EstratéGia, CompetêNcias Profissionais E Performance
Anpad 2010   Eso 193  EstratéGia, CompetêNcias Profissionais E PerformanceAnpad 2010   Eso 193  EstratéGia, CompetêNcias Profissionais E Performance
Anpad 2010 Eso 193 EstratéGia, CompetêNcias Profissionais E Performance
 
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine LearningPalestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
 
Presentation yros | aws solution provider
Presentation yros | aws solution providerPresentation yros | aws solution provider
Presentation yros | aws solution provider
 
Tre Punti Soluções Industriais
Tre Punti Soluções IndustriaisTre Punti Soluções Industriais
Tre Punti Soluções Industriais
 
Tre Punti Soluções Industriais
Tre Punti Soluções IndustriaisTre Punti Soluções Industriais
Tre Punti Soluções Industriais
 
Teste de Desempenho, muito além do JMeter
Teste de Desempenho, muito além do JMeterTeste de Desempenho, muito além do JMeter
Teste de Desempenho, muito além do JMeter
 
Curso de Google anaytics Avancado
Curso de Google anaytics AvancadoCurso de Google anaytics Avancado
Curso de Google anaytics Avancado
 
Teste A/B - O que fazer para extrair o máximo de um teste - Marcell Almeida -...
Teste A/B - O que fazer para extrair o máximo de um teste - Marcell Almeida -...Teste A/B - O que fazer para extrair o máximo de um teste - Marcell Almeida -...
Teste A/B - O que fazer para extrair o máximo de um teste - Marcell Almeida -...
 
DESENVOLVIMENTO DE PROJETO PARA IMPLANTAÇÃO DO CMMI NIVEL DOIS DE MATURIDADE ...
DESENVOLVIMENTO DE PROJETO PARA IMPLANTAÇÃO DO CMMI NIVEL DOIS DE MATURIDADE ...DESENVOLVIMENTO DE PROJETO PARA IMPLANTAÇÃO DO CMMI NIVEL DOIS DE MATURIDADE ...
DESENVOLVIMENTO DE PROJETO PARA IMPLANTAÇÃO DO CMMI NIVEL DOIS DE MATURIDADE ...
 
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
 
Estratégias para Otimização de Consultas do Hibernate em uma Aplicação Web
Estratégias para Otimização de Consultas do Hibernate em uma Aplicação WebEstratégias para Otimização de Consultas do Hibernate em uma Aplicação Web
Estratégias para Otimização de Consultas do Hibernate em uma Aplicação Web
 
Seis sigma
Seis sigma  Seis sigma
Seis sigma
 
Processo seis sigma, uma visão geral
Processo seis sigma, uma visão geralProcesso seis sigma, uma visão geral
Processo seis sigma, uma visão geral
 
Processo seis sigma, uma visão geral
Processo seis sigma, uma visão geralProcesso seis sigma, uma visão geral
Processo seis sigma, uma visão geral
 
TDC2016SP - Colocando modelos de Machine Learning em produção.
TDC2016SP - Colocando modelos de Machine Learning em produção.TDC2016SP - Colocando modelos de Machine Learning em produção.
TDC2016SP - Colocando modelos de Machine Learning em produção.
 
Sistemas de Informação 2 - Aula04 - Sistemas de informação nas organizações p...
Sistemas de Informação 2 - Aula04 - Sistemas de informação nas organizações p...Sistemas de Informação 2 - Aula04 - Sistemas de informação nas organizações p...
Sistemas de Informação 2 - Aula04 - Sistemas de informação nas organizações p...
 
Teste de Software - Especialização Univem
Teste de Software - Especialização UnivemTeste de Software - Especialização Univem
Teste de Software - Especialização Univem
 
Tesla ADS - Além da fraude com inteligência artificial
Tesla ADS - Além da fraude com inteligência artificialTesla ADS - Além da fraude com inteligência artificial
Tesla ADS - Além da fraude com inteligência artificial
 
Metricas ageis
Metricas ageisMetricas ageis
Metricas ageis
 

Más de João Gabriel Lima

Deep marketing - Indoor Customer Segmentation
Deep marketing - Indoor Customer SegmentationDeep marketing - Indoor Customer Segmentation
Deep marketing - Indoor Customer SegmentationJoão Gabriel Lima
 
Aplicações de Alto Desempenho com JHipster Full Stack
Aplicações de Alto Desempenho com JHipster Full StackAplicações de Alto Desempenho com JHipster Full Stack
Aplicações de Alto Desempenho com JHipster Full StackJoão Gabriel Lima
 
Realidade aumentada com react native e ARKit
Realidade aumentada com react native e ARKitRealidade aumentada com react native e ARKit
Realidade aumentada com react native e ARKitJoão Gabriel Lima
 
Big data e Inteligência Artificial
Big data e Inteligência ArtificialBig data e Inteligência Artificial
Big data e Inteligência ArtificialJoão Gabriel Lima
 
Mineração de Dados no Weka - Regressão Linear
Mineração de Dados no Weka -  Regressão LinearMineração de Dados no Weka -  Regressão Linear
Mineração de Dados no Weka - Regressão LinearJoão Gabriel Lima
 
Segurança na Internet - Conceitos fundamentais
Segurança na Internet - Conceitos fundamentaisSegurança na Internet - Conceitos fundamentais
Segurança na Internet - Conceitos fundamentaisJoão Gabriel Lima
 
Visualizacao de dados - Come to the dark side
Visualizacao de dados - Come to the dark sideVisualizacao de dados - Come to the dark side
Visualizacao de dados - Come to the dark sideJoão Gabriel Lima
 
REST x SOAP : Qual abordagem escolher?
REST x SOAP : Qual abordagem escolher?REST x SOAP : Qual abordagem escolher?
REST x SOAP : Qual abordagem escolher?João Gabriel Lima
 
Game of data - Predição e Análise da série Game Of Thrones a partir do uso de...
Game of data - Predição e Análise da série Game Of Thrones a partir do uso de...Game of data - Predição e Análise da série Game Of Thrones a partir do uso de...
Game of data - Predição e Análise da série Game Of Thrones a partir do uso de...João Gabriel Lima
 
E-trânsito cidadão - IPVA em suas mãos
E-trânsito cidadão - IPVA em suas mãosE-trânsito cidadão - IPVA em suas mãos
E-trânsito cidadão - IPVA em suas mãosJoão Gabriel Lima
 
[Estácio - IESAM] Automatizando Tarefas com Gulp.js
[Estácio - IESAM] Automatizando Tarefas com Gulp.js[Estácio - IESAM] Automatizando Tarefas com Gulp.js
[Estácio - IESAM] Automatizando Tarefas com Gulp.jsJoão Gabriel Lima
 
Hackeando a Internet das Coisas com Javascript
Hackeando a Internet das Coisas com JavascriptHackeando a Internet das Coisas com Javascript
Hackeando a Internet das Coisas com JavascriptJoão Gabriel Lima
 
Mercado de Trabalho em Computação - Perfil Analista de Sistemas e Programador
Mercado de Trabalho em Computação - Perfil Analista de Sistemas e ProgramadorMercado de Trabalho em Computação - Perfil Analista de Sistemas e Programador
Mercado de Trabalho em Computação - Perfil Analista de Sistemas e ProgramadorJoão Gabriel Lima
 
[Fapan] criando aplicações mobile híbridas com ionic framework
[Fapan] criando aplicações mobile híbridas com ionic framework[Fapan] criando aplicações mobile híbridas com ionic framework
[Fapan] criando aplicações mobile híbridas com ionic frameworkJoão Gabriel Lima
 
Criando Aplicações Mobile Híbridas com Ionic Framework
Criando Aplicações Mobile Híbridas com Ionic FrameworkCriando Aplicações Mobile Híbridas com Ionic Framework
Criando Aplicações Mobile Híbridas com Ionic FrameworkJoão Gabriel Lima
 
Codifique uma vez, distribua em Android, iOS e Windows Phone
Codifique uma vez, distribua em Android, iOS e Windows PhoneCodifique uma vez, distribua em Android, iOS e Windows Phone
Codifique uma vez, distribua em Android, iOS e Windows PhoneJoão Gabriel Lima
 
Desbravando o mundo dos webcrawlers
Desbravando o mundo dos webcrawlersDesbravando o mundo dos webcrawlers
Desbravando o mundo dos webcrawlersJoão Gabriel Lima
 

Más de João Gabriel Lima (20)

Cooking with data
Cooking with dataCooking with data
Cooking with data
 
Deep marketing - Indoor Customer Segmentation
Deep marketing - Indoor Customer SegmentationDeep marketing - Indoor Customer Segmentation
Deep marketing - Indoor Customer Segmentation
 
Aplicações de Alto Desempenho com JHipster Full Stack
Aplicações de Alto Desempenho com JHipster Full StackAplicações de Alto Desempenho com JHipster Full Stack
Aplicações de Alto Desempenho com JHipster Full Stack
 
Realidade aumentada com react native e ARKit
Realidade aumentada com react native e ARKitRealidade aumentada com react native e ARKit
Realidade aumentada com react native e ARKit
 
JS - IA
JS - IAJS - IA
JS - IA
 
Big data e Inteligência Artificial
Big data e Inteligência ArtificialBig data e Inteligência Artificial
Big data e Inteligência Artificial
 
Mineração de Dados no Weka - Regressão Linear
Mineração de Dados no Weka -  Regressão LinearMineração de Dados no Weka -  Regressão Linear
Mineração de Dados no Weka - Regressão Linear
 
Segurança na Internet - Conceitos fundamentais
Segurança na Internet - Conceitos fundamentaisSegurança na Internet - Conceitos fundamentais
Segurança na Internet - Conceitos fundamentais
 
Web Machine Learning
Web Machine LearningWeb Machine Learning
Web Machine Learning
 
Visualizacao de dados - Come to the dark side
Visualizacao de dados - Come to the dark sideVisualizacao de dados - Come to the dark side
Visualizacao de dados - Come to the dark side
 
REST x SOAP : Qual abordagem escolher?
REST x SOAP : Qual abordagem escolher?REST x SOAP : Qual abordagem escolher?
REST x SOAP : Qual abordagem escolher?
 
Game of data - Predição e Análise da série Game Of Thrones a partir do uso de...
Game of data - Predição e Análise da série Game Of Thrones a partir do uso de...Game of data - Predição e Análise da série Game Of Thrones a partir do uso de...
Game of data - Predição e Análise da série Game Of Thrones a partir do uso de...
 
E-trânsito cidadão - IPVA em suas mãos
E-trânsito cidadão - IPVA em suas mãosE-trânsito cidadão - IPVA em suas mãos
E-trânsito cidadão - IPVA em suas mãos
 
[Estácio - IESAM] Automatizando Tarefas com Gulp.js
[Estácio - IESAM] Automatizando Tarefas com Gulp.js[Estácio - IESAM] Automatizando Tarefas com Gulp.js
[Estácio - IESAM] Automatizando Tarefas com Gulp.js
 
Hackeando a Internet das Coisas com Javascript
Hackeando a Internet das Coisas com JavascriptHackeando a Internet das Coisas com Javascript
Hackeando a Internet das Coisas com Javascript
 
Mercado de Trabalho em Computação - Perfil Analista de Sistemas e Programador
Mercado de Trabalho em Computação - Perfil Analista de Sistemas e ProgramadorMercado de Trabalho em Computação - Perfil Analista de Sistemas e Programador
Mercado de Trabalho em Computação - Perfil Analista de Sistemas e Programador
 
[Fapan] criando aplicações mobile híbridas com ionic framework
[Fapan] criando aplicações mobile híbridas com ionic framework[Fapan] criando aplicações mobile híbridas com ionic framework
[Fapan] criando aplicações mobile híbridas com ionic framework
 
Criando Aplicações Mobile Híbridas com Ionic Framework
Criando Aplicações Mobile Híbridas com Ionic FrameworkCriando Aplicações Mobile Híbridas com Ionic Framework
Criando Aplicações Mobile Híbridas com Ionic Framework
 
Codifique uma vez, distribua em Android, iOS e Windows Phone
Codifique uma vez, distribua em Android, iOS e Windows PhoneCodifique uma vez, distribua em Android, iOS e Windows Phone
Codifique uma vez, distribua em Android, iOS e Windows Phone
 
Desbravando o mundo dos webcrawlers
Desbravando o mundo dos webcrawlersDesbravando o mundo dos webcrawlers
Desbravando o mundo dos webcrawlers
 

Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

  • 1. Mineração de dados com Classificação de Dados Um estudo de caso sobre o Churn Rate em serviços de telefonia PROF. JOÃO GABRIEL LIMA @JGABRIEL_LIMA LINKEDIN.COM/IN/JOAOGABRIELLIMA Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  • 2. Prof. João Gabriel Lima • Pesquisador em Mineração de dados e Inteligência Computacional; • Engenheiro da Computação, especialista em Software e Hardware; • Doutorando em Computação Aplicada; Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  • 3. Processo de Extração do conhecimento Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  • 4. Conhecendo nossa base de dados ENTENDER O DOMÍNIO E O CONHECIMENTO QUE PODEMOS EXTRAIR Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  • 5. Serviço de telefonia Nesta base de dados, temos os dados dos clientes de uma empresa de telefonia. Vamos focar no Churn Rate O que é o Churn Rate? ◦ Trata-se de uma métrica que avalia a quantidade de clientes que abandonam/cancelam um determinado serviço. ◦ Para uma empresa expandir é imprescindível que o seu Growth Rate (índice de crescimento) supere o seu Churn Rate. ◦ Objetivo é criar estratégias para lidar com os clientes de modo a compreender e diminuir o Churn Rate. Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  • 6. Serviço de telefonia Nesta base temos as seguintes informações: - TECNOLOGIA: 4G, Telefone Móvel, Telefone Fixo, Fibra - IDADE - DATA DE ADESÃO - LIGACOES_SUPORTE_ULTIMO_ANO: quantidade total de ligações feitas para ao suporte - MEDIA_FATURA_MENSAL - TAXA_DE_CHURN: probabilidade de cancelamento Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  • 7. Qual o objetivo chave? EM MINERAÇÃO DE DADOS, TRAÇAR O OBJETIVO É O PRIMEIRO PASSO. É FUNDAMENTAL! Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  • 8. Classificar e prever o Churn Rate de acordo com o perfil e comportamento dos clientes. Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  • 12. Passo 1 – Abrindo nossos dados na ferramenta Abra o arquivo telefonia_churn_rate.csv com o componente Load Data.
  • 13. Passo 2 – ETL e preparação de dados Precisamos marcar a coluna que será o alvo das análises ( TAXA_DE_CANCELAMENTO) e convetê-la de numérica para binária. Componentes: - Set Rule - Numerical to Binomial
  • 14. Passo 3 – Preparando a validação do modelo Validar seu modelo é a chave do sucesso. O cross-validation separa o conjunto de dados em consjunto de treinamento e de teste. Componente: * X-Validation
  • 15. Passo 3.1– Preparando o grupo de treinamento A maioria dos clientes querem ficar com um serviço ao invés de abandoná-lo (rsrsr) Para isso precisamos equilibrar nosso conjunto de treinamento para focar sobre o caso que estamos interessados. Como se estivéssemos colocando uma lupa sobre a taxa de cancelamento. Componentes: - Sample
  • 16. Passo 3.1– Preparando o grupo de treinamento
  • 17. Passo 3.2– Preparando o grupo de treinamento Em vez de apenas fazer a configuração manual, vamos otimizá-lo. Utilizando o modelo Wisdom of the Crowd para uma árvore de decisão nós vamos otimizar a profundidade máxima no intervalo [20-29] Componente: - Optimize Parameters (Grid)
  • 18. Passo 4– Preparando nosso classificador Abrindo o ”Otimizador de Parâmetros”, o modelo será treinado e avaliado. Leitura recomendada: Wisdom of the Crowd Componentes: - Decision Tree; Apply Model; Performance
  • 20. Passo 3.2– Preparando o grupo de teste O modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados Componentes: - Apply Model - Performance (Binominal Classification)
  • 21. Passo 3.3– Preparando o grupo de teste O modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados Componentes: - Apply Model - Performance (Binominal Classification)
  • 22. Passo 3.3– Preparando o grupo de teste O modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados Componentes: - Apply Model - Performance (Binominal Classification)
  • 24. Interpretando as saídas - Um modelo de árvore (treinado com os dados), que analisa o comportamento do churn e pode ser aplicada a qualquer cliente individual para estimar a probabilidade de churn. - Os dados de entrada original - A estimativa (isto é cross-validado) do desempenho do modelo.
  • 25. Utilizando o modelo Queremos prever o comportamento de novos clientes. Para isso vamos utilizar o dataset: telefonia_churn_rate_final.csv Componentes: - Read CSV - Nominal to Date - Set Role Apply Model
  • 30. Atividade A partir de uma base de dados de sua escolha, com, no mínimo 100.000 registros, aplique a classificação de dados de modo que seja possível prever o comportamento do seu objeto de estudo, destacando a interpretação dos resultados. Devem apresentar de acordo com o exporto em sala de aula.
  • 31. Mineração de dados com Classificação de Dados Um estudo de caso sobre o Churn Rate em serviços de telefonia PROF. JOÃO GABRIEL LIMA @JGABRIEL_LIMA LINKEDIN.COM/IN/JOAOGABRIELLIMA Mineração de dados com RapidMiner - Prof. João Gabriel Lima