Este relatório técnico descreve um modelo de inferência fuzzy para classificar clientes de acordo com seu risco de cancelamento do serviço. O modelo usa variáveis como recência, frequência e valor das transações para determinar se um cliente tem alta ou baixa chance de continuar como cliente ativo. A lógica fuzzy permite criar regras linguísticas que capturam o conhecimento de especialistas em marketing para melhor prever o comportamento futuro dos clientes.
Mineração de Dados com Mapas de Kohonen: Uma Abordagem no Setor Financeiro
Estratégias de Marketing através de Análise RFV do Cliente e Lógica Fuzzy, no Marketing de Relacionamento
1. Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
Estratégias de Marketing através de Análise RFV do Cliente e Lógica Fuzzy
Anderson Guimarães de Pinho
Pontifícia Universidade Católica do Rio de Janeiro – Rio de Janeiro – RJ – Brasil
agp.net@gmail.com
Resumo São dos mais diversos os estudos envolvendo
O presente artigo objetivará a criação de um RFV. A exemplo, Fader (2005) apresentou um
modelo de inferência fuzzy o qual classifique modelo estocástico para estimar o Valor
corretamente futuros clientes evasivos para uma Financeiro do Tempo de Vida do Cliente
empresa. Em estratégias de marketing, é de (Customer Life Time Value ou CLTV), utilizando
grande dúvida para a empresa quais clientes como variáveis explicativas RFV em empresas
abordar numa campanha, ou quais clientes com vínculo não contratual. Em um segundo
apresentam maiores chances de evasão. Para estudo, Colombo (1999) introduz um simples
responderem a isto, muitos pesquisadores têm modelo estocástico baseado em RFV para
recorrido a informações de recência, freqüência e responder a quais clientes uma firma deve focar
valor do cliente, na mineração de conhecimento para fazer uma oferta de produto. Ambos os
valioso o qual possa ser utilizado. Lógica fuzzy estudos levam em comum o mesmo princípio
será um diferencial competitivo na identificação motivacional: medidas comportamentais de
destes clientes, pois permitirá a criação de um clientes são indicadores chaves para predizer
modelo preciso de classificação, alinhado ao comportamento futuro.
conhecimento lingüístico explícito do especialista
de marketing. Sobre o problema de Colombo, sabemos que as
Palavras-chave: empresas podem maximizar o retorno de ações e
Análise RFV, lógica fuzzy, data mining, minimizar custos de marketing se souberem quais
previsão a churn, lógica nebulosa. clientes endereçarem uma ação de venda. Estes
clientes podem ser assim considerados de maior
1. Introdução valor para a empresa, pois seu comportamento
passado indica uma intenção positiva de
RFV (ou RFM em algumas literaturas) entende-se manutenção do relacionamento.
como recência, freqüência e valor monetário do
cliente. Recência como uma medida de quanto Por outro lado, clientes menos valiosos seriam
tempo se passou desde a última transação com a aqueles que não apresentam uma intenção de
empresa. Freqüência como uma medida de quão recompra futura. Conseqüentemente,
freqüente um cliente efetua transações. E Valor apresentariam baixas chances de resposta a uma
Monetário como o gasto médio feito por ação de venda marketing, seja ela de cross-selling
transação. ou up-selling (Berry, 115).
Estratégias baseadas em RFV buscam métricas ou No entanto, é importante dizer que não há
regras para avaliar o comportamento e valor do garantias de que após um longo período de
cliente para a empresa. Perguntas como “quais inatividade, um cliente considerado no passado
clientes devem ser impactados por uma ação de como baixa chance de recompra venha a efetuar
marketing” ou “quais clientes são mais valiosos uma transação. Em casos afirmativos, dizemos
para a empresa em termos de contribuição que o evento “transação com a empresa”
financeira passada e futura” são encontradas representa um processo sem memória, de difícil
frequentemente por pesquisadores na gestão do modelagem, onde a ocorrência depende somente
relacionamento com o cliente (Customer de um instante de tempo imediatamente anterior
Relationship Management ou CRM). ao ocorrido.
Nestes casos, a análise de RFV pode conter Por estes motivos, empresas não se preocupam em
informação valiosa para a empresa na resposta a investigar um comportamento de compra futuro
estes questionamentos. Toda esta informação tão distante, uma vez que a dinâmica de mercados
necessária para análise encontra-se em histórico mais longínquos pode não ter dependência ou
transacional de vendas de clientes, disponíveis nos correlação com o presente. Em outras palavras, as
bancos de dados de grandes empresas. chances de um cliente se tornar de alto valor num
2. Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
futuro distante, dificilmente encontraria Neste artigo, abordaremos a técnica de Lógica
explicações no comportamento presente. Fuzzy (Marley apud Lofti Zadeh, 1965) para
problemas de classificação de grupos. Veremos
Numa visão inversa ao problema de Colombo, que esta técnica se apresentará como um
poderíamos trabalhar ações de marketing diferencial competitivo, pois permitirá a criação
específicas para clientes com menos chances de de um modelo de inferência preciso para
respostas. Tais ações teriam como objetivo a problemas de marketing, considerando o
mudança comportamental em termos de recência, conhecimento de especialistas sobre o problema
freqüência e valor, a fim de transformá-los de estudado. Isto poderia aumentar a acurácia do
maior valor para a empresa. sistema, e por outro lado, permitiria uma
adequação do sistema às atuais práticas da
Como por exemplo, suponha uma empresa empresa na identificação de grupos de clientes.
administradora de investimentos na Bolsa de Desta forma, tecnologia, pessoas e processos
Valores de São Paulo (BOVESPA). Para clientes poderiam se alinhar de forma a contemplarem este
com baixa intenção de manutenção do sistema criado, aumentando lucros e
relacionamento, poderiam ser oferecidos cursos e competitividade no mercado.
palestras sobre investimentos em ações. Tal ação
teria como objetivo secundário, oferecer aos 2. Customer Life Time Duration (CLTD) e
clientes ferramental intelectual o suficiente para RFV
que estes possam continuar operando no mercado
de ações pela empresa administradora. O paradigma dos problemas de RFV apresenta-se
Conseqüentemente, o aumento de lucros pelo como o seguinte: clientes com baixa recência, alta
aumento do tempo de relacionamento. freqüência, e alto valor, apresentarão um alto
CLTD e conseqüentemente estarão mais dispostos
Embora a discriminação de clientes mais e menos a manter um vínculo contínuo com a empresa,
valiosos atenda a múltiplos objetivos, este último respondendo melhor a campanhas de marketing.
apresentado torna-se mais atraente, pois vai ao Contrariamente, clientes com alta recência, baixa
encontro com a retenção de clientes ativos na base freqüência e baixo valor, são mais propensos à
de dados como conseqüência do aumento da interrupção do vínculo empresarial, respondendo
duração do tempo de vida do cliente (Customer pior a campanhas, pois já sem encontram no fim
Life Time Duration ou CLTD). Sendo assim, esta do CLTD.
será a principal motivação de nossos estudos nos
próximos capítulos. Quando se fala sobre CLTD, nem todas as
relações cliente-empresa são iguais. Dependendo
A figura a seguir mostra a distinção destes dois do tipo de serviço ou produto ofertado, clientes
grupos acima discutidos: podem assumir um relacionamento contratual ou
não contratual. Conforme se observa em Kuman
(1) (2) (p.103), casos contratuais constituem a mais
Maiores Chances Menores Chances precisa observação do tempo de vida do cliente.
Recompra. Recompra. Uma simples medida do tempo decorrido desde o
Alto Valor. Baixo Valor. início do relacionamento (ou início de uma janela
Alto CLTD Futuro. Baixo CLTD Futuro.
de análise) até o fim do relacionamento (ou fim de
uma janela de análise) pode ser obtida facilmente,
Figura 1 - Tipos de Clientes em Análise de RFV determinando assim o CLTD. Desta forma, um
cliente torna-se inativo quando não ocorre uma
Para problemas mais simples como a classificação renovação de contrato. Neste caso, dizemos que
de dois grupos de clientes, muitas outras técnicas ocorreu uma evasão ou “churn” de cliente.
de menos complexidade, em comparação à
modelagem estocástica, têm sido aplicadas. Já em casos não contratuais, onde não há uma
Reinartz (2005, p.129-132) destaca o uso da informação explícita sobre o fim de um
Regressão Logística e Árvore de Decisão como relacionamento. Clientes neste mercado não têm
solução a problemas envolvendo RFV. Tais barreiras que os empeçam de continuar ou
técnicas apresentam suas características, as quais interromper o relacionamento quando bem
dividem pesquisadores e acadêmicos na sua quiserem, sem alguma comunicação formal à
aplicação. empresa. Isto nos proporcionará o ambiente ideal
para aplicação de Lógica Fuzzy.
3. Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
Nestes ambientes não contratuais, a forma mais construída a partir de conceitos estabelecidos na
utilizada para cálculo do CLTD é emular uma lógica clássica. Operadores foram introduzidos à
regra de classificação de clientes em ativos ou semelhança dos tradicionais, e conforme estudos
inativos num tempo finito de relacionamento. Por foram feitos na área, novos operadores de
exemplo, poderíamos definir uma regra baseada importância prática eram desenvolvidos.
em RFV passado, para classificar clientes ativos e
inativos após três meses de relacionamento, Sistemas fuzzy têm sido aplicados em diversos
caracterizando previamente o fim ou manutenção campos de ciência. Este artigo trata
do CLTD. Isto ofereceria parâmetros suficientes explicitamente de um exemplo de mineração de
para que gestores de relacionamento com o cliente dados, ou data mining. A descoberta de
pudessem agir preventivamente na retenção conhecimento em grandes bancos de dados, ou
destes classificados como futuros inativos, data mining, tem inspirado muitos pesquisadores
maximizando lucros da empresa pela permanência nos mais diversos campos da ciência. Uma
prolongada do status ativo. Conforme se observa dificuldade em processos de descoberta de
em Karine (apud Reichheld & Sasser Jr., 1990), conhecimento ou knowledge discover database
dependendo do setor de atuação, as empresas (KDD), trata-se da extração do conhecimento
podem rentabilizar seus negócios em lucros de correto, de fácil compreensão, e de grande
25% a 85%, reduzindo em apenas 5% a perda de utilidade para o usuário. Berry divide em 5 as
clientes. responsabilidades atribuídas à mineração de dados
em processos KDD: (1) classificação; (2)
Por estes motivos, ações focadas em grupos com associação de regras; (3) perfilação de clientes; (4)
maiores chances de evasão, consequentemente clusterização; (5) estimação; e (6) predição.
menor chance de resposta a uma ação, passaria a
ser bastante atraente, pois vai ao encontro com a Pode ser dizer que lógica fuzzy esta associada a
lucratividade futura da empresa e uma série de todas estas responsabilidades mencionadas,
outros aspectos como satisfação e lealdade, sendo apresentando ou não a sua vantagem de utilização
assim a estratégia defendida neste artigo. em contrapartida a outras técnicas de mineração.
Na aplicação que se seguirá, veremos estritamente
3. Introdução a Lógica Fuzzy a resolução de um problema de classificação
através de lógica fuzzy. Como já discutido,
Seres humanos lidam frequentemente com Lógica Fuzzy se apresentará como um diferencial,
processos de decisões complexos a partir de pois unirá a precisão de um sistema baseado em
informações imprecisas ou aproximadas. Esta classificação, com o conhecimento lingüístico de
decisão tomada por seres humanos também será profissionais tomadores de decisão, expresso
de natureza imprecisa, podendo ser expressa através de regras de decisão.
muitas vezes através de conceitos ou conjuntos
lingüísticos. Teoria de conjuntos fuzzy e Lógica Por diversos textos e livros abordarem o assunto
Fuzzy visam traduzir em termos matemáticos, de lógica fuzzy vastamente, trataremos o
portanto precisos, esta informação de natureza problema analiticamente, buscando sempre uma
imprecisa através de um conjunto de regras formalização técnica quando necessário. Para um
lingüísticas. melhor entendimento da técnica recomendamos
[12] e [13].
O processo de inferência humano pode ser
entendido através de regras do tipo IF... THEN, 4. A Empresa e o Problema de Churn de
onde a parte IF se refere a um conjunto de Clientes
atributos preditores ou independentes, e THEN a
um atributo dependente, ou seja, a variável de A empresa em estudo trata-se de uma
aferição. Um modelo de inferência fuzzy baseado administradora de investimentos com grande
em regras lingüísticas, por sua vez, seria então atuação na Bovespa. Clientes que optam por
tratado através da Teoria de Conjuntos Fuzzy e a investir pelo sistema Home Broker executam
Lógica Fuzzy. ordens na internet, diversificando seus
investimentos em até 4 categorias de
A Teoria de Conjuntos Fuzzy foi concebida por investimentos: (1) compra e venda de ações; (2)
L.A. Zadeh com o objetivo de fornecer um cotas em fundos de investimentos; (3) bolsa de
ferramental matemático para o tratamento de mercadorias e valores futuros (ou Bm&f); (4) e
informações de caráter impreciso ou vago. A títulos do tesouro direto.
Lógica Fuzzy que é baseada nesta última teoria foi
4. Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
O problema da empresa apresenta-se da seguinte de valor movimento por ordem executada até um
forma: clientes após a inclusão na base de dados e instante de tempo t”, e certamente seria mais
início das operações no sistema home broker, discriminatória que a anterior.
apresentam um decréscimo significativo na
t
atividade até o 4º mês de relacionamento, ValorMovimentadoi
(2)
identificado pela não intenção de continuar ValorCliente (t ) i 1 t
investindo. É comprovado para a empresa que Ordensi
após o 4º mês de relacionamento clientes que i 1
decidem por continuar suas operações na bolsa ou
outro tipo de investimento o fazem continuamente Para Freqüência, definimos como “a média
ao longo de um horizonte de 12 meses ou mais. mensal do número de ordens executadas até um
instante de tempo t”.
Para que isto fique claro, apresentaremos o gráfico
a seguir. Para tanto, separamos 12 safras mensais t
Ordens i
de entrada de cliente ao longo do ano de 2006, e i 1
Freqüência Cliente (t ) (3)
verificou-se o status do cliente, mês a mês, por um t
período seguinte de 12 meses. Quando no mês de
análise, após a inclusão no cadastro da empresa, E por último, Recência, como “o tempo de
não era verificada nenhuma operação no sistema decorrido (em dias) até um instante de tempo t,
home broker, o cliente era marcado como inativo. desde a última ordem executada”.
Contrariamente, recebia a marcação de ativo, caso
viesse a efetuar alguma ordem de investimento no Sendo assim, para nosso problema,
mês. consideraremos t = 3 representando o terceiro mês
de relacionamento do cliente. Com isto,
Ativos Inativos buscaremos através de Lógica Fuzzy criar um
100
80 sistema que classifiquem futuros clientes inativos
a partir do 4º mês de relacionamento. Desta
% Classe
60
40
forma, a empresa em questão poderá agir
preventivamente através de ações de marketing de
20
relacionamento, buscando a retenção destes
0
1 2 3 4 5 6 7 8 9 10 11 12 clientes com maiores chances de evasão,
Tempo de Relacionamento chamados na literatura de RFV como de menor
valor ou baixo CLTD futuro.
Gráfico 1 - Curvas de Atividade e Inatividade
Em mercados como o de investimento, o
Neste tipo de negócio, empresas gestoras de comportamento em termos de RFV tem grande
investimentos geralmente obtêm lucros através de correlação com outras variáveis externas sócio-
uma taxa % sobre o valor movimento e/ou uma econômicas. Desta forma, é de grande
constante sobre cada ordem executada. Na preocupação que o modelo aqui objetivado seja o
empresa em análise, lucros provêm somente sobre menos dependente de comportamentos exógenos à
um valor constante para cada ordem executada. empresa. Para ilustrarmos nosso raciocínio e
utilizando um mercado hipotético, poderíamos
Desta forma, podemos definir como variável de dizer que um comportamento em termos de
Valor, os lucros obtidos por quantidade de ordens recência do cliente superior a 20 dias sem operar
executadas por cada cliente até um instante de na bolsa seria típico de um futuro cliente evasivo,
tempo t dado pela função abaixo, onde t é uma mas que em outra época com menor instabilidade
medida mensal: econômica, isto seria esperado do cliente.
t Desta forma, para que o sistema aqui proposto não
ValorCliente (t ) Ordens i Const. (1)
i 1 fosse dependente à época o qual esta sendo
estudado, optou-se por trabalhar com decis de
Esta última definição de valor seria um problema, valores de recência, freqüência, e valor. Isto vai de
pois pouco explicaria o potencial financeiro do encontro com modelos clássicos de RFV (Kuman,
cliente em questão, uma vez que o montante p.119). Por isso, decis foram criados tendo como
movimentado não é considerado no cálculo. Uma informação de entrada as variáveis definidas no
medida mais eficiente para Valor seria “a média capítulo 3. Isto permitiria a criação de um modelo
5. Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
menos frágil a variabilidade econômica no de conjuntos lingüísticos, por regras previamente
mercado, menos perecível com o passar dos estabelecidas e armazenadas no sistema. Feito
meses. isto, ocorre o processo chamado de defuzzificação
gerando uma ação precisa a ser tomada pelo
O banco de dados utilizado apresenta uma sistema, a partir de informações até então
amostra de 14.799 clientes (linhas). As variáveis lingüísticas. Tais etapas serão detalhadas a seguir.
de RFV (colunas) apresentam o seguinte domínio:
R (dias) pertence ao Dom {0; 90}; F (média de
ordens executadas mês) ao Dom {0,333; 2,86 x Entradas Precisas
10A}; e V (média de valor executado por ordem) RFV
ao Dom {3,485 x 10B ; 4,085 x 10C}. 1 Sendo
assim, cada uma das variáveis foi codificada no
intervalo de 1 a 10, conforme os decis de suas FUZZIFICADOR
distribuições de freqüência.
R F V
Conjunto Nebuloso de Entrada
1 Mais 1 Maior 1 Maior
2 Recente 2 Freqüência 2 Valor
3 3 3 REGRAS INFERÊNCIA
4 4 4
5 5 5
6 6 6 Conjunto Nebuloso de Saída
7 7 7
8 8 8
9 Menos 9 Menor 9 Menor DEFUZZIFICADOR
10 Recente 10 Freqüência 10 Valor
Saída Precisa
Figura 2 - Representação dos Decis de RFV Status
A variável dependente do modelo, Status no 4º
mês de relacionamento, será representada por uma
Figura 3 – Sistema de Inferência Fuzzy Estudado
variável binária, onde 0 representa o status ativo, e
1 o status inativo. 5.2. Fuzzificação
5. Modelagem por Lógica Fuzzy O processo de fuzzificação ocorre com a ativação
de conjuntos lingüísticos através de entradas
5.1. O Sistema
precisas fornecidas ao sistema. Para tanto, cada
No problema em estudo, o processo de tomada de variável de entrada (RFV) precisa ser definida em
decisão pode ser entendido da seguinte forma. termos de funções de pertinência e conjuntos
Dado um padrão de comportamento do cliente nos fuzzy, a ela associados. Para representação destes
três primeiros meses de relacionamento em termos conjuntos fuzzy, desejaríamos que este estivesse
de RFV, precisamos prever classificando o futuro estritamente associado à forma com a qual o
cliente inativo (ou não) a partir do 4º mês de analista de marketing toma decisões em seu
relacionamento. Neste sentido, usaríamos a lógica negócio.
fuzzy manipulando o conhecimento lingüístico
A forma mais próxima a qual um analista tomaria
necessário para responder a este tipo de problema
uma decisão em seu negócio, de natureza
de classificação.
imprecisa, poderia ser interpretada através de uma
O sistema de inferência pode ser entendido escala Likert (Rocha apud R.Likert, 1932) de 7
conforme figura a seguir. Primeiramente, entradas pontos. O principal papel da escala trata-se de
precisas são fornecidas ao sistema em termos de mensurar um conceito subjetivo através de níveis
RFV. Conjuntos lingüísticos são gerados de de intensidade numa escala de concordância. A
acordo com as funções de pertinência definidas escala Likert ganhou fama pela sua simplicidade e
sobre cada conjunto. O processo de inferência é é usada atualmente em diversas áreas da ciência.
efetuado, gerando conjuntos lingüísticos através Em nosso trabalho, entenda que o processo de
concordar e discordar trata-se essencialmente de
um processo impreciso, portanto adequado a
1
Por motivos de segurança, os dados de F e V da empresa aqui teoria dos conjuntos fuzzy.
utilizados, quando mencionados, serão multiplicados por um
escalar de 10 a menos A, B, ou C.
6. Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
Por exemplo, para a variável de valor, o processo
de definir um cliente como sendo de ALTO ou
BAIXO valor pelo analista poderia ser
representado através de uma nota numa escala de
1 até 7, onde a nota 7 representa que
definitivamente concorda que o cliente é de
ALTO valor, e 1 que concorda com a afirmação
de que definitivamente o cliente é de BAIXO
valor. Figura 5 – Conjuntos Fuzzy de Recência
Discordo Concordo
Totalmente Totalmente
Figura 4 – Escala Likert de 7 Pontos
Desta forma, um exemplo de raciocínio humano
completo, portanto, representável em termos de
regra no modelo de inferência fuzzy, poderia ser Figura 6 – Conjuntos Fuzzy de Freqüência
entendido da seguinte forma: Se um cliente
apresenta uma nota 5 dada pelo analista sobre o
grau de concordância sobre a afirmação que este
cliente é de alto valor financeiro; e nota 3 sobre a
concordância de que é de alta freqüência; e nota 7
concordando que é de alta recência; então na
prática, concluiríamos que este cliente será futuro
inativo a partir do 4º mês de relacionamento com
nota de concordância 3. Figura 7 – Conjuntos Fuzzy de Valor
Por estes motivos, será necessário criar para cada Para fins de exemplificação sobre a forma teórica
variável de entrada (RFV), 7 conjuntos de representação triangular, definiremos o
lingüísticos, cada qual representado por uma nota conjunto fuzzy referente à nota 4 da concordância
dada pelo analista num processo natural de de que o cliente é de alto valor. Sendo assim,
inferência humano. Por limitações do software, a defini-se:
forma destes conjuntos será definida na forma
triangular, com igual interseção de 50% dos 0, V e
conjuntos fuzzy dentre as variáveis. Percebam que ( f V)
as variáveis de entrada têm os mesmos limites 1 , e V f
máximos e mínimos (decis 1 até 10), e mesmos ( f e) (4)
TRI (V , e, f , g )
( g V ))
números de conjuntos fuzzy (notas 1 até 7 de
, f V g
concordância), e portanto terão a mesma forma de
(g f )
função de pertinência. 0, V g
Sendo assim, dado uma variável de entrada X
qualquer e um conjunto fuzzy Y qualquer, a Onde e=4,375, g=6,625, e f=5,5. Ou seja, a função
função de pertinência Y (X ) apresentará valores que mapeia V em 4 (V ) , função de pertinência
no intervalo de 0 até 1, conforme forma gráfica de V = 4 na forma triangular. Na forma gráfica,
das funções a seguir, onde: o eixo x representa a esta função pode ser visualizada em azul na figura
entrada precisa do sistema; e EQ_0 até EQ_6 6.
concordâncias mínimas e máximas para cada
variável de entrada : 5.3. Regras e Inferência Fuzzy
Precisamos definir agora quais regras serão
utilizadas no processo de inferência fuzzy. Na
forma com a qual nosso sistema esta programado,
regras precisam estar no seguinte formato: Seja,
RDecil=X, e FDecil=Y, e VDecil=Z, então, Status=W,
7. Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
onde X, Y, Z e W, valores lingüísticos possíveis Re lação ( R, F , V , S )
para R, F, V e Status, respectivamente. Sendo
f ( f e ( X ( R), Y ( F ), Z (V )), W ( s))
assim, uma regra é definida pela interseção de 3 (5)
antecedentes e 1 conseqüente. Percebam que com mín f e , W ( s) ,
isto, teríamos que definir um máximo de até 343 onde f e X ( R).Y ( F ). Z (V )
regras (73), cada qual com um único conseqüente.
Feito isto, um ajuste ainda é feito no valor de
No entanto, a geração manual de todas estas
regras seria altamente dispendiosa, e por outro pertinência gerado Re lação . Cada qual, cálculo
lado, poderia haver regras as quais na prática resultante da implicância para cada indivíduo na
nunca seriam utilizadas. Como a base que amostra, é multiplicado pelo seu peso respectivo.
dispomos para treinamento é grande, total de Um valor variando de 0 a 1 determinando o peso
10.000 registros, utilizaremos o procedimento de que aquela regra tem no modelo de inferência.
geração automática de regras programada no Sendo assim, teremos então saídas fuzzy para
Fuzzy Rule levando-se em consideração todo este serem consideradas na próxima etapa.
conjunto de dados.
5.4. Defuzzificação
Em suma, o que este procedimento de geração
automática de regras fará é: (1) determinar os Tendo em mãos todos os resultados gerados pelas
graus de pertinência que aparecem no domínio de regras ativadas, conjuntos fuzzy ativados e
R, F, V e Status; (2) atribuir a cada valor do funções de pertinência, a próxima etapa será a
domínio o conjunto fuzzy com maior grau de defuzzificação para que o sistema possa tomar
pertinência; (3) obter uma regra lingüística para uma decisão precisa sobre o problema. Até o
cada par de entradas RFV e saída Status. Tal momento dispomos de um ou mais conjuntos
procedimento foi executado e ao final podemos fuzzy para a variável de saída, cada um ativado
observar a geração de um total de 303 regras. com certo grau de pertinência.
O processo de inferência acontece da seguinte Neste artigo serão testados dos tipos de
forma: (1) o antecedente da regra é calculado defuzzificação, o método de altura limite e o
através da interseção dos conjuntos fuzzy através método do centróide. No método de altura limite,
do operador mínimo ou produto (definidos pelo utiliza-se o valor de suporte ou base do máximo
usuário e disponíveis no software). Lembre-se que do conjunto, cuja função de pertinência é maior.
para cada conjunto fuzzy ativado, existirá uma Em caso de empate neste último, utilizaríamos o
função de pertinência a ele associado; (2) quando valor suporte do máximo do conjunto com menor
da operação de implicação do resultado do pertinência. Já no método centróide, o valor
antecedente, o conseqüente também será preciso defuzzificado será a média ponderada dos
calculado através dos operadores mínimo ou valores suporte dos máximos dos conjuntos
produto. Com isto, uma regra ativada terá como ativados, multiplicados pelos valores de
saída um conjunto nebuloso com certo grau de pertinência dos mesmos conjuntos ativados.
pertinência a ele associado, servindo de resultado
para o processo de defuzzificação. Como dito anteriormente, para a variável
dependente Status de inatividade no 4º mês,
Neste artigo, testes demonstraram que os teremos também 7 conjuntos fuzzy definidos
operadores de produto para interseção, e mínimo como a seguir, cada um podendo ser ativado por
para implicação serão mais promissores. Sem uma ou mais regras.
entrar em detalhes sobre os resultados a serem
apresentados no capítulo 6, exemplificaremos
como seria efetuado o cálculo de implicação de
uma regra considerando estes operadores. Seja
Re lação ( R, F , V , S ) o valor de pertinência da
função de implicação de RFV em Status, defini-se
Re lação como sendo:
Figura 8 – Conjuntos Fuzzy Status
8. Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
Suponhamos na figura 8 que o conjunto S_3 tenha Percebam que o sistema de inferência fuzzy com
sido ativado com grau de pertinência min(0,45, operador de interseção produto, implicação de
S_3) e o conjunto S_4 tenha sido ativado com mínimo, e defuzzificação de centróide, gerou
grau de pertinência min(0,70,S_4). Pelo método melhores resultados sendo a configuração do
da altura limite, a saída precisa seria 0,625, modelo final adotado neste artigo. Entendam que
suporte central do conjunto S_4. Já para o método o sistema produziu uma saída contínua no
centróide, o valor de saída seria intervalo de 0 até 1. No entando, nosso problema
(0,45*0,5+0,70*0,625) /(0,45+0,70)= 0,576087. O real é tratado com uma variável de saída binária,
gráfico abaixo fornece uma visualização dos portanto, uma transformação na variável de saída
valores suporte utilizado. Status seria conveniente.
Neste sentido, tratamos o valor preciso de 0,5 na
variável fuzzy de saída como sendo o limiar de
0,70 separação entre grupos de clientes ativos, nota 0, e
0,45 clientes inativos, nota 1. Sendo assim, ao final foi
possível obter um resultado geral para o sistema
0,576
de inferência em termos de % de acerto dos
0,5 0,625 grupos. Nesta etapa, utilizamos somente o
conjunto denominado como controle a fim de
Figura 9 – Valores Suporte Utilizados para verificarmos a capacidade de generalização do
Defuzzificação sistema de inferência. Temos então que:
6. Resultados obtidos Preditos (Inferência do Sistema)
Para criação do sistema de inferência fuzzy Valores Inativo Ativo Total
utilizamos o software Fuzzy Rules (Vale, 2001). Inativo 812 273 1.085
Nesta etapa, clientes foram separados em dois Ativo 1.413 2.301 3.714
Observados
grupos de análise. O primeiro consistia numa Total 2.225 2.574 4.799
amostra equilibrada de 5000 clientes evasivos, e
5000 retidos, os quais foram utilizados em todos % Linha Inativo Ativo Total
os passos da modelagem do sistema. O segundo Inativo 74,8% 25,2% 100,0%
grupo foi usado como controle para avaliação do Ativo 38,0% 62,0% 100,0%
potencial de generalização do sistema obtido, e
Total 46,4% 53,6% 100,0%
consistiu numa amostra de 1.085 clientes evasivos
e 3.714 retidos. Tabela 2 – % Acerto para Classificação de Status
do Grupo de Controle
Como detalhado em 5.3, 303 regras foram geradas
utilizando somente o grupo de treinamento. No Sobre as regras geradas para o modelo de
nosso problema, testamos todas as possíveis inferência, podemos destar as com maiores peso
combinações de operadores de interseção, conforme tabela abaixo:
implicação e fuzzificação. Os resultados obtidos
para a previsão precisa da variável de interesse, a Conjuntos Fuzzy
qual assume valores 0 ou 1, estão a seguir: Peso
Recência Freqüência Valor Status
E0_0 E1_0 E2_0 S_0 1
Diferença % Média E0_6 E1_0 E2_0 S_6 1
Interseção Implicação Defuzificação
Treinam. Controle E0_6 E1_6 E2_0 S_0 1
Mínimo Mínimo Altura Limite 16,78 7,69 E0_0 E1_6 E2_6 S_0 1
Mínimo Mínimo Centróide 16,33 7,50 E0_6 E1_6 E2_6 S_6 1
Mínimo Produto Altura Limite 16,75 7,67
Mínimo Produto Centróide 16,39 7,54 Tabela 3 – Regras com Maiores Pesos
Produto Mínimo Altura Limite 16,68 7,65
7. Conclusões e Próximos Passos
Produto Mínimo Centróide 16,12 7,40
Produto Produto Altura Limite 16,54 7,58 Observamos percentuais de acerto para os grupos
Produto Produto Centróide 16,37 7,53 de inativos e ativos, respectivamente, de 74,8% e
62%. Para este tipo de negócio – mercado de
Tabela 1 – Resultados Obtidos para Combinação compra e venda de ações – a decisão de investir
de Operadores
9. Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
esta estritamente associada a diversos fatores [10] HAYKIN, Simon. Redes Neurais, Princípios e
exógenos ao cliente como instabilidade Práticas. Paulo Matins Engel. 2ed. Porto Alegre:
econômica, incerteza de mercado, etc. Somando- Bookman, 2001.
se a isto, poderíamos adicionar fatores
[11] BUSSAB, Wilton de O.; MORETTIN, Pedro A..
psicológicos dos clientes não controlados pelos Estatística Básica. 5ed. São Paulo: Saraiva, 2006.
analistas como aspectos de aversão a risco,
conservadorismo, estrategismo, etc. [12] TANSCHEIT, Ricardo. Sistemas Fuzzy.
Departamento de Engenharia Elétrica da Pontifícia
Percebam então que os resultados obtidos são Universidade Católica, Rio de Janeiro, RJ, 2009.
satisfatórios em termos de % de acerto, dado toda
esta incerteza inerente ao problema. A empresa [13] MENDEL, Jerry M. Fuzzy Logic Systems for
em estudo quando desejado aumentar seus índices Engineering: A Tutorial. IEEE, Los Angeles, USA,
de retenção de clientes, poderia focar ações nos 1995.
clientes classificados previamente pelo sistema [14] ROCHA, Luiz Carlos da. Construindo Escalas de
como futuros inativos. Contrariamente, visando a Atitude. Escola Nacional de Ciências Estatísticas, Rio
rentabilização e manutenção de cliente na base de de Janeiro, RJ, 2003.
dados, poderia fazer ações focadas nos clientes
classificados como futuros ativos, [15] TANSCHEIT, Ricardo. VELLASCO, Marley.
consequentemente, clientes mais rentáveis. Notas de Aula do Curso Lógica Fuzzy. Pontifícia
Universidade Católica, Rio de Janeiro, RJ, 2009.
8. Referências bibliográficas
[16] MEIER, Andreas; WERRO, Nicolas. A Fuzzy
[1] COLOMBO, Richard; JIANG Weina. A Stochastic Classification Model for Online Customers.
RFM Model. Journal of Interactive Marketing: Informatica, University of Fribourg, Switzerland,
Summer 1999. March of 2007.
[2] FADER, Peter; HARDIE, Bruce; LEE, Ka Lok. [17] Faculty of Information Technology, Iran
RFM and CLV: Using Iso-Value Curves for Telecommunication Research Center (ITRC), Tehran,
Customer Base Analysis. Journal of Marketing Irans. Optimized ICT Project Selection Utilizing
Research: Vol. XLII (November 2005). Fuzzy System. World Applied Sciences Journal, 2008.
[3] PIERSMA, Nanda, et al. Media Planning by [18] RUST et al. Modeling Fuzzy Data in Qualitative
Optimizing Contact Frequencies. Econometric Marketing Research. Journal of Marketing Research,
Institute Report EI 9856/A. Vol. XXXVII, November, 2000.
[4] REINARTZ, Werner. KUMAR, V. Customer [18] SOUZA et al. A Comparative Study of Fuzzy
Relationship Management, A Database Approach. Target Selection Methods in Direct Marketing.
John Wiley & Sons, June 2005. IEEE, 2002.
[5] HUMBY, Clive; HUNT, Terry; PHILLIPS, Tim.
Scoring Points. 2nd Ed. London: Kogan Page Limited,
2007.
[6] BARTH, Nelson Lerner. Inadimplência:
Construção de Modelos de Previsão. São Paulo:
Nobel Editora, 2004.
[7] BERRY, Michael; LINOFF, Gordon. Data Mining
Techniques for Marketing, Sales, and Customer
Relationship Management. John Wiley & Sons,
Indianapolis, Indiana, 2004. ´
[8] LAROSE, Daniel; Data Mining, Methods and
Models. John Wiley & Sons, New Jersey, Canada,
2006.
[9] SANTOS, Raul; Extração de Regras de Redes
Neurais via Algoritmos Genéticos. IV Congresso
Brasileiro de Redes Neurais, São José dos Campos, SP,
Julho de 1999.