Академический Документы
Профессиональный Документы
Культура Документы
Niterói
2008
Ficha Catalográfica elaborada pela Biblioteca da Escola de Engenharia e Instituto de Computação da UFF
BANCA EXAMINADORA
___________________________________________________
Prof. Annibal Parracho Sant’Anna, PhD - Orientador
Universidade Federal Fluminense - UFF
___________________________________________________
Prof. Marco Antônio Farah Caldas, PhD
Universidade Federal Fluminense - UFF
__________________________________________________
Prof.ª Ismenia Blavatsky de Magalhães, Dsc
Escola Nacional de Ciências Estatísticas - ENCE
Niterói
2008
3
DEDICATÓRIA
Dedico este trabalho aos meus pais, Eduardo e Maria Ceiça, por construírem o
pilar para o que sou hoje. E aos meus avôs Dolores e Evilázio, que estão
orgulhosos onde estiverem.
4
AGRADECIMENTOS
Aos meus amigos Thiago Ramos, Anderson Pinho, Rodrigo Rocha e Rodrigo
Moreira, pela ajuda nos requisitos técnicos.
EPÍGRAFE
SUMÁRIO
1 INTRODUÇÃO ............................................................................................................................. 14
1.1 CONTEXTUALIZAÇÃO..................................................................................................... 14
1.2 O VALOR DO CLIENTE ..................................................................................................... 16
1.3 O PLANO DE SAÚDE E SUA IMPORTÂNCIA ................................................................ 19
1.4 ESTRUTURA DA DISSERTAÇÃO .................................................................................... 21
1.4.1 SOBRE O ESTUDO.................................................................................................................... 21
1.4.2 SOBRE O BANCO DE DADOS.................................................................................................... 21
4 O CONTEXTO DA PESQUISA................................................................................................... 40
LISTA DE FIGURAS
LISTA DE TABELAS
Tabela 13: Comparativo Antepenúltimo Valor Pago entre Churn e não-Churn .................... 85
Tabela 24: Churn PSM por Safra de Entrada (Ano de Inclusão) ........................................... 95
10
Tabela 30: Churn PSM por Tempo de Consulta, Tempo de Exame, e pelos Valores pagos da
RESUMO
cancelamento dos clientes assinantes; e definir o perfil dos clientes com maior risco
de evasão. Por fim, serão propostas algumas sugestões de ações voltadas para a
Palavras-chave:
ABSTRACT
Nowadays, the drives on the market show that is more profitable for the
choose to add new features to their portfolio. By knowing the risk associated with
can ptimize the results of their marketing efforts by focusing on correct solutions.
The purpose of this study is to develop a statistical model to link transactional and
will determine the profile of customers with greater risk of unsubscribing in health
plans. On this basis, the marketing managers become able to cener efforts on the
retention of the most valuable customers, maximizing the results for the corporation
to the company health plan administrator and of future researches are presented.
Keywords:
PSM
13
GLOSSÁRIO
CROSS SELLING Prática que visa a aproveitar as sinergias entre produtos. Colocam-
se, por exemplo, produtos complementares na mesma prateleira.
1 INTRODUÇÃO
1.1 CONTEXTUALIZAÇÃO
esse fato. E isso não se deve necessariamente à falta de esforços ou recursos. Uma
fidelização do cliente.
Porém, tal conceito há muito tempo se revela inadequado para o novo cenário. O
marketing está passando por uma reavaliação intensa à luz de vastos desafios
algumas metamorfoses que vão desde a adaptação dos produtos e serviços para
Relacionamento. Durante mais de uma década, o papel do marketing tem sido alvo
únicos bens verdadeiros de uma empresa. São eles que fornecem à empresa
no mercado.
mantém e garante ao seu cliente, que ele obtenha o que deseja e o que lhe foi
agregar novos valores, ou seja, fazer com que o cliente aumente seu consumo, e por
fim, criar um relacionamento duradouro e vantajoso para ambos durante toda uma
cada projeto, para investirem recursos que maximizem os resultados e lhes tragam
cancelamento (Churn), e atuar sobre eles com ações de retenção para reverter ou
25% a 85% reduzindo seu Churn em 5%; e, segundo Kotler (2006), reter um cliente
custa entre quatro e oito vezes menos que adquirir um novo. Para reconhecer esses
acordo com o negócio da empresa. Para empresas que administram plano de saúde,
17
de se tornar Churn. O ideal para empresa é encontrar determinado grupo que tenha
alto valor para empresa e alto potencial a se tornar Churn. Esse grupo deverá
Não é fácil encontrar uma relação estreita, ou uma fórmula fechada, que
Vitalício”, ou Lifetime Value (LTV), como sendo o valor de um cliente em toda sua
Lehmann (2004) como o valor presente de todos os lucros e futuros gerados pelo
Deve-se, não obstante, medir quanto cada cliente despendeu em suas transações
um modo geral, a manutenção dos clientes mais valiosos torna a empresa mais
rentável. Gupta e Lehman (2004) indicam que também é preciso estimar por quanto
individualmente.
estimar o valor do cliente não pautando somente no valor de receita gasto por
propensão a se tornar Churn é uma das soluções possíveis de serem adotadas para
com esse Escore. Associando esse valor de Churn aos melhores clientes, a
administradora de planos de saúde poderá fazer ou não esforço para manter esse
Escore de Churn ao seu dispêndio. Estratégias de CRM, como essa citada, podem
0 a 17 anos 9.768.844
18 a 29 anos 8.388.008
30 a 39 anos 6.718.887
40 a 49 anos 5.552.466
50 a 59 anos 3.477.376
60 a 69 anos 1.999.087
70 ou mais 1.884.083
privado de saúde, segundo a ANS (2003), terá reflexos nos anos subseqüentes, pois
haverá uma maior utilização dos serviços de assistência à saúde. Os gastos com
saúde irão se elevar e com a evolução do tratamento médico, as pessoas terão maior
tempo de vida.
serviços contratados?
clientes?
forma, elas deixam de estar sujeitas à referida restrição orçamentária, uma vez que,
médio mensal inferior ao gasto que ele teria, se não tivesse o plano e precisasse
conseqüentemente, nos gastos totais com saúde. Este aumento, por seu turno, eleva
a probabilidade do Churn.
de planos de saúde no Estado do Rio de Janeiro. Para a obtenção das análises finais,
precisaram-se efetuar alguns filtros até que chegasse à base final. Entre os filtros, o
22
detalhamento das motivações desse filtro para o estudo. A base final utilizada
Tempo de Consulta, Ano de Inclusão, Valor T3, Faixa Etária, Área de Rendimento,
dois grupos. O grupo que cancela plano de saúde apresentou taxa de acerto acima
de 80%, enquanto o grupo que não cancela, tem taxa de acerto acima de 90%. Esses
2 OBJETIVOS E RELEVÂNCIA
2.1 OBJETIVOS
para fundamentar o presente estudo, não encontrou artigos que abordassem uma
análise detalhada sobre Churn para empresas que administram planos de saúde.
assinantes da empresa.
26
observar possíveis valores que possam distorcer os modelos finais. Uma limitação
deste estudo é que nem todas as variáveis levantadas no modelo teórico puderam
ser aplicadas no modelo final ajustado, devido a algumas restrições explicadas mais
adiante.
Uma pergunta que esse estudo se propõe a responder seria: é possível definir
uma assinatura (contrato) pertencer ao grupo dos que cancelam ou ao grupo dos que
Score Matching (ou, Escore de Propensão) para agrupar os clientes com maior
possível atuar sobre eles através de ações de retenção, que revertam à perda desses
seus perfis, esse estudo busca ainda atingir alguns objetivos secundários:
27
do plano de saúde;
2.2 RELEVÂNCIA
de soluções para se chegar até ele. Esse tipo de iniciativa, cujo objetivo é
forma de conhecer cada vez mais os clientes. O objetivo final é desenvolver uma
28
similar ao daqueles que se desligaram. Em vez de aplicar suas ações para grupos de
clientes, cujos riscos de saída são baixos, ou ainda que possuam alto risco, mas não
duradouro).
Quando uma empresa aumenta sua taxa de retenção de clientes, aumenta a chance
3 REVISÃO DE LITERATURA
tempo durante o qual uma empresa retém seu cliente, maior é o lucro gerado por ele
Com vínculos mais enraizados, é possível cobrar mais pelo uso de seus produtos e
serviços.
retenção dos clientes. Essa definição é corroborada por Gupta e Lehman (2004). A
principalmente Churn.
autores têm-se preocupado com esta questão e com freqüência recomendam que as
prazo. Kotler e Armstrong (1995) recomendam que seja dado um cuidado todo
2001), são propensos a permanecerem leais por mais tempo a despeito de ofertas
sustentável e as ações de médio e longo prazo têm passado a fazer parte da agenda.
clientes possuem uma vantagem competitiva. Diante deste cenário, houve profunda
mudança no conceito que aborda o marketing transacional (venda como único fim),
de marketing.
32
(2006):
produtos; e.
consiste em ter boas relações com todos os envolvidos no negócio da empresa e que
atendimento.
(McKenna, 1993)
antigos têm 50% mais chances de manter suas contas ativas do que os recém-
chegados. Corretores que se mantêm em contato com seus melhores clientes fazem
vendas cruzadas.
Quanto mais antiga a relação com o cliente, melhor. O mundo atual oferece
inúmeras opções aos clientes. Clientes fiéis por muitos anos são mais propensos a
um período prolongado”. Essa fidelidade, entretanto, não pode ser garantida, uma
vez que o cliente continuará fiel à empresa apenas enquanto acreditar receber valor
empresa fique à margem do que acontece com os seus clientes em geral e com cada
sua missão. É preciso ficar claro que a principal missão da empresa é interferir na
Churn, objeto principal deste estudo, trata da perda de clientes sofrida por
caso, plano de saúde). Ou seja, é um conceito inverso à retenção dos clientes. Este é
diminuir esses índices de perda na carteira de clientes estão muito mais avançados.
Até pouco tempo atrás, a cultura das empresas era “conquistar o cliente a
ao Churn pode não ser um bom negócio; melhor deixá-lo com a concorrência.
e inevitável.
e tem seu fornecimento cancelado. Os motivos pelos quais o cliente deixa de pagar
podem ser os mais diversos, como desemprego e falta de capital suficiente para se
quais clientes são “fiéis”, quem tem mais propensão ao Churn, quais são
garantir sua fidelização. Evitando, com isso, a evasão dos indivíduos que agregam
alto valor para a mesma. Não se pode assumir automaticamente que uma taxa de
Churn alta é ruim ou uma taxa de Churn baixa é boa. Em mercados altamente
revelando-se (ou não) prejudicial em longo prazo, já que tende a inibir a entrada de
vários ramos. Porém, poucas reconhecem suas reais implicações. Quando se diz que
realmente dizer que essa empresa está perdendo de 25% a 30% dos clientes que se
encontram na sua base de dados. Isso significa que ela está perdendo clientes que
fazem ou já fizeram negócios com ela e que, por algum motivo, não ficaram
Com esses dados, a operadora pode fazer uma campanha de retenção com uma
perda de recursos muito pequena, além de exigir investimentos menores nessa ação.
preditivos é atribuir, para cada variável, coeficientes (ou pesos) que estão
variáveis que fazem com que esses clientes insatisfeitos evadam-se e o porquê da
insatisfação. Outro ponto é que muitos desses clientes são clientes que têm um
grande potencial de gasto com a empresa. Portanto, são clientes valiosos que a
4 O CONTEXTO DA PESQUISA
sem limite, transplantes de órgãos, internação durante 365 dias/ano, entre outros.
seus assinantes. Não era vantajoso para as operadoras permanecerem com clientes
assinantes de planos nos antigos moldes. Em contrapartida, não era obrigatório, por
parte dos assinantes, tais mudanças para o novo modelo. Na verdade, a migração
dos planos para nova lei poderia ser vantajosa, entretanto, acarretaria em um
aumento no prêmio.
nisso, esse estudo se propõe investigar somente os assinantes cujo plano de saúde se
pauta desse estudo, que visa caracterizar clientes e suas possíveis chances de se
tornar Churn. Visto isso, os planos vigentes e criados antes de 1999 são
novamente.
42
Marketing utilizáveis.
inclui:
clientes;
prazo, através da medição das compras repetidas, feitas por clientes recém-
conquistados;
concorrência.
estimação dos modelos aqui propostos. Cada tipo de informação possui sua
importância e relevância:
44
planejamento geográfico;
permitidas pelo avanço da tecnologia mostram que esta, sem dúvida, é uma grande
isso pode levar uma empresa a adotar estratégias diferentes de acordo com a região
onde se encontram seus clientes e seus prospects. Como destaca Kotler (2006),
do cliente com uma empresa que pode ser classificada em termos de canal de
45
que explicarão o valor financeiro que cada consumidor gera ao longo do tempo.
companhia. Um cliente pode gerar mais valor do que outro de acordo com a forma
que interage com a empresa. O uso de informações transacionais dos clientes para
guiar as decisões de marketing deve ser adotado por todas as empresas. Para
dados. Outra restrição é a procura por trabalhos que utilizam Modelos de Regressão
de Churn não está muito bem difundida nas publicações nacionais. Além disso, não
classificar os clientes com maiores chances de cancelarem os planos. Por fim, deve-
foram considerados.
47
todos, de exclusão dos assegurados por contratos empresariais, uma vez que quem
5 METODOLOGIA DE ANÁLISE
Na literatura, duas técnicas são mais usadas para separar dois grupos ou
erros de classificação.
de classificação.
estudo, erro do tipo I ocorre quando se rejeita a hipótese nula sendo ela verdadeira
(afirma-se que um indivíduo é Churn, quando ele não é) e o erro tipo II ocorre
quando aceita-se a hipótese nula, sendo ela falsa (afirma-se que um indivíduo não é
Segundo Hair et al. (2005), o outro ponto para pouca utilização do método
destes coeficientes pode ser estendida para qualquer problema prático. Hair et al.
(2005) ainda afirmam que existem algumas razões pelas quais a Regressão
as igualdades da variância/covariância.
utilizado de forma mais abrangente, pois não faz suposições quanto à forma
não-normais.
que essa regressão estima a chance de ocorrer certo evento a partir de uma série de
1
Para maiores informações sobre Análise Discriminante, consultar Hair et AL (2005)
52
pode ser satisfeita. Ao predizer o valor de uma variável numa escala de 0 a 1, faz
Para Meyer (1978), esse método de estimação dos parâmtros da regressão conduz
Logit pode ser feita por método log-linear. Para Hair et al. (2005), a análise Logit é
é linear. Sendo assim, a equação da função Logit que descreve uma relação linear
na Regressão Logística é:
indivíduo se tornar Churn), a equação Logit pode ser transformada numa equação
processo é utilizado, com a média usada no modelo estimado não para estabelecer a
valor de corte confiável a ponto de evitar perdas para a empresa? Tanto pela não
clientes.
Com isso, o ponto de corte para este estudo deve ser o valor que minimize
os erros de classificação dos assinantes. Existem dois tipos de erros: erro tipo I
(quando se rejeita a hipótese nula sendo ela verdadeira) e o erro tipo II (aceitar a
^
0.5”, ou seja, indivíduos são classificados Churn se p > 0.5. Em outras palavras,
para se encontrar um bom ajuste do modelo, uma das aferições é através da tabela
erro (tanto do tipo I quanto do tipo II). Gujarati (2006) confirma que é mais
limitações do algoritmo utilizado (mais adiante, no Capítulo 6.5), não foi possível
(-2LL)1.
1
Nos modelos lineares vistos na literatura (Gujarati, 2005), têm-se que os coeficientes de regressão
são calculados através da minimização da função de erro quadrático, conhecido como Mínimos
Quadrados Ordinários. Já na Regressão Logística, o cálculo é feito através da minimização da
função de verossimilhança (-2 vezes o logaritmo do valor da verossimilhança e é chamada de -2LL,
ou -2logverossimilhança)
57
variável dependente. Um modelo com bom ajuste terá um valor baixo para -2LL,
sendo que o valor mínimo é 0 (zero). Um modelo com ajuste perfeito terá como
outra.
Os coeficientes estimados (β0, β1, β2, ..., βk) são, na verdade, medidas das
modelos Logit é stepwise, que minimiza o número de variáveis para que o modelo
quanto mais variáveis são incluídas no modelo, mais ele se torna dependente dos
principalmente quando se tem certeza de que todas as variáveis são necessárias para
incorporar todas as variáveis e, após percorrer várias etapas, uma variável por vez
definem o modelo final. Numa dada etapa, tem-se um determinado modelo que se
uma variável pode vir a ser incorporada. Se em uma etapa não houver uma
resultado. Segundo Paula (2004) existem duas estatísticas mais importantes, que
foram utilizadas, neste estudo, para testar hipóteses relativas ao vetor de parâmetros
Como
A Estatística de Wald é:
conhecida. Na equação é aplicado “menos duas vezes seu LOG”, pois sua
de G. Assim, sob:
a seguinte questão: o modelo que inclui a variável em questão diz mais sobre a
multiplicando-se a diferença destes dois valores por -2. Este resultado, bem como o
pacotes estatísticos.
variável na regressão logística segue uma aproximação parecida com aquela usada
dicotômica.
Regressão Logística.
Esta medida Hosmer e Lemeshow (ou teste HL) tem a finalidade de avaliar
2000).
nula (hipótese de teste) é que não existe diferença significativa entre o valor real e o
valor previsto, ou seja, equivale a dizer que o modelo tem bom poder de ajuste.
opera da mesma forma, com valores mais altos indicando maior ajuste do modelo.
Entretanto, esta medida está limitada pelo fato de que não consegue alcançar o
valor máximo de um, de modo que Nagelkerke (Hair et al., 2005) propôs uma
isso significa uma expectativa de uma vitória ocorrer com três vezes mais
frequência do que uma derrota. Mas se as ODDS são de dois para um contra a
seleção, isto significa uma expectativa de uma derrota ocorrer com duas vezes mais
tentativas, ou seja, uma probabilidade de vitória igual a 75%. Por outro lado, para
uma probabilidade de vitória igual a 20% espera-se uma vitória e quatro derrotas a
65
uma derrota.
subpopulação com um dado valor para as variáveis observáveis pode ser estimado
controle nestas subpopulações. Para que se possa obter uma estimativa não viesada
É necessário que 0 < P(X) < 1. Isto assegura que para cada indivíduo tratado
exista outro indivíduo não tratado pareado, com valores similares de X. Dessa
não participantes que se situe entre 0 e 1, não podendo ser esta igual aos extremos.
priori:
tornaram Churn (perdidos) versus indivíduos que não se tornaram. Fazendo esse
mudaria o resultado dos participantes caso eles não tivessem se “desligado” da base
e o resultado que este indivíduo teria caso não tivesse se tornado Churn.
68
procura.
^
realizado da seguinte forma: seja p (Xi) a probabilidade de se tornar Churn do
^ ^
(pequeno) partindo p (Xi) existir pelo menos um p (Xj), em que j é um indivíduo
ideal a partir de uma amostra maior que a amostra do grupo de tratamento. O grupo
Churn dadas certas características). Quanto mais próximos esses Escores, melhor o
- Radius Matching;
- Kernel Matching e;
- Estratificação.
do ATT de cada bloco ponderada pela distribuição das observações entre os blocos.
Próximo”, pois esta procura, para cada observação tratada, a observação de controle
com o Escore de propensão a Churn mais próximo. Esta busca pode ser feita com
ou sem reposição, visto que uma observação de controle pode ser o melhor
“matching” para mais de uma observação tratada. Uma vez encontrados todos os
“matching” pode não ser muito boa tendo em vista que o controle mais próximo de
uma observação tratada pode estar bem distante em termos de Escore de propensão
observações tratadas.
Matching pode ser melhorada quando impomos uma região de suporte comum. A
escolha do método a ser utilizado vai depender do tipo de dados que se tem
^
Seja p (Xj) a probabilidade de um indivíduo j se tornar Churn. Diz-se que j
^
é um potencial a Churn se, dentro de um raio (pequeno) partindo de p (Xj), existir
^
pelo menos um p (Xi), sendo i um indivíduo com Potencial a não-Churn. A idéia é
Se o PSM faz:
Dessa forma:
semelhantes aos indivíduos com potencial a não-Churn, ou, ainda que apresentem
algumas variáveis Xjk e Xik distintas, essas diferenças, ponderadas pelos βk, de
a de definir como potenciais a Churn indivíduos que não se tornaram Churn, mas
^
apresentam p (X) >0,5.
com Potencial a Churn “ocultos”, o que o corte de probabilidade pode perder. Isso
potencial a Churn.
modelo probabilístico.
73
Logística binária foi aplicado. Para ajustar o modelo final que minimiza o número
0.5, pois define probabilidade Churn igual para os dois grupos (ativos e inativos).
Como nossa amostra possui uma porcentagem de clientes inativos muito próxima a
pontuação mais alta, estatística Wald. No caso, a variável tempo desde último
seguida, a variável dicotômica que indica Atraso no pagamento. Essas três variáveis
X2 – Segmento de Utilização1
X3 – Flag de Atraso1
X5 – Ano de Inclusão
X7 – Faixa Etária
X8 – Área de Rendimento1
X11 - Opcional1
X12 – Sexo
diminui-se a probabilidade de Churn. A real relação pode ser vista através da Razão
referência escolhida foi “A”. Significa então que morar numa área de Rendimento
“B” ou “C” aumenta a chance de se tornar Churn em relação a quem reside numa
(Deviance) diminuiu à medida que foi incluída uma variável no modelo, indicando
explicação do modelo.
observadas e previstas para todos os modelos com duas ou mais variáveis. O valor
variável dependente. Neste caso, o melhor ajuste do modelo é indicado por uma
2005).
79
grupo “não se torna Churn” é ainda maior que a taxa do grupo que “se torna
O modelo inicial, que considerava apenas a constante, tinha uma taxa geral
de acerto de 51,1%. O modelo completo com 13 variáveis aumenta 1,7 vezes a taxa
de acerto na previsão.
acerto geral do modelo não se altera tanto. Isto indica que as últimas variáveis
inseridas no modelo não apresentam tanto peso para determinar o Escore de Churn.
Estatística %
WALD Peso
Flag de Atraso de Pagamento. Juntas, essas três variáveis carregam mais de 73% de
como uma quarta variável (no nível de importância). Essas quatro variáveis
Churn.
tempo desde sua última consulta, tenham uma maior probabilidade de se tornar ex-
cliente.
que se tornaram Churn, (com tempo médio e tempo mediano de consulta acima de
tornar um Churn.
empresa, no penúltimo mês. É razoável supor que clientes ativos tenham uma
antepenúltimo mês. Clientes que não pagam esses valores (valor t2 e t3) tendem se
Mais ainda; a Tabela 13 indica semelhança entre as variáveis Valor t2 e t3. Era
últimos três meses. Onde 1 (um) indica atraso em um dos três possíveis pagamento.
Intuitivamente, tem-se que os clientes com atraso são os que mais se desligam do
plano de saúde.
86
Churn
Total
Não Sim
Atraso
Churn
Total
Não Sim
Atraso
mais propensos a se tornarem Churn, como se pode ver através das Tabelas 16 e 17
abaixo.
87
Churn
Total
Não Sim
Churn
Total
Não Sim
clientes utilizam os planos (Definição em Anexo 1). Dos clientes que não
100%
90%
6.326 8.646
80% 20.574 20.445
70% 10.712
60%
50% CHURN
40% ATIVO
7.421 13.246
30% 16.959 21.756
20% 4.467
10%
0%
Cirurgia/ Consulta/ Consulta/ Consulta/ Sem
Internação Exame Alta Exame Exame Segmento
Baixa Média
.
Churn
Total
Não Sim
Opcional
Churn
Total
Opcional
Não Sim
Os pacientes que com opcionais têm mais chance de não permanecer ativo.
clientes ativos. Isso pode ser explicado pelo alto valor do plano, associado à faixa
recorrer mais ao plano se comparados aos mais jovens. Isso se evidencia nas
Churn
Total
Não Sim
Churn
Total
Não Sim
Essa variável detecta regiões, no Estado do Rio de Janeiro, com maior proporção de
clientes com menor poder econômico. Vale lembrar que os bairros que
inativo tem o cliente. Isso se deve a importância e os benefícios que esse plano lhe
traz.
92
100%
537
90%
7.760 964
80% 24.902 7.802 24.738
70%
60%
50%
2.297 CHURN
40%
9.317 1.360
30% 22.345 8.701 19.829 ATIVO
20%
10%
0%
respectivamente pelos planos Alfa, Beta, Delta e Omega. Planos antigos ou mal
entre os planos (rede de produtos) citados, são: a presença de privilégios, tais como
Raynald Levesque e adaptado ao SPSS 13.0 © por John Painter (Fev 2004, Anexo
3). Este algoritmo possui uma limitação de seleção de amostra de até 20.000
10.000 clientes Inativos ou Churn (um para cada indivíduo Ativo) para formarem
os pares de probabilidade.
ao par Ativo. Se não achar, o algoritmo busca um próximo indivíduo Ativo e tenta
clientes Inativos. Encontrando esses pares, foi possível traçar um comparativo entre
os dois públicos (10.000 ativos e 10.000 inativos) para se testar a eficácia de uma
Em cada tabela, pode-se notar diferenças entre os grupos. No final deste Capítulo se
Clientes Ex-Clientes
Clientes Ex-Clientes
Clientes Ex-Clientes
Safra de
Absoluto % Absoluto %
Entrada
1999 40 0,4% 100 1,0%
Clientes Ex-Clientes
Clientes Ex-Clientes
Area de
Absoluto % Absoluto %
Rendimento
Clientes Ex-Clientes
Clientes Ex-Clientes
Tabela 30: Churn PSM por Tempo de Consulta, Tempo de Exame, e pelos
Valores pagos da penúltima e antepenúltima parcela
Fonte: Elaboração Própria
caracterizado por possuir planos (rede de produtos) mais diferenciados, ter tempo
atestar esses diferentes perfis e traçar planejamentos distintos para cada grupo de
clientes.
Logística.
99
7.1 CONCLUSÕES
perfil dos assinantes mais propensos a se tornar Churn, como também os menos
Ano de Inclusão, Valor T3, Faixa Etária, Área de Rendimento, Valor T2, Rede de
Regressão Logística é de 87,7% e que as taxas de acerto dos grupos individuais são
grupo que cancela apresentou taxa de acerto de 84,4% enquanto o grupo que não
Além disso, o valor de -2LL aumentou a cada passo. A combinação dessas medidas
sua assinatura é: aquele com maior tempo entre exames e consultas, com valores
clientes que atrasam mais os pagamentos e têm menos opcionais, clientes mais
7.2 RECOMENDAÇÕES
atendimento especializado;
desligamento do plano;
clientes devem montar uma base de dados que registre o relacionamento dos
do assinante (visto que, por exemplo, clientes que possui uma atividade física
REFERÊNCIAS BIBLIOGRÁFICAS
ABADIE, A., DRUKKER, D., HERR, J., IMBENS, G. Implementing matching estimators
for average treatment effects in Stata. The Stata Journal, n.1, p.1-18, 2001.
BERGER, Paul D.; NASR, NadaI. Customer Lifetime Value: Marketing Models and
Applications, Journal of Interactive Marketing, 12 (Winter), 17–30, 1998. .
CISTER, Angelo M.; EBECKEN, Nelson F. F. - “CRM through DM: a case study” – Third
International Conference on Data Mining- DATA MINING III, Bolongna, Italy-2002. .
CISTER, Angelo M. Mineração de dados para a análise de atrito em telefonia móvel tese
de doutorado - UFRJ - Eng. Civil, 2005.
104
HAIR, Joseph F. Jr.; ANDERSON. Rolph E.; TATHAM Ronald L.; BLACK William C.
Análise Multivariada de Dados, ISBN 85-363-0482-0: Bookman 2005
HECKMAN J.; Ichimura H.; SMITH J.; TODD P.,Matching as an econometrics evaluation
estimator – Review of Economics Studies,65, 261-294, 1998.
JONES, T.; SASSER JR. e EARL, W. Why satisfied customer defect. Harvard Business
Revivew, v. 73, n. 6, 9. 88-99, Nov./Dec. 1995.
KOTLER, Philip. Administração de Marketing. Editora Pearson, 12ª ed.: São Paulo, 2006. .
KUMAR, V.; RAMANI, G.; BOHLING, T. Customer Lifetime Value Approaches and
Best Practice Applications, Journal of Interactive Marketing, Vol 18. pag 60-72, 2004. .
PAULA, G.A. Modelos de regressão com apoio computacional. IME - USP. 294p.
Disponível em <http:// www.ime.usp.br/~giapaula>, 2004.
REICHHELD, F.F. The loyalty effect: the hidden force behind growth, profits, and lasting
value. Boston: Harvard Business Scholl Press, 1996. .
ROSENBAUM, P., Rubin, D. “The central role of the propensity score in observational
studies for causal effects”. Biometrika 70, 41–55. Rubin, D., 1983.
106
ANEXOS
SEGMENTO DE UTILIZAÇÃO
- Cirurgia: se o cliente fez alguma cirurgia nos últimos 12 meses
- Obstetrícia: se o cliente não teve evento de cirurgia, mas teve obstetrícia nos últimos 12
meses
- Consulta /Exame Baixa: se ocliente não fez cirurgia e não fez obstetrícia e sua média
mensal de eventos foi de até 0,667
- Consulta /Exame Média: se o cliente não fez cirurgia e não fez obstetrícia e sua média
mensal de eventos foi 0,667 a 1,667
- Consulta /Exame Alta: se o cliente não fez cirurgia e não fez obstetrícia e sua média
mensal de eventos foi superior a 1,667
- Não Usou: se o cliente não teve evento algum nos últimos 12 meses
ÁREA DE RENDIMENTO
- Classe A: Área Administrativa na cidade do Rio de Janeiro com Share de Rendimento até
5%
- Classe B: Área Administrativa no Rio de Janeiro com Share de Rendimento entre 5% e
10%
- Classe C: Área Administrativa no Rio de Janeiro com Share de Rendimento entre 10% e
15%
- Classe D: Área Administrativa no Rio de Janeiro Share de Rendimento entre 15% e 20%
- Classe E: Área Administrativa no Rio de Janeiro com Share de Rendimento acima de
20%
- Outros: Outros Estados no Estado do Rio de Janeiro
108
SHARE DE RENDIMENTO
- Representa o percentual médio que cada domicílio disponibiliza de sua renda mensal em
planos de saúde. Sua formulação segue:
109
FILTER OFF.
USE ALL.
SAMPLE .20.
EXECUTE .
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\churn_unimed_amostra20.sav'
COMPUTE X = RV.UNIFORM(1,26191) .
SORT CASES BY CHURN(D) PREV(D) X.
COMPUTE idx=$CASENUM.
exec.
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\mydata.sav'
SET MPRINT=no.
*////////////////////////////////.
DEFINE !match (nbtreat=!TOKENS(1)).
!DO !cnt=1 !TO !nbtreat
111
!ENDDEFINE.
*////////////////////////////////
SET MPRINT=yes
**************************.
* MACRO CALL (first insert the number of cases after nbtreat below) .
**************************.
!match nbtreat=5000
******************.
* Match each CHURN cases with the most similar non CHURN case.
* To include additional variables from original file list them on the RENAME
subcommand below.
******************