Vinicius Mendes Dissert

UNIVERSIDADE FEDERAL FLUMINENSE
MESTRADO EM ENGENHARIA DE PRODUÇÃO

CENTRO TECNOLÓGICO
VINÍCIUS DE PAULA MENDES
MODELOS DE CHURN DE CLIENTES EM PLANO DE SAÚDE
Dissertação apresentada ao Curso de Pós-Graduação Stricto

Sensu em Engenharia de Produção da Universidade Federal
Fluminense, como requisito parcial para obtenção do Grau de
Mestre em Engenharia de Produção. Área de concentração:
Sistemas de Apoio à Decisão
Orientador: Prof. Annibal Parracho Sant’Anna, PhD
Niterói
2008
Ficha Catalográfica elaborada pela Biblioteca da Escola de Engenharia e Instituto de Computação da UFF
M538 Mendes, Vinícius de Paula.

Modelos de Churn de clientes em plano de saúde / Vinícius de
Paula Mendes. – Niterói, RJ : [s.n.], 2008.
102 f.
Orientador: Annibal Parracho Sant’Anna.

Dissertação (Mestrado em Engenharia de Produção) -
Universidade Federal Fluminense, 2008.
1. Marketing de relacionamento. 2. Logística. 3. Plano de saúde.

4. Sistema de apoio à decisão. I.Título.
CDD 658.8
2
VINÍCIUS DE PAULA MENDES
MODELOS DE CHURN DE CLIENTES EM PLANO DE SAÚDE
Dissertação apresentada ao Curso de Pós-Graduação Stricto

Sensu em Engenharia de Produção da Universidade Federal
Fluminense, como requisito parcial para obtenção do Grau de
Mestre em Engenharia de Produção. Área de concentração:
Sistemas de Apoio à Decisão
Aprovada em Outubro de 2008
BANCA EXAMINADORA
___________________________________________________
Prof. Annibal Parracho Sant’Anna, PhD - Orientador
Universidade Federal Fluminense - UFF
___________________________________________________
Prof. Marco Antônio Farah Caldas, PhD
Universidade Federal Fluminense - UFF
__________________________________________________
Prof.ª Ismenia Blavatsky de Magalhães, Dsc
Escola Nacional de Ciências Estatísticas - ENCE
Niterói
2008
3
DEDICATÓRIA
Dedico este trabalho aos meus pais, Eduardo e Maria Ceiça, por construírem o
pilar para o que sou hoje. E aos meus avôs Dolores e Evilázio, que estão
orgulhosos onde estiverem.
4
AGRADECIMENTOS
Ao meu orientador Annibal Parracho, pelos esclarecimentos oportunos.
Aos meus amigos Thiago Ramos, Anderson Pinho, Rodrigo Rocha e Rodrigo
Moreira, pela ajuda nos requisitos técnicos.
Um agradecimento especial à minha esposa Shihane Mohamad, por me incentivar a

todo o momento e pelo seu apoio incondicional.
E a todos que de certa forma torceram por mim nesta empreitada.
5
EPÍGRAFE
“Não tenho medo de falar que não sei.

Nem de falar que não aprendi.
Tenho sim, medo de dizer que não tentei.”
(Vinícius de Paula Mendes)
6
SUMÁRIO
1 INTRODUÇÃO ............................................................................................................................. 14
1.1 CONTEXTUALIZAÇÃO..................................................................................................... 14
1.2 O VALOR DO CLIENTE ..................................................................................................... 16
1.3 O PLANO DE SAÚDE E SUA IMPORTÂNCIA ................................................................ 19
1.4 ESTRUTURA DA DISSERTAÇÃO .................................................................................... 21
1.4.1 SOBRE O ESTUDO.................................................................................................................... 21
1.4.2 SOBRE O BANCO DE DADOS.................................................................................................... 21
2 OBJETIVOS E RELEVÂNCIA ................................................................................................... 25
2.1 OBJETIVOS .......................................................................................................................... 25

2.2 RELEVÂNCIA ...................................................................................................................... 27
3 REVISÃO DE LITERATURA ..................................................................................................... 29
3.1 MARKETING DE RELACIONAMENTO E RETENÇÃO .............................................. 30

3.2 MARKETING DE RELACIONAMENTO E FIDELIZAÇÃO......................................... 34
3.3 MARKETING DE RELACIONAMENTO E CHURN ...................................................... 35
4 O CONTEXTO DA PESQUISA................................................................................................... 40
4.1 PLANOS PRIVADOS DE ASSISTÊNCIA À SAÚDE ....................................................... 40

4.2 DATABASE MARKETING ................................................................................................. 42
4.3 COLETA DAS INFORMAÇÕES ........................................................................................ 45
4.4 MANIPULAÇÃO E TRATAMENTO DOS DADOS ......................................................... 46
5 METODOLOGIA DE ANÁLISE ................................................................................................ 49
5.1 O MODELO DE REGRESSÃO LOGÍSTICA .................................................................... 49

5.2 INFERÊNCIA NO MODELO DE REGRESSÃO LOGÍSTICA ....................................... 53
5.2.1 O PROBLEMA DA DETERMINAÇÃO DO VALOR DE CORTE ...................................................... 55
5.3 PROCEDIMENTO DE AJUSTE DO MODELO ............................................................... 56
5.3.1 INCLUSÃO E EXCLUSÃO DE VARIÁVEIS NOS MODELOS DE REGRESSÃO .............................. 57
5.3.2 TESTES DE CONFIRMAÇÃO NOS MODELOS DE REGRESSÃO .................................................. 59
5.3.3 MEDIDAS DE AJUSTES NOS MODELOS DE REGRESSÃO.......................................................... 62
5.3.4 RAZÃO DE PROBABILIDADES (ODDS) ................................................................................... 64
5.4 O MÉTODO DE MACHING ............................................................................................... 65
5.4.1 PROPENSITY SCORE MATCHING (ESCORE DE PROPENSÃO) .................................................. 66
5.4.2 ATT (TREATMENT ON THE TREATED) .................................................................................... 67
6 ANÁLISE DOS RESULTADOS .................................................................................................. 73
6.1 RESULTADOS DO MODELO DE REGRESSÃO ............................................................ 73

7
6.1.1 INTERPRETAÇÃO DOS PARÂMETROS NO MODELO................................................................ 77

6.2 AJUSTE FINAL DO MODELO........................................................................................... 78
6.3 PRECISÃO DA ESTIMATIVA DO MODELO ................................................................. 79
6.4 INTERPRETAÇÃO DOS RESULTADOS ......................................................................... 82
6.5 RESULTADOS NO PSM ...................................................................................................... 93
7 CONCLUSÕES, RECOMENDAÇÕES E SUGESTÕES .......................................................... 99
7.1 CONCLUSÕES ..................................................................................................................... 99

7.2 RECOMENDAÇÕES ......................................................................................................... 101
7.3 SUGESTÕES DE PESQUISA ............................................................................................ 102
8
LISTA DE FIGURAS
Figura 1: Nº de Beneficiários em plano de saúde privado no Brasil por Idade ..................... 19
Figura 2: Curva de distribuição de probabilidade logit (dados simulados)............................ 52
Figura 3: Dispersão entre o Tempo de Consulta e Probabilidade de Churn .......................... 83
Figura 4: Dispersão entre o Tempo de Exame e Probabilidade de Churn ............................. 84
Figura 5: Distribuição entre os Clientes Ativos e Churn através do Segmento ..................... 88
Figura 6: Distribuição Econômica nos Bairros do Estado do Rio de Janeiro ........................ 91
Figura 7: Distribuição entre os Clientes Ativos e Churn através do Plano ............................ 92

9
LISTA DE TABELAS
Tabela 1: Descrição das Variáveis, presente no banco de dados ........................................... 23
Tabela 2: Descrição das variáveis utilizadas na Regressão Logística.................................... 48
Tabela 3: Modelo apenas com a constante............................................................................. 74
Tabela 4: Teste Omnnibus de coeficientes do Modelo .......................................................... 74
Tabela 5: Estimação do Modelo de Churn ............................................................................. 76
Tabela 6: Máxima verossimilhança e R2 ............................................................................... 78
Tabela 7: Teste de Hosmer e Lemeshow ............................................................................... 79
Tabela 8: Classificação no modelo final ................................................................................ 80
Tabela 9: Peso das variáveis no modelo final ........................................................................ 81
Tabela 10: Comparativo no Tempo de Consulta entre Churn e não-Churn ........................... 82
Tabela 11: Comparativo no Tempo de Exame entre Churn e não-Churn .............................. 83
Tabela 12: Comparativo no Penúltimo Valor Pago entre Churn e não-Churn....................... 85
Tabela 13: Comparativo Antepenúltimo Valor Pago entre Churn e não-Churn .................... 85
Tabela 14: Churn versus Atraso - Absoluto ........................................................................... 86
Tabela 15: Churn versus Atraso - Percentual......................................................................... 86
Tabela 16: Churn versus Ano de Inclusão - Absoluto ........................................................... 87
Tabela 17: Churn versus Ano de Inclusão - Percentual ......................................................... 87
Tabela 18: Churn versus Opcional - Absoluto ....................................................................... 88
Tabela 19: Churn versus Opcional - Percentual..................................................................... 89
Tabela 20: Churn versus Faixa Etária - Absoluto .................................................................. 89
Tabela 21: Churn versus Faixa Etária - Percentual ................................................................ 90
Tabela 22: Churn PSM por Sexo ........................................................................................... 94
Tabela 23: Churn PSM por Faixa Etária ................................................................................ 94
Tabela 24: Churn PSM por Safra de Entrada (Ano de Inclusão) ........................................... 95
10
Tabela 25: Churn PSM por Tipo de Plano ............................................................................. 95
Tabela 26: Churn PSM por Área de Rendimento .................................................................. 96
Tabela 27: Churn PSM por Segmento de Utilização ............................................................. 96
Tabela 28: Churn PSM por Estado Civil ............................................................................... 96
Tabela 29: Churn PSM por Flag de Atraso ............................................................................ 97
Tabela 30: Churn PSM por Tempo de Consulta, Tempo de Exame, e pelos Valores pagos da
penúltima e antepenúltima parcela......................................................................................... 97

11
RESUMO
Atualmente, as movimentações no mercado mostram que é mais lucrativo
para a empresa o investimento no relacionamento com o cliente, com foco na
retenção, do que optar por incrementos na carteira dos mesmos. Conhecendo-se os
riscos associados ao desligamento, empresas podem direcionar estratégias de
marketing na retenção de clientes com maiores chances de evasão. Adotando-se
práticas de relacionamento, é possível otimizar os resultados de marketing, pois é
possível focar em ações mais assertivas. O objetivo deste estudo será o de
desenvolver um modelo estatístico, que relacione variáveis transacionais,
demográficas e dados sobre o histórico de eventos, com a probabilidade de
cancelamento dos clientes assinantes; e definir o perfil dos clientes com maior risco
de cancelamento em planos de saúde. Para que seja possível focar os recursos na
retenção dos clientes mais valiosos, maximizando os resultados da corporação e a
satisfação do assinante. Em um segundo momento, com o objetivo de definir perfis
estratégicos de clientes, será proposta uma análise, através do PSM (Propensity
Score Matching), no intuito de comparar clientes com probabilidades semelhantes
de evasão. Por fim, serão propostas algumas sugestões de ações voltadas para a
empresa administradora do plano de saúde, e pesquisas futuras.
Palavras-chave:
Churn, Marketing de Relacionamento, Retenção de Clientes, Análise de
Regressão Logística, PSM

12
ABSTRACT
Nowadays, the drives on the market show that is more profitable for the
companies to invest in relationships with customers, decreasing retention rates than
choose to add new features to their portfolio. By knowing the risk associated with
shutdown, the companies can direct marketing strategies to retain customers in
areas of higher probability of evasion. Bringing up practices of relationship, they
can ptimize the results of their marketing efforts by focusing on correct solutions.
The purpose of this study is to develop a statistical model to link transactional and
demographic information with the probability of unsubscribing. Additionally, we
will determine the profile of customers with greater risk of unsubscribing in health
plans. On this basis, the marketing managers become able to cener efforts on the
retention of the most valuable customers, maximizing the results for the corporation
and the satisfaction of the customers. Besides, intending to establish strategic
profiles of customers, it will be offered an analysis using PSM, to compare
customers with similar probabilities. Finally, some suggestions of directed actions
to the company health plan administrator and of future researches are presented.
Keywords:
Churn, Relationship Marketing, Customer Retention, Logistic Regression,
PSM
13
GLOSSÁRIO
ATT Efeito médio do tratamento é a diferença do resultado esperado de

um indivíduo selecionado aleatoriamente, da subpopulação de
indivíduos tratamento e o resultado que este indivíduo teria caso
não tivesse se sido tratado.
CHURN Termo utilizado para denotar a evasão (desligamento) do cliente de

uma determinada empresa.
CRM Customer Relationship Management, em português, gerenciamento

do relacionamento com cliente.
CROSS SELLING Prática que visa a aproveitar as sinergias entre produtos. Colocam-
se, por exemplo, produtos complementares na mesma prateleira.
DATA MINING Processo de explorar grandes quantidades de dados à procura de

padrões consistentes, como regras de associação ou seqüências
temporais, para detectar relacionamentos sistemáticos entre
variáveis.
DATABASE Ferramenta do marketing que se utiliza das tecnologias da

MARKETING
informática para a segmentação de grupos de consumidores através
da análise do seu perfil e do desenvolvimento de ações dirigidas.
LTV Lifetime Value é o valor presente de todos os lucros e futuros

gerados pelo cliente, ao longo de sua vida de negócios com a
empresa
MARKET SHARE Participação no mercado. Quantifica em porcentagem a quantidade

do mercado dominado por uma empresa.
PSM Probabilidade condicional de receber um tratamento, dadas

algumas características a priori.
14
1 INTRODUÇÃO
1.1 CONTEXTUALIZAÇÃO
As estratégias de negócio mais difundidas atualmente se baseiam na idéia de
entender os anseios e as necessidades do consumidor. Apesar da aparente aceitação
da importância do cliente, as ações da maioria das empresas não correspondem a
esse fato. E isso não se deve necessariamente à falta de esforços ou recursos. Uma
das grandes dificuldades nas empresas é avaliar o impacto de seus investimentos de
marketing quando as estratégias de curto prazo, como corte o de custos e
promoções, começam a ser substituídas por um programa de relacionamento e
fidelização do cliente.
As estratégias de marketing atuais ainda se encontram baseadas, grande
parte, no conceito de “marketing de massa”, marketing este em que a empresa
produz, distribui e promove em massa um produto para todos os compradores.
Porém, tal conceito há muito tempo se revela inadequado para o novo cenário. O
marketing está passando por uma reavaliação intensa à luz de vastos desafios
globais, tecnológicos, econômicos e sociais enfrentados pelas empresas atuais. Os

15
mercados de massa estão fragmentando-se em pequenos mercados. Canais
múltiplos de distribuição estão substituindo canais únicos; consumidores estão
comprando diretamente através de catálogos, telemarketing e compra eletrônica;
preços com descontos e promoção de vendas estão em ascensão, prejudicando a
lealdade de marca; mídias convencionais de propaganda estão atingindo menor
número de consumidores potenciais e custando mais.
O aumento da competição, atualmente, motiva as empresas a passarem por
algumas metamorfoses que vão desde a adaptação dos produtos e serviços para
atender às necessidades de seus clientes, e estabelecer diferenciais, até mudanças
nos processos internos de gestão. Uma dessas mudanças acontece na área de
Marketing, com o surgimento nos últimos anos, do conceito de Marketing de
Relacionamento. Durante mais de uma década, o papel do marketing tem sido alvo
de constante atenção. Os gestores querem do marketing mais impacto na receita e
resultados mais imediatos.
O Marketing de Relacionamento representa um caminho para que o
marketing preserve sua posição estratégica, ajudando a empresa a crescer em um
ambiente competitivamente desafiador. Neste ambiente, os relacionamentos são os
únicos bens verdadeiros de uma empresa. São eles que fornecem à empresa
rendimentos a longo prazo, com baixo risco, viabilizando a permanência da mesma
no mercado.
Marketing de Relacionamento é como a empresa encontra, conhece,
mantém e garante ao seu cliente, que ele obtenha o que deseja e o que lhe foi
prometido em todos os aspectos do negócio (Bretzke, 2000). Caracteriza-se por
tentar conhecer o consumidor individualmente, corresponder aos seus anseios,

16
agregar novos valores, ou seja, fazer com que o cliente aumente seu consumo, e por
fim, criar um relacionamento duradouro e vantajoso para ambos durante toda uma
vida de parceria. Cumprindo esse papel, as empresas conseguem atingir e manter
um relacionamento com os clientes, induzindo a sua fidelização.
Diante do quadro atual, as empresas estão focadas em medir o retorno de
cada projeto, para investirem recursos que maximizem os resultados e lhes tragam
retorno tanto financeiro quanto na relação com o consumidor. Ao mesmo tempo,
pesquisas são realizadas para identificar os clientes com maior risco de
cancelamento (Churn), e atuar sobre eles com ações de retenção para reverter ou
impedir a perda destes clientes.
Segundo Reichheld (1996), as empresas podem aumentar seus lucros de
25% a 85% reduzindo seu Churn em 5%; e, segundo Kotler (2006), reter um cliente
custa entre quatro e oito vezes menos que adquirir um novo. Para reconhecer esses
clientes é preciso que a empresa tenha um Database Marketing bem estruturado,
que armazene o histórico de transações dos consumidores e os dados de cadastro
regularmente, mantendo a integridade das informações para monitorar
continuamente o comportamento dos clientes.
1.2 O VALOR DO CLIENTE
De acordo com Kumar (2004), programas voltados à retenção de clientes
devem analisar a viabilidade econômico-financeira de cada um dos clientes, de
acordo com o negócio da empresa. Para empresas que administram plano de saúde,
17
especificamente, é importante conhecer o perfil do consumidor de alto risco de
desligamento e identificar quais clientes têm maior probabilidade de serem perdidos
para permitir que a empresa priorize suas ações de retenção.
Os programas de relacionamento (CRM – Customer Relationship
Management) têm por objetivo aumentar o valor do cliente. Os clientes são
diferentes em seu valor para a empresa e em suas necessidades. Ignorar ou
desconhecer essas diferenças não os tornam iguais. O objetivo da diferenciação de
clientes é encontrar os clientes de maior valor (levando-se em conta o valor total
gasto pelo assinante ao longo do relacionamento) e os clientes de maior potencial
de se tornar Churn. O ideal para empresa é encontrar determinado grupo que tenha
alto valor para empresa e alto potencial a se tornar Churn. Esse grupo deverá
receber prioridade ação de retenção.
Não é fácil encontrar uma relação estreita, ou uma fórmula fechada, que
defina o valor de um cliente em qualquer negócio. Um cliente é visto e valorizado
diferentemente por diferentes segmentos de mercado. Por tudo isso, faz-se
necessário determinar, em cada negócio, formas objetivas de conhecer o valor de
cada cliente presente e no futuro.
Quando se fala de valor do cliente, deve-se procurar pensar em “Valor
Vitalício”, ou Lifetime Value (LTV), como sendo o valor de um cliente em toda sua
história transacional com a empresa, as referências que ele fez e que se
transformaram em vendas, entre outros. O LTV do cliente é definido por Gupta e
Lehmann (2004) como o valor presente de todos os lucros e futuros gerados pelo
cliente, ao longo de sua vida de negócios com a empresa.

18
Em administradoras de plano de saúde, deve-se buscar exprimir valor do
cliente em termos de lucratividade (receita paga subtraído pelo gasto de utilização).
Deve-se, não obstante, medir quanto cada cliente despendeu em suas transações
com a empresa, e quanto o mesmo pagou, decorrente do valor do seu o plano. De
um modo geral, a manutenção dos clientes mais valiosos torna a empresa mais
rentável. Gupta e Lehman (2004) indicam que também é preciso estimar por quanto
tempo um cliente permanecerá na base. Só assim seria possível medir o LTV
individualmente.
Administradoras de planos de saúde, por exemplo, procuram formas de
estimar o valor do cliente não pautando somente no valor de receita gasto por
cliente ao longo do relacionamento. A sua disposição ao desligamento, ou a
propensão a se tornar Churn é uma das soluções possíveis de serem adotadas para
medir a eficiência de um programa de relacionamento. E é nesse aspecto de
propensão ao Churn, que esse estudo se concentrará.
Estimando a probabilidade de cancelamento do plano de saúde (ou
simplesmente Churn), consegue-se medir o risco da perda de cada cliente, sendo
assim possível identificar os perfis de clientes que cancelam o contrato. Em outras
palavras, é possível calcular um valor de Churn do cliente e classificá-los de acordo
com esse Escore. Associando esse valor de Churn aos melhores clientes, a
administradora de planos de saúde poderá fazer ou não esforço para manter esse
mesmo indivíduo (titular no domicílio) em sua carteira, bastando associar seu
Escore de Churn ao seu dispêndio. Estratégias de CRM, como essa citada, podem
ser traçadas no intuito de rentabilizar os clientes.

19
1.3 O PLANO DE SAÚDE E SUA IMPORTÂNCIA
De acordo com a ANS – Agência Nacional de Saúde Suplementar (2003), o
cenário que vem delineando o mercado de saúde privada no Brasil, apresentado na
Figura 1, evidencia uma expectativa de expansão considerável da demanda da
população idosa para os próximos dez anos.
Figura 1: Nº de Beneficiários em plano de saúde privado no Brasil por Idade

Fonte: ANS (2003)
0 a 17 anos 9.768.844
18 a 29 anos 8.388.008
30 a 39 anos 6.718.887
40 a 49 anos 5.552.466
50 a 59 anos 3.477.376
60 a 69 anos 1.999.087
70 ou mais 1.884.083
Total de Benefeciários 37.788.751
0 5.000.000 10.000.000 15.000.000 20.000.000 25.000.000 30.000.000 35.000.000
Essa expectativa elevada da demanda da população idosa no mercado
privado de saúde, segundo a ANS (2003), terá reflexos nos anos subseqüentes, pois
haverá uma maior utilização dos serviços de assistência à saúde. Os gastos com
saúde irão se elevar e com a evolução do tratamento médico, as pessoas terão maior
tempo de vida.
A população brasileira viverá mais. Estima-se que a expectativa de vida da
população brasileira atingirá a faixa de 80 anos em 2050, de acordo com o
levantamento do IBGE (2004). Os avanços da medicina e a melhoria nas condições

20
de vida serão os principais protagonistas deste aumento da perspectiva de vida. O
envelhecimento da população é uma preocupação para todas as operadoras de
planos de saúde, que contarão com um contingente maior de clientes idosos. A
pergunta que se impõe é: As empresas atenderão todas as exigências de garantia aos
serviços contratados?
O mercado está preparado para absorver esses clientes que compram
serviços com a finalidade de garantir a assistência à saúde, tecnologia, qualidade,
acesso à rede de serviços, assistência médica, hospitalar, ambulatorial, odontológica
e todos os serviços cobertos pelo contrato celebrado entre as partes operadora e
clientes?
Quando os clientes estabelecem contratos de planos de saúde, de certa
forma, elas deixam de estar sujeitas à referida restrição orçamentária, uma vez que,
supostamente, deixam de arcar com as despesas totais com a saúde privada. Em
outras palavras, ao assinar um plano de saúde, o indivíduo espera obter um gasto
médio mensal inferior ao gasto que ele teria, se não tivesse o plano e precisasse
recorrer à rede privada de saúde.
Clientes assinam planos de saúde para se prevenirem contra os riscos de
saúde. A existência de um pagador, a operadora, que muda a demanda por estes
serviços, potencialmente afeta os incentivos do provedor destes serviços. Os
incentivos à sobre-utilização de serviços de saúde estão presentes na relação
paciente-prestador de serviços e na relação contratual entre a operadora e o
prestador de serviços. Esta sobre-utilização é incorporada pela operadora no cálculo
dos gastos esperados, determinando a elevação no valor do prêmio e,

21
conseqüentemente, nos gastos totais com saúde. Este aumento, por seu turno, eleva
a probabilidade do Churn.
1.4 ESTRUTURA DA DISSERTAÇÃO
1.4.1 Sobre o Estudo
Iniciou-se esse estudo com o primeiro Capítulo de Introdução, onde se
descreveu sobre o tema proposto. A seguir, no Capítulo 2 é apresentado o objetivo e
a relevância deste trabalho, dentro da estrutura de Sistemas de Apoio à Decisão. Na
sequência, apresenta-se o Capítulo 3, contendo o referencial teórico fundamentado
nas abordagens de Marketing de Relacionamento, seus conceitos essenciais e
aspectos mais relevantes. Nos Capítulos 4 e 5, é apresentado a metodologia da
pesquisa, assim como a coleta e a manipulação das informações. No Capítulo 6 são
descritos os resultados encontrados, interpretados segundo a metodologia exposta
no Capítulo anterior. E por fim, no Capítulo 7 relata as conclusões deste trabalho de
dissertação, assim como algumas recomendações de pesquisa.
1.4.2 Sobre o Banco de Dados
O banco de dados utilizado nesse estudo pertence a uma grande operadora
de planos de saúde no Estado do Rio de Janeiro. Para a obtenção das análises finais,
precisaram-se efetuar alguns filtros até que chegasse à base final. Entre os filtros, o
22
principal deles foi o de só selecionar clientes (ativos ou inativos) que começaram a
usar o plano de saúde dessa operadora a partir de 1999. No capitulo 4, há um maior
detalhamento das motivações desse filtro para o estudo. A base final utilizada
continha 130.552 assinaturas (domicílios), sendo 63.849 (48,9%) domicílios ativos
no plano de saúde e 66.703 (51,1%) domicílios inativos no plano.
Além da variável principal, que distingue se um cliente é Ativo ou não
(Churn ou não), outras variáveis importantes foram consideradas. Para serem
consideradas no estudo, primeiramente se fez um levantamento empírico das
informações contidas no banco de dados até a data de 31/07/2007 (última data
disponível de atualização do banco).
Para melhor identificação do modelo, algumas informações precisaram ser
codificadas e recodificadas. No Anexo 1, algumas dessas variáveis estão
especificadas. Outras serão mais bem descritas ao longo dos capítulos.
Abaixo, seguem as variáveis analisadas, separadas por natureza
Demográfica, Geográfica, Cadastral e Transacional:

23
Tabela 1: Descrição das Variáveis, presente no banco de dados

Fonte: Elaboração Própria
Nos 130.552 clientes analisados, clientes que possuíam planos individuais
(com ou sem dependentes), as variáveis significativas consideradas para determinar
a propensão a Churn, no modelo de Regressão Logística, foram treze ao todo (em
ordem de importância): Tempo de Exame, Segmento de Utilização, Flag de Atraso,
Tempo de Consulta, Ano de Inclusão, Valor T3, Faixa Etária, Área de Rendimento,
Valor T2, Rede de Produto, Flag de Opcional, Sexo e Estado Civil.
A tabela de classificação mostrou que a taxa de acerto geral do modelo de
Regressão Logística é acima de 85%, e que as taxas de acerto dos grupos
individuais são altas e indicam uma consistência na previsão de qualquer um dos

24
dois grupos. O grupo que cancela plano de saúde apresentou taxa de acerto acima
de 80%, enquanto o grupo que não cancela, tem taxa de acerto acima de 90%. Esses
números (mais explicitados nos capítulos posteriores), em primeira instância,
corroboram com a utilização dos modelos de Regressão Logística para se estimar a
probabilidade de um cliente se tornar Inativo.

25
2 OBJETIVOS E RELEVÂNCIA
2.1 OBJETIVOS
Existem diversos trabalhos focados na análise de retenção, principalmente
no contexto das empresas de telecomunicações. Ao contrário, a pesquisa, efetuada
para fundamentar o presente estudo, não encontrou artigos que abordassem uma
análise detalhada sobre Churn para empresas que administram planos de saúde.
Apoiados na base de dados de uma empresa do segmento de plano de saúde,
presente no Rio de Janeiro, são dois os objetivos principais deste estudo:
- Desenvolver um modelo probabilístico de Regressão Logística que
determine a probabilidade de clientes, desse plano de saúde, se tornar Churn e
traçar consequentemente o perfil dos assinantes com maior risco de desligamento.
- Desenvolver um PSM (Propensity Score Matching) para ordenar e delinear
os assinantes de acordo com seu perfil e sua Probabilidade de Churn, e propiciar a
proposição de ações de retenção que aumentem a lucratividade da carteira de
assinantes da empresa.
26
O perfil de um grupo é definido através das informações sócio-
demográficas, de atitude, e de comportamento. Portanto, faz-se necessário definir as
variáveis que influenciam o comportamento de compra do consumidor e,
consequentemente, as que ajudam a descrever o grupo que cancela o plano de saúde
e o grupo contrário. Apesar de nem todas as variáveis julgadas relevantes estarem
disponíveis no banco de dados da empresa analisada, é necessário estudá-las, para
observar possíveis valores que possam distorcer os modelos finais. Uma limitação
deste estudo é que nem todas as variáveis levantadas no modelo teórico puderam
ser aplicadas no modelo final ajustado, devido a algumas restrições explicadas mais
adiante.
Uma pergunta que esse estudo se propõe a responder seria: é possível definir
o perfil do cliente que cancela seu contrato de plano de saúde?
A técnica estatística utilizada para indicar o risco de cancelamento dos
assinantes destes planos é a Regressão Logística, que determina a probabilidade de
uma assinatura (contrato) pertencer ao grupo dos que cancelam ou ao grupo dos que
não cancelam planos de saúde. Adiante, será usada a metodologia de Propensity
Score Matching (ou, Escore de Propensão) para agrupar os clientes com maior
probabilidade de se tornar Churn.
Ao se traçar o perfil dos clientes com risco de cancelamento, torna-se
possível atuar sobre eles através de ações de retenção, que revertam à perda desses
clientes. Além dos objetivos principais, de definir o perfil do cliente propenso ao
cancelamento do contrato do plano de saúde, e agrupá-los através do seu Escore e
seus perfis, esse estudo busca ainda atingir alguns objetivos secundários:
27
a. Fazer uma revisão de literatura para construir o entendimento dos
conceitos relacionados ao Churn de clientes;
b. Medir o risco de cancelamento de cada cliente, que nada mais é do
que a probabilidade ou (Escore de propensão) de cancelamento do contrato;
c. Identificar as variáveis que explicam o perfil do cliente que se desliga
do plano de saúde;
d. Classificar os clientes em grupos relevantes para ações de marketing:
2.2 RELEVÂNCIA
“Relacionamento duradouro” é uma das expressões mais procurada pelos
empreendedores (Kumar, 2004), ou seja, conhecer o usuário e possuir alternativas
de soluções para se chegar até ele. Esse tipo de iniciativa, cujo objetivo é
aperfeiçoar os canais de atendimento, representa apenas um dos elementos que
compõem uma política de CRM (Customer Relationship Marketing). Entretanto, os
benefícios do CRM não se limitam à conquista e à retenção de clientes. Eles
também se traduzem em redução de custos e aumento da receita média por
assinante. Com a utilização desse conceito, a companhia economiza, porque foca no
alvo certo evitando estratégias erradas e reduzindo a possibilidade de erro na
implementação de ações voltadas aos clientes.
Após a descoberta dos clientes de maior potencial a ser tornarem inativos, o
próximo passo é incentivá-los a interagir com a empresa. A interação é a única
forma de conhecer cada vez mais os clientes. O objetivo final é desenvolver uma
28
relação de aprendizado, onde cada vez mais os serviços e produtos são
personalizados para o cliente que verá conveniência em continuar fiel à empresa.
Os resultados deste estudo podem contribuir para a tomada de decisão em
ações de Marketing, com o objetivo de reter e rentabilizar os indivíduos.
Conhecendo os riscos de cancelamento da base de assinantes (Churn), a
companhia administradora de plano de saúde pode direcionar ações efetivas de
rentabilização, para o público com alta propensão de desligamento, com perfil
similar ao daqueles que se desligaram. Em vez de aplicar suas ações para grupos de
clientes, cujos riscos de saída são baixos, ou ainda que possuam alto risco, mas não
o perfil totalmente adequado à empresa (clientes que possam ter relacionamento
duradouro).
Assim, qualquer organização pode otimizar seu investimento em marketing.
Quando uma empresa aumenta sua taxa de retenção de clientes, aumenta a chance
de reduzir despesas de marketing e vendas, visando à expansão da base de clientes.
Consequentemente é possível obter lucratividade pelo incremento do tempo de
permanência dos seus clientes atuais.

29
3 REVISÃO DE LITERATURA
É possível fazer crescer as empresas de três maneiras, como sugere
Reichheld (1996): diminuindo o percentual de perda de clientes, atraindo novos
consumidores e fazendo mais negócios com seus consumidores. Quanto maior o
tempo durante o qual uma empresa retém seu cliente, maior é o lucro gerado por ele
(Reichheld, 1996). Provavelmente, as empresas não conseguem eliminar todos os
cancelamentos – e não devem tentar – embora, elas possam e devam reduzi-los.
Com vínculos mais enraizados, é possível cobrar mais pelo uso de seus produtos e
serviços.
Vavra (1993) descreve as razões mais comuns que levam o cliente a
abandonar uma empresa:
a. Insatisfação com o produto, entrega, instalação, serviços ou os preços;.
b. Reclamações ignoradas, minimizadas ou mal solucionadas;.
c. Descontentamento com mudanças de preço, políticas ou vendedores;.
d. Insatisfação com o tratamento ou falta de cortesia;.
e. Novos funcionários ou novas políticas da empresa;.
f. Aceitação de uma oferta do concorrente.

30
Uma pesquisa rápida (utilizando sites de busca) através das universidades
européias, americanas e até brasileiras, mostra que Marketing de Relacionamento é
amplamente difundido na literatura acadêmica. A questão da implementação do
CRM é amplamente divulgada através de publicações acadêmicas e
mercadológicas. E suas aplicações são descobertas em diversos segmentos de
mercado tais como implementação de CRM em Telecomunicações, setores do
Varejo, Indústria, Bancos e Instituições Financeiras entre outras.
Pode-se ter uma visão do CRM como um conjunto de estratégias
quantitativas e qualitativas empresariais inovadoras utilizadas para obter benefícios
e vantagens competitivas, gerando maiores lucros e adquirindo um maior nível de
retenção dos clientes. Essa definição é corroborada por Gupta e Lehman (2004). A
evolução do mercado levou à necessidade de uma evolução do marketing em
direção ao marketing de relacionamento e a fidelização dos clientes.
É importante, para melhor entendimento, deste estudo, conceituar alguns
pontos no Marketing de relacionamento tais como Fidelização, Retenção, e
principalmente Churn.
3.1 MARKETING DE RELACIONAMENTO E RETENÇÃO
Para grande parte das organizações, as últimas tendências no Marketing
apontam para a estratégia de busca de relações duradouras com os clientes. Vários
autores têm-se preocupado com esta questão e com freqüência recomendam que as
empresas procurem uma estratégia de mercado focada no relacionamento de longo

31
prazo. Kotler e Armstrong (1995) recomendam que seja dado um cuidado todo
especial à perda de clientes. As perdas de clientes trazem grandes prejuízos às
organizações e exigem medidas para reduzir o índice de deserção.
As empresas devem modificar suas estratégias para se adaptar ao novo
ambiente competitivo. Devem trocar a gestão de produtos pela gestão de clientes.
Além de repetirem a compra, clientes satisfeitos falam favoravelmente da empresa
(Berry e Parasuraman, 1992), são menos sensíveis a preço (Bateson e Hoffman,
2001), são propensos a permanecerem leais por mais tempo a despeito de ofertas
competitivas atraentes (Loverlock e Wright, 2001) e custam menos para serem
mantidos (Kotler, 2006).
Diante da acirrada concorrência, as empresas têm o desafio de reter seus
clientes ativos. Surge então a idéia de Marketing de Relacionamento como uma
alternativa ao Marketing de massa. O objetivo é desenvolver uma relação individual
com os clientes e desenvolver com eles um relacionamento duradouro.
Cada vez mais as empresas têm se preocupado em crescer de maneira
sustentável e as ações de médio e longo prazo têm passado a fazer parte da agenda.
As empresas que conseguem manter relacionamentos com os seus mais valiosos
clientes possuem uma vantagem competitiva. Diante deste cenário, houve profunda
mudança no conceito que aborda o marketing transacional (venda como único fim),
para o marketing relacional (relacionamentos de longo prazo). Além disso, as
profundas mudanças que ocorrem no comportamento do consumidor fazem
aumentar a exigência dos clientes e influenciam transformações na administração
de marketing.
32
Existem cinco níveis diferentes de abordagens de marketing segundo Kotler
(2006):
a. Marketing Básico: o vendedor simplesmente vende o produto;.
b. Marketing Reativo: o vendedor vende o produto e encoraja o cliente a
contatar em caso de dúvidas, comentários e queixas;
c. Marketing Responsável: o vendedor contata o cliente após a venda e
verifica o atendimento de expectativas, investiga decepções e pede sugestões de
melhoria; as informações obtidas auxiliam a empresa a melhorar seu desempenho;.
d. Marketing Pró-ativo: o vendedor entra em contato com o cliente de
forma regular para falar de melhorias na utilização dos produtos ou de novos
produtos; e.
e. Marketing de Parceria: a empresa trabalha continuamente com o
cliente buscando formas de melhorar seu desempenho.
Peppers e Rogers (2001) definem Marketing de Relacionamento como
marketing one to one, estabelecendo-o como uma estratégia voltada ao
entendimento e à antecipação das necessidades dos clientes atuais e potenciais de
uma empresa, utilizando o auxílio da Tecnologia da Informação. Segundo Peppers
e Rogers (2001), o resultado final do Marketing de Relacionamento é a construção
de um ativo exclusivo da empresa denominado Rede de Relacionamentos. Esta rede
consiste em ter boas relações com todos os envolvidos no negócio da empresa e que
fazem contato com ela, sejam clientes, fornecedores ou intermediários.
Segundo Kotler e Armstrong (1995), o Marketing de Relacionamento é
baseado na idéia de estabelecer uma relação de aprendizado com os consumidores

33
procurando aumentar sua satisfação e minimizar qualquer problema de
atendimento.
Para a construção de relacionamentos com o cliente, as empresas devem
entender as mudanças no comportamento do consumidor ao longo do tempo e
precisam aprender em cada interação, personalizando os contatos e fortalecendo o
vínculo entre o cliente e a empresa. O acesso à informação sobre o consumidor é
um aspecto fundamental no relacionamento com o cliente. Apesar disso, este
relacionamento não pode estar baseado apenas no ‘database marketing’.
“Reter clientes é uma ótima maneira de crescer. Estudos
mostram que o preço para adquirir novos clientes é cinco
vezes maior do que o custo para reter clientes antigos”.
(McKenna, 1993)
É de grande importância acompanhar os clientes atuais. Na área de seguros,
segundo a Life Insurance Marketing and Research Association nº 23 pag.3, 2006
(http:/ http://www.sitenarede.com/mentalidade/marketing/), os segurados mais
antigos têm 50% mais chances de manter suas contas ativas do que os recém-
chegados. Corretores que se mantêm em contato com seus melhores clientes fazem
novos negócios e têm menores probabilidades de fracassarem em suas tentativas de
vendas cruzadas.
Quanto mais antiga a relação com o cliente, melhor. O mundo atual oferece
inúmeras opções aos clientes. Clientes fiéis por muitos anos são mais propensos a
recomendar a organização que os serve à família e aos amigos.

34
3.2 MARKETING DE RELACIONAMENTO E FIDELIZAÇÃO
Fidelidade, de acordo com Loverlock e Wright (2001), “é a decisão
voluntária de um cliente de continuar prestigiando uma empresa específica durante
um período prolongado”. Essa fidelidade, entretanto, não pode ser garantida, uma
vez que o cliente continuará fiel à empresa apenas enquanto acreditar receber valor
melhor do que poderá obter pela troca para outro fornecedor.
A fidelização é construída sobre os alicerces do relacionamento e da
confiança mútua, que se pode utilizar ou não de programa de recompensas. Quando
se coloca para a empresa a questão do gerenciamento do relacionamento com o
cliente, não se está sugerindo mecanismos de estímulo-resposta e sim, maneiras de
compreender em profundidade as características, hábitos, desejos, necessidades e
potencialidades do cliente; com o objetivo de se desenvolver ações voltadas ao
fortalecimento dos vínculos de relacionamento, “encantá-lo” e motivá-lo a manter-
se fiel ao seu negócio.
Diante desse quadro de competitividade, não é mais admissível que a
empresa fique à margem do que acontece com os seus clientes em geral e com cada
grupo de clientes, em particular. Ignorar o cliente, desconhecer as causas de seu
comportamento e deixar de monitorar o seu relacionamento com a empresa é
candidatar-se à obsolescência. Muitas empresas gastam fortunas tentando escrever
sua missão. É preciso ficar claro que a principal missão da empresa é interferir na
decisão do cliente em tornar-se fiel.

35
Se a empresa desapontar o cliente ou se um concorrente oferecer valor
significativamente melhor, existe a possibilidade de deserção do cliente, ou seja, a
transferência da lealdade a outra empresa (Sabatino, 2003). De acordo com
Sabatino (2003), o processo de fidelização “é caracterizado pelo ato ou pela
vontade de um cliente investir tempo e dinheiro para construir um relacionamento
com uma organização”.
3.3 MARKETING DE RELACIONAMENTO E CHURN
Uma das perguntas mais freqüentes no contexto de Marketing de
Relacionamento é: como se define o Churn?
Churn, objeto principal deste estudo, trata da perda de clientes sofrida por
uma empresa para a concorrência, ou pelo simples cancelamento do contrato (no
caso, plano de saúde). Ou seja, é um conceito inverso à retenção dos clientes. Este é
o conceito que está mais em pauta entre as empresas de serviços. Um exemplo
muito conhecido é o setor de telecomunicações, onde estudos e ações voltadas para
diminuir esses índices de perda na carteira de clientes estão muito mais avançados.
Outros setores da economia também têm que administrar o Churn de clientes
através de ações de marketing direto. Os bancos e as administradoras de cartão de
crédito são dois exemplos bem conhecidos.
Até pouco tempo atrás, a cultura das empresas era “conquistar o cliente a
qualquer preço”. Atualmente, a cultura é “reter o cliente” e, claro, conquistar o bom

36
cliente. Conquistar um cliente do tipo alta-rotatividade, com propensão compulsiva
ao Churn pode não ser um bom negócio; melhor deixá-lo com a concorrência.
Segundo Pinto (1997), existem três tipos de Churn: involuntário, voluntário
e inevitável.
a. Involuntário - quando o usuário torna-se incapaz de pagar pelo serviço
e tem seu fornecimento cancelado. Os motivos pelos quais o cliente deixa de pagar
podem ser os mais diversos, como desemprego e falta de capital suficiente para se
manter, entre outros.
b. Voluntário - quando o cliente decide mudar de fornecedor, seduzido
por campanhas de marketing e/ou promoções.
c. Inevitável - quando o usuário vem a falecer ou muda-se para uma
localidade não atendida pelo fornecedor.
Já se tem fixado na mente dos empreendedores, que o custo para se manter
um cliente é muito menor que o de se conquistar um novo cliente. É crescente o uso
de ferramentas de mineração de dados, além de técnicas estatísticas multivariadas,
objetivando o melhor acerto estratégico de retenção dos clientes. Neste estudo,
especificamente, será empregada a técnica estatística de Modelagem Logística
(descrita no Capítulo 5). Estas ferramentas permitem que se analise o banco de
dados com informações do perfil histórico de cada usuário e que se determinem
quais clientes são “fiéis”, quem tem mais propensão ao Churn, quais são
dispensáveis e quem realmente está considerado no alto valor para a empresa.

37
Com base nessas informações de clientes, a empresa toma atitudes não só
reativas, em relação aos clientes, que desistiram do serviço, mas, principalmente,
ações pró-ativas, ao identificar os bons clientes e selecionar planos especiais para
garantir sua fidelização. Evitando, com isso, a evasão dos indivíduos que agregam
alto valor para a mesma. Não se pode assumir automaticamente que uma taxa de
Churn alta é ruim ou uma taxa de Churn baixa é boa. Em mercados altamente
competitivos ou em transição, quando se deseja manter uma participação elevada na
publicidade, o Churn alto pode ser o custo de tal estratégia.
O baixo percentual de Churn também deve ser considerado no contexto
estratégico. É lucrativo, mas pode significar pouca agressividade de marketing,
revelando-se (ou não) prejudicial em longo prazo, já que tende a inibir a entrada de
novos consumidores para cobrir os cancelamentos naturais ao longo do tempo.
Atualmente, a análise de Churn tem-se tornado um desafio para empresas de
vários ramos. Porém, poucas reconhecem suas reais implicações. Quando se diz que
a taxa de Churn de uma empresa varia de 25% a 30% anualmente, deseja-se
realmente dizer que essa empresa está perdendo de 25% a 30% dos clientes que se
encontram na sua base de dados. Isso significa que ela está perdendo clientes que
fazem ou já fizeram negócios com ela e que, por algum motivo, não ficaram
satisfeitos e se evadiram de sua base de dados.
Hoje, a palavra é relacionamento. Antigamente, o atendimento se resumia,
apenas, na recepção ao cliente. Esse tipo de iniciativa, cujo objetivo é aperfeiçoar
os canais de atendimento, representa apenas um dos elementos que compõem uma
política de CRM. Predizer que é provável que clientes saiam e persuadir os

38
"Churners" a permanecerem é empreendimento extremamente difícil para a maioria
das companhias. A dificuldade se deve geralmente pela falta de informação de
perfil de assinantes propícios a se desligarem do plano.
Com isso, modelos preditivos começam a serem mais difundidos. Suas
construções se baseiam em um grupo de variáveis, que, por conhecimento prévio do
negócio ou estudo específico, demonstram ser relevantes para explicação do evento
que se deseja prever. É um modelo baseado no comportamento do cliente, que
exibe a probabilidade de abandono e o valor que o cliente representa para empresa.
Com esses dados, a operadora pode fazer uma campanha de retenção com uma
perda de recursos muito pequena, além de exigir investimentos menores nessa ação.
Segundo Hosmer e Lemeshow (2000), o principal objetivo dos modelos
preditivos é atribuir, para cada variável, coeficientes (ou pesos) que estão
relacionados ao poder que cada variável possui de explicar o evento em questão.
Variáveis muito importantes para a conclusão do modelo devem receber os maiores
pesos, enquanto que as mais secundárias receberão pesos inferiores.
A análise de Churn tem que ser detalhada o suficiente para descobrir as
variáveis que fazem com que esses clientes insatisfeitos evadam-se e o porquê da
insatisfação. Outro ponto é que muitos desses clientes são clientes que têm um
grande potencial de gasto com a empresa. Portanto, são clientes valiosos que a
empresa está perdendo e que, provavelmente, nunca voltarão. “Uma análise
detalhada de Churn, permite às empresas determinarem aqueles clientes que
apresentam um comportamento que indica que eles podem se tornar “Churn” e
quais desses merecem uma atenção especial” (Cister e Ebecken, 2002).

39
As informações, descritas numa investigação aprofundada dos clientes,
contribuem para que as empresas melhorem os seus programas de fidelização dos
clientes e reduzam os seus custos em marketing, em um contexto de queda no
crescimento do mercado e a alta competitividade.

40
4 O CONTEXTO DA PESQUISA
4.1 PLANOS PRIVADOS DE ASSISTÊNCIA À SAÚDE
Os Planos Privados de Assistência à Saúde no Brasil são muito distintos em
dois instantes de tempo. Em virtude da regulamentação da Lei nº 9.656, publicada
em 3 de Junho de 1998, alterada através da Medida Provisória nº 2.177-44 em 24 de
Agosto de 2001, as operadoras de plano de saúde criaram novas categorias de
planos de saúde, mais adequados aos seus custos.
A Lei n.º 9.656, de 3 de junho de 1998, define através da ANS, como
operadoras de planos de assistência à saúde, empresas e entidades que operam, no
mercado de saúde suplementar, planos de assistência à saúde. Os planos privados
de assistência à saúde seguem as diretrizes estabelecidas na Lei nº 9.656/98.
Determinadas características, como a modalidade da contratação, a data da
assinatura do plano, a cobertura assistencial e a abrangência geográfica, fazem com
que os planos se diferenciem.

41
Através dessa medida provisória, muitos procedimentos que não eram
cobertos passaram a ser obrigatórios, tais como implantes de próteses, consultas
sem limite, transplantes de órgãos, internação durante 365 dias/ano, entre outros.
A partir da aprovação desta lei, as operadoras de plano de saúde privados
passaram a elaborar um trabalho de reestruturação de planos e convencimento com
seus assinantes. Não era vantajoso para as operadoras permanecerem com clientes
assinantes de planos nos antigos moldes. Em contrapartida, não era obrigatório, por
parte dos assinantes, tais mudanças para o novo modelo. Na verdade, a migração
dos planos para nova lei poderia ser vantajosa, entretanto, acarretaria em um
aumento no prêmio.
Entretanto, para o detentor titular do plano de saúde, não era
necessariamente vantagem à mudança para os novos planos regulamentados,
principalmente pelo acréscimo no valor da mensalidade dos novos planos. Baseado
nisso, esse estudo se propõe investigar somente os assinantes cujo plano de saúde se
inicia a partir do ano de 1999.
O filtro na base de dados original do estudo é justificado de acordo com a
pauta desse estudo, que visa caracterizar clientes e suas possíveis chances de se
tornar Churn. Visto isso, os planos vigentes e criados antes de 1999 são
caracterizados por possuírem indivíduos, ou titulares nos domicílios, mais idosos e
consequentemente menos propensos ao Churn. Pois esses mesmos planos,
adquiridos antes de 1999 trazem benefícios improváveis de serem conquistados
novamente.
42
Como dito anteriormente, a proposta deste trabalho é estudar a carteira de
assinantes de plano de saúde de uma administradora no Rio de Janeiro, filtrando
apenas para os planos individuais (com ou sem dependentes).
4.2 DATABASE MARKETING
O Database Marketing tem permitido que grandes companhias identifiquem
e analisem segmentos de consumidores na mineração de informações importantes
que possam ser usadas para o crescimento do impacto de campanhas de marketing.
Empresas que estão descobrindo o potencial do Database Marketing para
ajudá-las a construir um relacionamento mais forte com seus clientes. O processo
de criação do banco de dados combina esses conjuntos de dados em registros de
Marketing utilizáveis.
“Database Marketing é uma coleção de dados inter-
relacionados de clientes e transações que permite a oportuna
busca ou uso daquelas informações para transformá-las em
oportunidades de mercado. Em outras palavras, você pode
utilizá-lo para segmentar lista de clientes ou de prospects
(possíveis clientes), identificar e prever tendências de compra,
e personalizar as suas comunicações de Marketing para estes
clientes ou prospects, de modo a assegurar o maior índice
possível de resposta”.(Kotler, 2006)

43
O Database Marketing funciona com igual eficiência no trabalho do
Marketing direto junto a empresas e a consumidores. E o foco de suas atividades
inclui:
- descobrir quem está comprando um produto ou serviço, para que se possa
identificar e alcançar mais prospects (clientes em potencial) como eles;
- aumentar a freqüência de compra dos usuários menos ativos;
- estender um tratamento especial aos usuários mais ativos e reativar antigos
clientes;
- identificar oportunidades para novos produtos, serviços e negócios;
- acompanhar a eficiência de custos do trabalho de propaganda em longo
prazo, através da medição das compras repetidas, feitas por clientes recém-
conquistados;
- proteger a base de clientes por meio de reações oportunas às promoções e
concorrência.
Um dos pilares para o sucesso em marketing de relacionamento está na
identificação de um grande número de segmentos específicos e homogêneos de
clientes, correntes ou prospects, sobre os quais atuarem.
Para identificação desses clientes propensos ao Churn serão verificadas
informações presentes no Database. Serão consideradas as informações cadastrais,
demográficas, geográficas e transacionais, as quais possam ser utilizadas para a
estimação dos modelos aqui propostos. Cada tipo de informação possui sua
importância e relevância:
44
- Demográficas: associadas ao plano contratado, informando o perfil de
idade, sexo entre outros;
- Cadastrais: que segundo Kotler (2006) são os meios mais comuns de se
distinguir grupos de clientes pela relação explicativa em necessidades, desejos e
preferências dos consumidores;
- Geográficas: no que se refere à distinção de bairros e áreas de
planejamento geográfico;
- E finalmente, Transacionais: pois experiências com Database Marketing
permitidas pelo avanço da tecnologia mostram que esta, sem dúvida, é uma grande
fonte de informação na identificação de padrões de relacionamento implícitos.
As variáveis cadastrais, demográficas e de localização são importantes para
a gestão eficiente de uma empresa, seja pela análise do potencial de mercado ou
pela segmentação da base de clientes atuais ou potenciais. Isto contribui para o
planejamento e a projeção de respostas a campanhas ou projeções de tendências. O
comportamento de um cliente pode variar profundamente em termos de geografia e
isso pode levar uma empresa a adotar estratégias diferentes de acordo com a região
onde se encontram seus clientes e seus prospects. Como destaca Kotler (2006),
clientes com perfis demográficos distintos precisam ter campanhas de marketing
próprias para obtenção de melhores resultados.
As transações são de grande importância para a geração de valor de uma
organização. Segundo Kumar (2004), entende-se por transação qualquer interação
do cliente com uma empresa que pode ser classificada em termos de canal de
45
contato, forma de pagamento, tipo de produto adquirido e tempo de relacionamento,
que explicarão o valor financeiro que cada consumidor gera ao longo do tempo.
Os consumidores possuem comportamentos desiguais e expressam essa
diversidade através de transações diferentes, que geram custos maiores ou menores
para a empresa e impactam de maneira distinta na geração de caixa de uma
companhia. Um cliente pode gerar mais valor do que outro de acordo com a forma
que interage com a empresa. O uso de informações transacionais dos clientes para
guiar as decisões de marketing deve ser adotado por todas as empresas. Para
redirecionar seus esforços e obter maior efetividade nas ações estratégicas da
empresa com o objetivo de aumentar a rentabilidade dos clientes, alavancando os
fluxos de caixa da organização, através da redução dos custos de transação ou pelo
aumento do faturamento de cada cliente.
4.3 COLETA DAS INFORMAÇÕES
A coleta de informações foi realizada inicialmente através de pesquisa
bibliográfica em livros e revistas conceituadas, dissertações, artigos e periódicos.
Em um segundo momento, foi feito um aprofundamento nos dados fornecidos pela
empresa, operadora de plano de saúde, no que diz respeito às variáveis
demográficas, geográficas e transacionais.
As variáveis selecionadas estavam pré-definidas no banco de dados. Assim,
variáveis consideradas importantes, a priori para se obter o perfil dos clientes,
foram desconsideradas, como por exemplo: variáveis indicadoras de satisfação com

46
o serviço e com os planos, variáveis de veiculação a outro plano anteriormente a
entrada no plano, entre outras.
A Tabela 1 anteriormente, descreveu as variáveis existentes no banco de
dados. Outra restrição é a procura por trabalhos que utilizam Modelos de Regressão
Logística para prever o Churn (risco de cancelamento de clientes). Não se encontra
em nossa literatura trabalhos que abordem tais técnicas conjuntamente. A definição
de Churn não está muito bem difundida nas publicações nacionais. Além disso, não
foram encontrados trabalhos que utilizassem a metodologia de Matching para
classificar os clientes com maiores chances de cancelarem os planos. Por fim, deve-
se notar que o modelo definido e analisado tem características específicas e não é
recomendável sua total transposição para bancos de dados de empresas similares.
4.4 MANIPULAÇÃO E TRATAMENTO DOS DADOS
Foram analisados contratos vigentes entre Agosto de 2006 a Julho de 2007.
A base de dados da administradora de planos de saúde possui todas as informações
dos clientes ativos e inativos, a partir de 1999.
Lu (2001) propõe que consumidores com menos de três meses de
relacionamento sejam excluídos da análise, em função do baixo tempo de
relacionamento. Devido à atuação do Marketing de Relacionamento da empresa
concentrar-se no Estado do Rio de Janeiro, somente clientes residentes neste Estado
foram considerados.
47
Outra seleção dos dados, como registrado na Tabela 2 a seguir, trata da
exclusão de clientes, com data de inclusão anterior a 1999, tendo em vista a
diferente legislação que regulamenta os planos de saúde anteriores a esta data.
E por fim, faz-se necessário o uso do filtro, talvez o mais importante de
todos, de exclusão dos assegurados por contratos empresariais, uma vez que quem
determina a permanência ou não no plano não é o cliente, e sim o empregador.
Utilizando-se dos filtros, anteriormente propostos, e considerando-se
somente domicílios, obtive-se um total 130.552 clientes dentre ativos e inativos,
com data base final de Julho de 2007.
Depois desse tratamento, a população analisada ficou com 130.552
assinaturas (domicílios), sendo 63.849 (48,9%) domicílios ativos e 66.703 (51,1%)
domicílios inativos. A Tabela 2 ilustra as variáveis finais que serão investigadas
para obtenção do Escore de Churn nos capítulos subsequentes:

48
Tabela 2: Descrição das variáveis utilizadas na Regressão Logística

49
5 METODOLOGIA DE ANÁLISE
5.1 O MODELO DE REGRESSÃO LOGÍSTICA
Na literatura, duas técnicas são mais usadas para separar dois grupos ou
alocar um novo elemento em um desses grupos. Ambas as técnicas, Análise
Discriminante e Regressão Logística, se enquadram na classe de métodos
estatísticos multivariados de dependência, pois relacionam um conjunto de
variáveis independentes com uma variável dependente categórica (Hair et al.,
2005). As técnicas de discriminação buscam uma função ou conjunto de funções
que discrimine os grupos definidos pela variável categórica, visando a minimizar
erros de classificação.
Em outras palavras, segundo Menard (1995) essas duas técnicas tentam
associar as variáveis explicativas à variável resposta (que necessita ser dicotômica
ou categórica). Nestes modelos, define-se uma variável dependente (Y) e procura-
se verificar a influência de uma ou mais variáveis ditas independentes, causais ou
explicativas (X’s) sobre esta variável dependente.

50
A Análise Discriminante é adequada quando o conjunto de variáveis
independentes (variáveis explicativas para o modelo) possui comportamento
probabilístico de normalidade multivariada (isto é, supõe-se que cada variável
explicativa segue assintoticamente distribuição normal). Porque minimiza os erros
de classificação.
Segundo McLachlan (1992), erros de classificação são decorrentes no
processo de estimação, e na Regressão Logística precisam ser minimizados. No
estudo, erro do tipo I ocorre quando se rejeita a hipótese nula sendo ela verdadeira
(afirma-se que um indivíduo é Churn, quando ele não é) e o erro tipo II ocorre
quando aceita-se a hipótese nula, sendo ela falsa (afirma-se que um indivíduo não é
Churn quando na verdade ele já se tornou Churn).
Segundo Hair et al. (2005), o outro ponto para pouca utilização do método
da Análise Discriminante em detrimento aos modelos de Regressão Logística
(modelos Logit), é a dificuldade de interpretação do Escore fornecido pela
expressão discriminante. Na Análise Discriminante, este Escore é basicamente um
dispositivo (discriminatório) de classificação ordinal, não tendo embutido nenhum
aspecto probabilístico. Já nos modelos Logit, o Escore estimado representa a
probabilidade associada a cada indivíduo classificado.
Outro fator positivo na Regressão Logística é a possibilidade de
interpretação direta dos coeficientes como medidas de associação. A interpretação
destes coeficientes pode ser estendida para qualquer problema prático. Hair et al.
(2005) ainda afirmam que existem algumas razões pelas quais a Regressão
Logística representa uma alternativa atraente à Análise Discriminante. Em primeiro
lugar, a Regressão Logística é menos afetada pelas desigualdades

51
variância/covariância dentre os grupos, um pressuposto básico exigido na Análise
Discriminante. Em segundo lugar, a Regressão Logística pode cuidar facilmente de
variáveis categóricas independentes, enquanto que, na Análise Discriminante1, o
uso de variáveis dummy (variável categórica definida em 0 e 1) cria problemas com
as igualdades da variância/covariância.
Finalmente, a Regressão Logística é similar à Regressão linear múltipla em
termos de sua interpretação e nas medidas de diagnóstico direcionadas a casos
disponíveis para o exame de resíduos. Segundo Hosmer e Lemeshow (2000), a
técnica de Regressão Logística tornou-se um método padrão de análise de regressão
para variáveis medidas de forma dicotômica.
Mesmo quando a resposta de interesse não é originalmente do tipo binário, é
possível dicotomizar a resposta de modo que a probabilidade de sucesso possa ser
modelada através da Regressão Logística. Krzanowski (1988) e Mclachlan (1992)
defendem que o modelo logístico possui poder discriminante e é um método
utilizado de forma mais abrangente, pois não faz suposições quanto à forma
funcional das variáveis independentes, e o número de parâmetros envolvidos no
processo de estimação provavelmente será menor.
Comparando as duas técnicas, Krzanowski (1988) ressalta que a
discriminação logística deve ser preferida, quando as distribuições são claramente
não-normais.
Outra vantagem da Regressão Logística é sua abordagem probabilística, já
que essa regressão estima a chance de ocorrer certo evento a partir de uma série de
variáveis independentes ou explanatórias.
1
Para maiores informações sobre Análise Discriminante, consultar Hair et AL (2005)
52
Segundo Hosmer e Lemeshow (2000), o objetivo da Regressão Logística é
achar o melhor relacionamento entre a variável resposta (variável dependente) e um
conjunto de variáveis explicativas ou preditivas, sendo o modelo final aquele que
apresentar o melhor ajuste e for naturalmente razoável de se explicar.
Para uma variável dicotômica, o desvio padrão é determinado pela média p
da variável. Já que existe um relacionamento funcional entre o desvio padrão e a
média, a homogeneidade de variância dentre os valores da variável dependente não
pode ser satisfeita. Ao predizer o valor de uma variável numa escala de 0 a 1, faz
sentido ajustar uma curva em forma de S aos dados, na Figura 2:
Figura 2: Curva de distribuição de probabilidade Logit (dados simulados)

A função logística está limitada em 0 (zero) e 1 (um), de modo que
predições impossíveis não podem ocorrer. Há efetivamente uma família inteira de
funções em forma de S, sendo o Probit uma variante bem conhecida.

53
5.2 INFERÊNCIA NO MODELO DE REGRESSÃO LOGÍSTICA
O primeiro passo para a construção de um modelo de Regressão Logística é
verificar se os dados foram coletados em escala contínua ou discreta. Para situações
tempo-discreto, Meyer (1978) sugere o método maximum likelihood (Máxima
Verossimilhança) para estimar os parâmetros do modelo de Regressão Logística.
Para Meyer (1978), esse método de estimação dos parâmtros da regressão conduz
estimativas razoáveis para dados dicotômicos.
Se todas as variáveis explicativas forem categóricas, a estimação do modelo
Logit pode ser feita por método log-linear. Para Hair et al. (2005), a análise Logit é
um método que determina quais variáveis independentes devem ser incluídas no
modelo para se prever adequadamente a variável dependente categórica.Como fator
limitador para uso da função Logit, as variáveis dependentes e independentes
devem ser categóricas, obrigatoriamente.
A Regressão Logística reescreve o modelo clássico de regressão linear de
modo a confirmar o valor da variável resposta para a faixa de 0 (zero) a 1 (um), ao
mesmo tempo em que as variáveis independentes possam variar continuamente.
Isto é obtido pela equação abaixo:

Onde X1, X2,..., Xk representam as K
variáveis explicativas e os β’s, seus
respectivos parâmetros, estimados através do
método da Máxima-Verossimilhança.
(β0 representa o parâmetro do intercepto). E
representa a probabilidade estimada para

cada indivíduo i.
54
Assim, a Regressão Logística é aplicada a uma variável dependente
dicotômica, onde a variável dependente não representa os valores de dados brutos,
mas representa a probabilidade do evento estudado ocorrer.
Nos modelos Logit, a principal suposição é a de que o LN(Odds), ou seja,
logaritmo da razão entre as probabilidades de ocorrência e não ocorrência do evento
é linear. Sendo assim, a equação da função Logit que descreve uma relação linear
na Regressão Logística é:
onde os termos da direita são os termos padrão para as variáveis
independentes e o intercepto numa equação de Regressão linear. E do
lado esquerdo está o ln(Odds) é chamada de Logit.
Na Regressão Logística há um relacionamento linear com as variáveis
independentes, mas é linear nas probabilidades de LOG e não nas probabilidades
originais. Como o objeto de estudo é a probabilidade de ocorrência de um evento (o
indivíduo se tornar Churn), a equação Logit pode ser transformada numa equação
na probabilidade (Paula, 2004).
Diferente da Regressão linear clássica, os erros desse modelo não seguem
uma distribuição normal, mas sim a de Bernoulli. Na Regressão Logística usa-se o
método da máxima verossimilhança para se estimar os valores dos parâmetros β0,
..., βk, que maximizem a probabilidade de se obter o conjunto observado de dados
(Hosmer e Lemeshow, 1989).

55
Os parâmetros da Regressão Logística podem ser estimados de forma bem
semelhante à Regressão linear múltipla pelo fato de que um modelo de base é
primeiro estimado visando a fornecer um padrão para comparação. Na Regressão
linear múltipla, a média é utilizada para estabelecer o modelo base e calcular a
soma total dos quadrados dos afastamentos. Na Regressão Logística, o mesmo
processo é utilizado, com a média usada no modelo estimado não para estabelecer a
soma dos quadrados, mas para estabelecer o valor de probabilidade log.
5.2.1 O Problema da determinação do valor de corte
Fazendo uma síntese, pode-se dizer que um Modelo de Regressão Logística
prevê a probabilidade direta de um evento ocorrer. No caso dessa dissertação, o
evento em questão é a probabilidade do indivíduo se tornar Inativo (Churn).
A grande questão na classificação dos modelos Logit é: Como obter um
valor de corte confiável a ponto de evitar perdas para a empresa? Tanto pela não
classificação de risco para clientes que podem cancelar o plano de saúde e,
consequentemente, não serão impactados pelas ações de marketing, quanto pela
atribuição de risco para clientes sem propensão ao cancelamento e que consomem
parcelas importantes dos investimentos de marketing utilizados na retenção de
clientes.
Com isso, o ponto de corte para este estudo deve ser o valor que minimize
os erros de classificação dos assinantes. Existem dois tipos de erros: erro tipo I
(quando se rejeita a hipótese nula sendo ela verdadeira) e o erro tipo II (aceitar a
hipótese nula, sendo ela falsa) Usualmente se estabelece o ponto de corte em “p =

56
^
0.5”, ou seja, indivíduos são classificados Churn se p > 0.5. Em outras palavras,
para se encontrar um bom ajuste do modelo, uma das aferições é através da tabela
de contingência, onde se estabelece um ponto de corte e se avalia o percentual de
erro (tanto do tipo I quanto do tipo II). Gujarati (2006) confirma que é mais
importante minimizar o erro do tipo I.
A inovação deste estudo também acontece ao não se estabelecer o ponto de
corte fixo. Na dissertação tentou-se utilizar a metodologia de Macthing (descrita no
Capítulo 5.6) para se estabelecer um ponto de corte. Entretanto, devido às
limitações do algoritmo utilizado (mais adiante, no Capítulo 6.5), não foi possível
expandir esse ponte de corte para todo o universo de indivíduos analisados.
5.3 PROCEDIMENTO DE AJUSTE DO MODELO
Na equação de regressão logística, para se verificar o efeito ou poder de
discriminação de cada uma das variáveis independentes com relação à variável
dependente, são calculados os coeficientes de regressão. O cálculo dos coeficientes
do modelo é feito através da maximização da função de verossimilhança que
calcula a probabilidade de que um evento ocorra (Menard, 1995). Este
procedimento é equivalente a minimizar a função logaritmo de verossimilhança
(-2LL)1.
1
Nos modelos lineares vistos na literatura (Gujarati, 2005), têm-se que os coeficientes de regressão
são calculados através da minimização da função de erro quadrático, conhecido como Mínimos
Quadrados Ordinários. Já na Regressão Logística, o cálculo é feito através da minimização da
função de verossimilhança (-2 vezes o logaritmo do valor da verossimilhança e é chamada de -2LL,
ou -2logverossimilhança)
57
É importante se ter em mente que o que se quer é verificar o poder de ajuste
da equação, ou seja, verificar o quanto as variáveis independentes explicam a
variável dependente, ou seja, quer se medir o seu poder de influência sobre a
variável dependente. Um modelo com bom ajuste terá um valor baixo para -2LL,
sendo que o valor mínimo é 0 (zero). Um modelo com ajuste perfeito terá como
resposta um valor de verossimilhança igual a 1 (um) e, portanto, -2LL será igual a 0
(zero). O valor da verossimilhança também pode ser comparado entre equações,
onde a diferença representa a mudança no ajuste preditivo de uma equação para
outra.
Os coeficientes estimados (β0, β1, β2, ..., βk) são, na verdade, medidas das
variações na proporção das probabilidades, chamada de ODDS (razão de
probabilidade ou razão de desigualdade). É importante dizer que um coeficiente
positivo indica aumento da probabilidade, ao passo que um valor negativo
representa diminuição da probabilidade prevista.
5.3.1 Inclusão e Exclusão de variáveis nos Modelos de Regressão
Um das técnicas utilizadas para inclusão ou exclusão de variáveis nos
modelos Logit é stepwise, que minimiza o número de variáveis para que o modelo
resultante seja mais facilmente generalizado e estável numericamente, dado que,
quanto mais variáveis são incluídas no modelo, mais ele se torna dependente dos
dados. Hosmer e Lemeshow (2000) descrevem que os procedimentos stepwise
incluem os métodos enter, backward e forward.

58
O método enter incorpora ao modelo todas as variáveis e deve ser utilizado
principalmente quando se tem certeza de que todas as variáveis são necessárias para
se estimar os parâmetros do modelo. O método backward caracteriza-se por
incorporar todas as variáveis e, após percorrer várias etapas, uma variável por vez
pode ser eliminada.
Se em uma determinada etapa (do procedimento de stepwise) não houver
eliminação de alguma variável, o processo é interrompido e as variáveis restantes
definem o modelo final. Numa dada etapa, tem-se um determinado modelo que se
denomina modelo completo da etapa e são investigadas as contribuições individuais
das variáveis a esse modelo. A variável de pior desempenho é eliminada
comparando-se o modelo completo com o modelo reduzido, pela retirada de tal
variável (Charnet et al, 1999).
O método forward se inicia com a variável independente de maior
coeficiente de correlação amostral observado com a variável resposta. A cada etapa,
uma variável pode vir a ser incorporada. Se em uma etapa não houver uma
inclusão, o processo é interrompido e as variáveis selecionadas até esta etapa
definem o modelo final (Charnet et al., 1999).
Em uma determinada etapa do stepwise chega-se a um modelo definido
como modelo reduzido. O modelo reduzido de cada etapa é comparado ao modelo
em que uma nova variável é acrescentada. O uso desta técnica na Regressão
Logística baseia-se em critérios tais como a estatística G e a estatística de Wald
(descrita no Capítulo a seguir). Existindo um modelo de melhor desempenho
(escolhido através da estatística de Wald ou G), a correspondente variável é
incorporada ao elenco de variáveis já escolhidas.

59
Enquanto em uma etapa do procedimento backward comparam-se vários
modelos reduzidos com um único modelo completo devido ao objetivo de eliminar
uma variável, em uma etapa do procedimento forward as comparações são feitas
entre vários modelos completos e um único modelo reduzido, graças ao objetivo de
incorporar uma variável (Charnet et al., 1999)
5.3.2 Testes de confirmação nos Modelos de Regressão
Depois de calcular os coeficientes, o passo seguinte consiste em determinar
se as variáveis independentes são associadas significativamente à variável de
resultado. Segundo Paula (2004) existem duas estatísticas mais importantes, que
foram utilizadas, neste estudo, para testar hipóteses relativas ao vetor de parâmetros
de β, que são deduzidos de distribuições assintóticas.
A primeira denominada estatística de Wald é baseada na distribuição
assintótica de (estimador de β ) e é geralmente mais usada no caso de hipóteses
relativas a um único coeficiente β k. É uma generalização da estatística t de Student.
Como
E sob o teste de hipótese

60
A Estatística de Wald é:
, onde é o desvio padrão de
A segunda estatística é a Razão de verossimilhança (também conhecida
como Deviance ou D ou - 2LL) e é geralmente preferida no caso de hipóteses
relativas a vários parâmetros β ’s. Utiliza-se o teste da razão de verossimilhança
para verificar a adequação do modelo como um todo devido a sua distribuição
conhecida. Na equação é aplicado “menos duas vezes seu LOG”, pois sua
distribuição corresponde ao Qui-Quadrado. Isto é, a comparação entre valores
preditos e observados é baseada na estatística D (Deviance):
A estatística D, conhecida como Deviance, avalia o valor ajustado na
Regressão Logística, desempenhando o mesmo papel que a soma dos quadrados
dos resíduos (SSE – Sum Square Error) na Regressão Linear.
Na verdade, para estimar a significância de uma variável independente,
comparam-se o valor de D com e sem a variável independente na equação. Essa
alteração em D (devido à inclusão da variável independente) dá origem à estatística
de teste G, que é uma variação da estatística de teste D (Deviance).
G = D (para o modelo sem a variável) – D (para o modelo com variável)

61
A estatística G desempenha o mesmo papel na Regressão Logística, como
faz o numerador do teste F na Regressão linear, porque a verossimilhança do
modelo saturado é comum para ambos os valores de D, sendo eliminado no cálculo
de G. Assim, sob:
Utiliza-se a estatística de teste:
onde k é o número de β’s (variáveis) no modelo e λ é a função de verossimilhança.

Rejeita-se H0 se o p-valor associado a essa estatística de teste G for < 0,05.
Para Hosmer e Lemeshow (2000), uma aproximação para testar a
significância do coeficiente de uma variável em qualquer modelo relaciona-se com
a seguinte questão: o modelo que inclui a variável em questão diz mais sobre a
variável resultante ou resposta, do que o modelo que não inclui a variável?
Ainda segundo Hosmer e Lemeshow (2000), os cálculos do logaritmo de
verossimilhança e o teste da razão de verossimilhanças são aspectos característicos
de qualquer pacote de regressão logística. Isto torna possível verificar a
significância da adição de novos termos no modelo como um assunto de rotina. No
caso de uma única variável independente, recomenda-se ajustar primeiro um
modelo contendo apenas o termo constante. Em seguida ajustar um modelo
contendo a variável independente, bem como a constante. Estes dados originam um
novo LOG de verossimilhança. O teste da razão de verossimilhanças é obtido

62
multiplicando-se a diferença destes dois valores por -2. Este resultado, bem como o
p-valor associado à distribuição Qui-quadrado, podem ser obtidos na maioria dos
pacotes estatísticos.
Em resumo, o método para testar a significância do coeficiente de uma
variável na regressão logística segue uma aproximação parecida com aquela usada
na regressão linear, mas usa a função de verossimilhança para a variável resposta
dicotômica.
5.3.3 Medidas de ajustes nos Modelos de Regressão
Além das estatísticas de testes descritas, existe uma a medida Hosmer e
Lemeshow de ajuste geral. Essa medida indica se houve ou não diferença
estatisticamente significativa entre as classificações observadas e previstas. Estas
duas medidas, em combinação, fornecem suporte para que se aceite o modelo de
Regressão Logística.
Esta medida Hosmer e Lemeshow (ou teste HL) tem a finalidade de avaliar
a validade preditiva do modelo de Regressão Logística. É baseado não no valor de
verossimilhança, mas na visão real da variável dependente (Hosmer e Lemeshow,
2000).
Considerando-se Y como o valor real da variável e como o valor
previsto, o teste é feito com intuito de medir a proximidade de ambos. A hipótese
nula (hipótese de teste) é que não existe diferença significativa entre o valor real e o
valor previsto, ou seja, equivale a dizer que o modelo tem bom poder de ajuste.
Quanto menor é o valor da diferença entre Y e , mais os valores previstos se

63
aproximam dos reais e, portanto, melhor desempenho preditivo tem o modelo.
Desta forma, um fator positivo a favor do modelo é quando se aceita a seguinte
hipótese nula: H0: Y =
Estes testes, descritos acima, asseguram a evidência de significância
estatística das variáveis, devendo se considerar outros fatores relevantes, como a
importância da variável em relação ao evento modelado e a influência conjunta de
outras importantes variáveis (Hair et al., 2005).
Existem ainda, nos modelos lineares generalizados, ainda duas medidas
comparáveis ao R2 no modelo de regressão múltipla. A medida R2 Cox e Snell
opera da mesma forma, com valores mais altos indicando maior ajuste do modelo.
Entretanto, esta medida está limitada pelo fato de que não consegue alcançar o
valor máximo de um, de modo que Nagelkerke (Hair et al., 2005) propôs uma
modificação que tem a amplitude de 0 (zero) a 1 (um).
A medida proposta por Nagelkerke denomina-se “Pseudo R2" ou R2 Logit e
é calculada com base na melhoria do valor -2LL:
Ao se incluir ou excluir variáveis (através dos métodos stepwise descritos
anteriormente) utilizam-se a estatística de Wald, a mudança na probabilidade, ou a
estatística condicional como método de escolha para a eliminação ou inclusão de
variáveis. Para a obtenção do modelo final de Regressão Logística, após estimar os
coeficientes da equação de regressão, é necessário verificar se cada variável é

64
significativamente relacionada com a variável resposta do modelo. Isto é realizado
geralmente através da formulação de testes de hipóteses estatísticas, que avaliam o
modelo com a variável e sem a variável (Hosmer e Lemeshow, 2000).
5.3.4 Razão de Probabilidades (ODDS)
Além de predizer e estimar a probabilidade de um indivíduo (titular do
plano de saúde) continuar ou não com o plano de saúde, os Modelos de Regressão
Logística também permitem conhecer as relações entre as variáveis explicativas e a
variável dependente. Ou seja, permitem identificar quais são as variáveis
explicativas mais relevantes no processo de escolha.
A vantagem de se trabalhar com o Modelo Logit se deve ao fato de ele
apresentar uma forma fechada. Sua especificação permite relacionar facilmente as
ODDS (Razões de Probabilidades) de um evento com as variáveis explicativas.
Estas razões comparativas são comuns, por exemplo, no contexto de uma
partida de futebol. Se as ODDS são de três para um em favor da seleção brasileira,
isso significa uma expectativa de uma vitória ocorrer com três vezes mais
frequência do que uma derrota. Mas se as ODDS são de dois para um contra a
seleção, isto significa uma expectativa de uma derrota ocorrer com duas vezes mais
frequência do que uma vitória.
É fácil converter ODDS em probabilidades e vice-versa. Com ODDS de três
para um a favor, há uma expectativa de três vitórias e uma derrota em quatro
tentativas, ou seja, uma probabilidade de vitória igual a 75%. Por outro lado, para
uma probabilidade de vitória igual a 20% espera-se uma vitória e quatro derrotas a
65
cada cinco tentativas, em outras palavras, uma chance de “4 para 1” de acontecer
uma derrota.
Onde X1, X2,..., Xk representam as K variáveis explicativas e os β ’s, seus

respectivos parâmetros, estimados através do método da Máxima-
Verossimilhança. (β0 representa o parâmetro do intercepto). E = 1

representa a probabilidade estimada para cada indivíduo i se tornar Churn.
5.4 O MÉTODO DE MACHING
Matching (ou pareamento) é um método amplamente utilizado na literatura
de avaliação de tratamentos. O método consiste basicamente em tomar como base
as características das unidades tratadas e tentar encontrar unidades em um grupo de
controle não experimental que possuam as mesmas características, previamente
definidas no grupo de tratamento. Em seguida, o grupo de comparação é
emparelhado ao grupo de tratamento através do Propensity Escore (Escore de
propensão ou probabilidade predita de participação).
Segundo Hirano, Imbens e Ridder (2003) o efeito médio para uma
subpopulação com um dado valor para as variáveis observáveis pode ser estimado
simplesmente tirando a diferença entre as médias dos grupos de tratamento e
controle nestas subpopulações. Para que se possa obter uma estimativa não viesada
do efeito do tratamento, tem de identificar um grupo de controle que seja o mais

66
próximo possível do grupo de tratamento em termos das características gerais que
são capturadas por uma variável designada de X.
Rosenbaum e Rubin (1983) sustentam que ajustando as diferenças entre as
unidades de tratamento e controle, apenas através do Escore de propensão, todo o
viés associado às diferenças nas variáveis prévias observáveis é removido.
A utilização do Escore de propensão baseia-se em duas hipóteses-chave. A
primeira é que a seleção nos observáveis requer que a participação no programa
seja independente dos resultados, condicional nas covariáveis.
A segunda hipótese refere-se à existência de um suporte comum. Esta
condição requer que existam unidades de ambos os grupos, tratamento e controle,
para cada característica X para o qual se deseja comparar.
É necessário que 0 < P(X) < 1. Isto assegura que para cada indivíduo tratado
exista outro indivíduo não tratado pareado, com valores similares de X. Dessa
forma, os indivíduos devem possuir uma probabilidade de serem participantes ou
não participantes que se situe entre 0 e 1, não podendo ser esta igual aos extremos.
Em outras palavras, a variável X precisa seguir uma distribuição de probabilidade.
5.4.1 Propensity Score Matching (Escore de Propensão)
O Escore de Propensão é definido por Rosenbaum e Rubin (1983) como a
probabilidade condicional de receber um tratamento, dadas algumas características a
priori:
.onde D = {0, 1} é o indicador da
exposição ao tratamento e X é o vetor multidimensional de características a priori.

67
O principal objetivo do PSM (Propensity Score Matching) é descobrir o
efeito médio do tratamento (ATT), ou seja, responder à pergunta: o que aconteceria
com o grupo de controle se recebesse o tratamento e o que aconteceria com o grupo
de tratamento se ele não o recebesse?
Nesse estudo, o PSM será utilizado para descobrir e emparelhar indivíduos
com características parecidas, com resultados contrários, ou seja, indivíduos que se
tornaram Churn (perdidos) versus indivíduos que não se tornaram. Fazendo esse
emparelhamento é possível definir dois grupos similares para comparação de perfil.
Se a distribuição do tratamento fosse aleatória dentro de uma amostra (isto
é, se o experimento fosse natural), essa pergunta teria uma resposta simples, a
saber: bastaria testar a diferença de médias da variável supostamente impactada
pelo tratamento para os grupos de tratamento e de controle.
5.4.2 ATT (Treatment on the Treated)
ATT é a medida que melhor responde à pergunta: Como o programa
mudaria o resultado dos participantes caso eles não tivessem se “desligado” da base
de plano de saúde? Formalmente pode ser representada como:
ATT(x, P(X) =1) = E(∆ |X = x, P(X) = 1) = E(Y1 - Y0 | X = x, P(X) = 1).
O valor de ATT é a diferença do resultado esperado de um indivíduo
selecionado aleatoriamente, da subpopulação de indivíduos que se tornaram Churn
e o resultado que este indivíduo teria caso não tivesse se tornado Churn.
68
No modelo probabilístico, a probabilidade de um indivíduo se tornar Churn
é regredida sobre seus supostos determinantes a fim de corrigir o viés de seleção na
distribuição do tratamento. Nesse sentido, essa probabilidade é o escalar que se
procura.
Depois, há o pareamento das probabilidades estimadas. Esse casamento é
^
realizado da seguinte forma: seja p (Xi) a probabilidade de se tornar Churn do
indivíduo i, que se tenha tornado efetivamente Churn. Se dentro de um raio
^ ^
(pequeno) partindo p (Xi) existir pelo menos um p (Xj), em que j é um indivíduo
que não se tornou Churn, os indivíduos i e j formarão um par tratamento-controle
(Churn-não Churn). Assim, pode-se acompanhar esses grupos no tempo e efetuar o
teste de médias a fim de calcular o efeito médio do “ suposto tratamento” (neste
estudo, o “tratamento” é o indivíduo se tornar Churn) .
A metodologia de Matching consiste na escolha de um grupo de controle
ideal a partir de uma amostra maior que a amostra do grupo de tratamento. O grupo
de controle é “casado” com o grupo de tratamento a partir de um conjunto de
características observadas ou utilizando um Escore de propensão (probabilidade de
Churn dadas certas características). Quanto mais próximos esses Escores, melhor o
”Matching”. Conforme citou Ravallion (2003), um bom grupo de controle vem do
mesmo ambiente econômico, social e cultural que o grupo de tratamento. Nesse
caso, a escolha do grupo de controle (indivíduos que não se tornaram Churn) se
dará de forma aleatória.
Existem várias metodologias de aplicação do ”Matching”, as mais utilizadas
na literatura e apresentadas por Becker e Ichino (2002) são:

69
- Vizinho mais próximo;
- Radius Matching;
- Kernel Matching e;
- Estratificação.
O método de Estratificação consiste na divisão das observações em
intervalos de acordo com o Escore de propensão. Dentro de cada intervalo, a média
do Escore de propensão das observações de controle e de tratamento deve ser igual.
Para facilitar o processo, na prática, podem ser utilizados os mesmos blocos
identificados pelo algoritmo da estimação do Escore de propensão. Em cada
intervalo computa-se a diferença entre as médias da variável de resultado das
observações de controle e das observações de tratamento. O ATT final será a média
do ATT de cada bloco ponderada pela distribuição das observações entre os blocos.
Uma das desvantagens dessa metodologia é que não são levadas em
consideração observações que pertençam a um bloco onde apenas existam
observações de controle ou apenas observações de tratamento. Uma maneira de
resolver este problema seria utilizando a metodologia de “matching-Vizinho Mais
Próximo”, pois esta procura, para cada observação tratada, a observação de controle
com o Escore de propensão a Churn mais próximo. Esta busca pode ser feita com
ou sem reposição, visto que uma observação de controle pode ser o melhor
“matching” para mais de uma observação tratada. Uma vez encontrados todos os
“matchings”, a diferença dos resultados de cada grupo é computada e o ATT final
será a média dessas diferenças.

70
O único problema dessa metodologia é que, algumas vezes, a qualidade do
“matching” pode não ser muito boa tendo em vista que o controle mais próximo de
uma observação tratada pode estar bem distante em termos de Escore de propensão
a Churn. As metodologias “Radius matching” e “Kernel matching” têm uma
solução para este problema.
No método de Radius matching, cada unidade tratada é “casada” com um
controle pertencente a uma vizinhança predefinida com base no Escore de
propensão do tratado. Se definirmos uma vizinhança restrita, existe uma grande
chance de não encontrarmos controle dentro desta vizinhança para todas as
observações tratadas.
Por outro lado, quanto menor a vizinhança, melhor será a qualidade do
Matching, e mais próximos estarão os grupos de tratamento e de controle. O
método de kernel leva em consideração todas as observações de tratamento e de
controle, e essas são casadas (pareadas) de maneira ponderada.
Todos os controles são aproveitados e o peso utilizado para cada um é
inversamente proporcional à distância do seu Escore de propensão e o Escore da
observação tratada. Vale ressaltar que, em todos os métodos, a qualidade do
Matching pode ser melhorada quando impomos uma região de suporte comum. A
escolha do método a ser utilizado vai depender do tipo de dados que se tem
disponível. É clara, a existência de um trade-off (substituição) entre a qualidade do
Matching e a quantidade de observações casadas.
De forma a se tornar mais claro o entendimento do método do PSM e sua
aplicação para os modelos de Churn, será a seguir desenvolvido um exemplo:

71
^
Seja p (Xj) a probabilidade de um indivíduo j se tornar Churn. Diz-se que j
^
é um potencial a Churn se, dentro de um raio (pequeno) partindo de p (Xj), existir
^
pelo menos um p (Xi), sendo i um indivíduo com Potencial a não-Churn. A idéia é
que, se o modelo for bem especificado, os indivíduos potenciais a Churn e os
indivíduos potenciais a não-Churn gêmeos terão características semelhantes.
Mais formalmente, sabe-se que é uma
função de distribuição acumulada, Xj é um vetor-linha dos determinantes da
probabilidade de um indivíduo ter potencial a Churn j e β é o vetor-coluna dos
coeficientes estimados do modelo.
Se o PSM faz:
Dessa forma:
A interpretação da expressão mencionada é:
Ou os indivíduos potenciais a Churn possuem características muito
semelhantes aos indivíduos com potencial a não-Churn, ou, ainda que apresentem
algumas variáveis Xjk e Xik distintas, essas diferenças, ponderadas pelos βk, de
algum modo, se compensam. Com efeito, como serão demonstrados, os resultados
favorecem a primeira interpretação.

72
A aplicação do PSM para encontrar indivíduos com potenciais a Churn
apresenta vantagem metodológica sobre as demais alternativas, como, por exemplo,
a de definir como potenciais a Churn indivíduos que não se tornaram Churn, mas
^
apresentam p (X) >0,5.
A primeira vantagem é que esse corte é necessariamente arbitrário. (A
escolha de p(X) = 0,5 é arbitrária).
A segunda vantagem é que o PSM possibilita a identificação dos indivíduos
com Potencial a Churn “ocultos”, o que o corte de probabilidade pode perder. Isso
pode ser ilustrado da seguinte forma: suponha-se que o único determinante da
probabilidade de se tornar Churn fosse a Idade do indivíduo, na forma linear, e essa
relação fosse positiva. Ao estabelecer, então, um corte de probabilidade, estar-se-ia
implicitamente estabelecendo um corte de tamanho do tipo indivíduos com Idade
abaixo de Y não têm potencial a Churn, o que poderia contradizer à observação de
que vários indivíduos com Idade acima de Y, apresentam excelentes níveis de
potencial a Churn.
Cabe salientar, entretanto, que a qualidade dessa classificação depende do
modelo probabilístico.
73
6 ANÁLISE DOS RESULTADOS
6.1 RESULTADOS DO MODELO DE REGRESSÃO
Utilizando-se do software estatístico SPSS 13.0 ©, o modelo de Regressão
Logística binária foi aplicado. Para ajustar o modelo final que minimiza o número
de variáveis e maximiza a precisão do modelo, foi adotado o método de iteração
stepwise forward, que através da estatística de Wald encontrou o modelo
parcimonioso com 13 variáveis. Em um segundo momento, utilizando as 13
variáveis finais, o modelo de Churn foi novamente validado.
O ponto de corte utilizado para classificação foi o de probabilidade igual
0.5, pois define probabilidade Churn igual para os dois grupos (ativos e inativos).
Como nossa amostra possui uma porcentagem de clientes inativos muito próxima a
50%, foi possível adotar tal corte.
O resultado do modelo inicial apresenta a tabela de classificação
considerando o modelo com apenas uma constante, ou seja, se arbitrariamente todas
as assinaturas fossem consideradas canceladas, a taxa de acerto seria de 51,1%. O

74
modelo de Regressão Logística que irá estimar o risco de cancelamento de clientes
precisa ser mais assertivo na classificação dos clientes.
Tabela 3: Modelo apenas com a constante

A primeira variável incluída no modelo é a que tiver a estatística de
pontuação mais alta, estatística Wald. No caso, a variável tempo desde último
exame é selecionada a compor o modelo. Em segundo lugar, a variável Segmento
de uso do plano (ver definição em Anexo 1) foi incorporada ao modelo. E em
seguida, a variável dicotômica que indica Atraso no pagamento. Essas três variáveis
contribuem com 70,5% do poder explicativo do modelo. Na Tabela 4 abaixo,
verifica-se que o modelo proposto apresenta-se.com o coeficiente significativo.
Tabela 4: Teste Omnnibus de coeficientes do Modelo

75
O modelo de Regressão Logística final, para estimar o Churn individual,
ficou ajustado da seguinte forma:
Onde X1, X2,..., X12 representam as variáveis

explicativas e os β ’s, seus respectivos
parâmetros, estimados através do método da
Máxima-Verossimilhança. (β0 representa o
parâmetro do intercepto). E representa a

probabilidade estimada de cada indivíduo i se
tornar Churn.
X1 – Tempo de Exame (tempo desde o último, em dias)
X2 – Segmento de Utilização1
X3 – Flag de Atraso1
X4 – Tempo de Consulta (tempo desde a última, em dias)
X5 – Ano de Inclusão
X6 – Valor em T3 (valor pago no antepenúltimo mês)
X7 – Faixa Etária
X8 – Área de Rendimento1
X9 – Valor em T2 (valor pago no penúltimo mês)
X10 – Rede de Produto1
X11 - Opcional1
X12 – Sexo
X13 – Estado Civil
A Tabela 5 contém as variáveis presentes no modelo ajustado e seus
respectivos parâmetros. A seguir, a partir do Capítulo 6.1.1 e 6.2, se discorrerão os
ajustes do modelo e suas interpretações.

76
Tabela 5: Estimação do Modelo de Churn

77
6.1.1 Interpretação dos Parâmetros no Modelo
No modelo final encontram-se variáveis contínuas (Valor T2, Valor T3,
Tempo de Consulta e Tampo de Exame), variáveis categóricas (Ano de Inclusão,
Faixa Etária, Rede de Produto, Área de Rendimento, Estado Civil e Segmento de
Utilização) e variáveis binárias (Sexo, Flag de Atraso e Flag Opcional). A
interpretação dos parâmetros β ’s acontece na seguinte forma:
- Variáveis Contínuas: Sendo β positivo, a medida que é acrescido um valor
na variável contínua, aumenta-se a probabilidade de Churn. Sendo β negativo,
diminui-se a probabilidade de Churn. A real relação pode ser vista através da Razão
de Chance, ou EXP (β ). Exemplificando, a razão de chance da variável Tempo de
Exame é de 1,189. Isto significa dizer que aumentando-se o Tempo de Exame em 1
(um) dia, a chance de se tornar Inativo aumenta na razão de 1,189.
- Variáveis Categóricas: É escolhida uma categoria da variável como
referência, e partir dessa referência, se comparam as outras categorias da variável.
Em outras palavras, por exemplo, em Área de Rendimento, a categoria de
referência escolhida foi “A”. Significa então que morar numa área de Rendimento
“B” ou “C” aumenta a chance de se tornar Churn em relação a quem reside numa
área de Rendimento “A”.
- Variáveis Binárias: A presença da variável incide positiva ou
negativamente na probabilidade de Churn (de acordo com o β ). Exemplo, ter o
Flag Opcional diminui a chance do indivíduo se tornar inativo (β negativo e EXP(β )
menor que 1).

78
6.2 AJUSTE FINAL DO MODELO
Além das interpretações dos parâmetros, se faz necessário analisar algumas
estatísticas de validação, nos modelos de Regressão Logística.
A começar pela Deviance. A estatística de probabilidade -2log likelihood
(Deviance) diminuiu à medida que foi incluída uma variável no modelo, indicando
melhora. Em contrapartida, as medidas pseudo R2 aumentaram à medida que
previsores foram adicionados. O pseudo R2 de Nagelkerke no último passo ficou em
0.695 (Tabela 6), considerado pela literatura como um excelente poder de
explicação do modelo.
Tabela 6: Máxima verossimilhança e R2

A medida Hosmer e Lemeshow de ajuste geral tem um teste estatístico que
indica que não houve diferença estatisticamente significativa entre as classificações
observadas e previstas para todos os modelos com duas ou mais variáveis. O valor
Hosmer e Lemeshow mede a correspondência dos valores efetivos e previstos da
variável dependente. Neste caso, o melhor ajuste do modelo é indicado por uma
diferença menor na classificação observada e prevista. Um bom ajuste de modelo é
indicado por um valor Qui-quadrado (Chi-square) não significante (Hair et al.,
2005).
79
O SPSS 13.0 © utiliza algoritmos iterativos que buscam um subconjunto de
variáveis para maximizar a probabilidade. Não é o mesmo que maximizar a
precisão da estimativa. Então, pode haver problemas na utilização de métodos de
Regressão quando o objetivo da análise é a precisão da estimativa.
Tabela 7: Teste de Hosmer e Lemeshow

A medida Hosmer e Lemeshow, apresentada no modelo (Tabela 7), é
significativa a qualquer nível de significância (Sig). Essa medida indica a ausência
de diferença significativa na distribuição de valores dependentes efetivos e
previstos. Essas medidas combinadas sugerem a aceitação do modelo do último
passo como um modelo significante de Regressão Logística.
6.3 PRECISÃO DA ESTIMATIVA DO MODELO
A tabela de classificação final, também utilizada quando se descreve um
modelo na Técnica de Análise Discriminante (Hair et al., 2005), mostra taxas de
acerto extremamente altas, de casos corretamente classificados para o modelo final
proposto, de 13 variáveis. Como se verifica na Tabela 8.

80
Tabela 8: Classificação no modelo final

A taxa de acerto geral foi de 87,7%. Além disso, as taxas de acerto de
grupos individuais são consistentemente altas e não indicam um problema na
previsão de qualquer um dos dois grupos. Apesar de altas, as taxas de acerto do
grupo “não se torna Churn” é ainda maior que a taxa do grupo que “se torna
Churn”, 91,1% contra 84,4%.
O modelo inicial, que considerava apenas a constante, tinha uma taxa geral
de acerto de 51,1%. O modelo completo com 13 variáveis aumenta 1,7 vezes a taxa
de acerto na previsão.
Nos últimos passos do stepwise, a melhora no R2 é pequena e a taxa de
acerto geral do modelo não se altera tanto. Isto indica que as últimas variáveis
inseridas no modelo não apresentam tanto peso para determinar o Escore de Churn.
No entanto, tais variáveis permaneceram no modelo final para ajudar na definição
do perfil dos domicílios que cancelam a assinatura (contrato) do plano de saúde. A
Tabela 9 (abaixo) indica a Estatística de Wald que considera a importância de cada
variável no modelo proposto.

81
O valor percentual foi calculado a partir dos valores absolutos de cada
variável através da Estatística de Wald. De maneira percentualizada é possível
comparar a importância das variáveis.
Tabela 9: Peso das variáveis no modelo final

Estatística %
WALD Peso
Tempo de Exame 8.059,07 31,4%
Segmento de Utilização 6.310,48 24,6%
Flag Atraso 4.456,58 17,3%
Tempo de Consulta 2.078,84 8,1%
Ano Inclusão 1.174,45 4,6%
Valor em T3 1.167,41 4,5%
Faixa Etária 1.029,57 4,0%
Área de Rendimento 354,72 1,4%
Valor em T2 320,30 1,2%
Rede de Produto 306,68 1,2%
Opcional 225,49 0,9%
Sexo 135,15 0,5%
Estado Civil 73,27 0,3%
As 3 variáveis mais importantes para o modelo, ou seja, as que carregam a
maior informação relacionada à probabilidade do indivíduo se desligar do plano de
saúde são, respectivamente: o Tempo de Exame, a Segmentação de Utilização e o
Flag de Atraso de Pagamento. Juntas, essas três variáveis carregam mais de 73% de
toda variabilidade explicada pelo modelo Logit. Tempo de consulta se apresenta
como uma quarta variável (no nível de importância). Essas quatro variáveis
ultrapassam os 80% da explicação do modelo probabilístico.

82
6.4 INTERPRETAÇÃO DOS RESULTADOS
Como será visto mais adiante, as principais variáveis explicativas do
modelo, apresentam os sinais esperados, no que diz respeito à correlação com o
Churn.
A. Tempo de Consulta – Esta variável representa, em dias, o tempo
decorrido desde a última consulta. É de se esperar que pacientes com elevado
tempo desde sua última consulta, tenham uma maior probabilidade de se tornar ex-
cliente.
Tabela 10: Comparativo no Tempo de Consulta entre Churn e não-Churn

Observando a Tabela 10 acima, é possível distinguir o grupo dos clientes
que se tornaram Churn, (com tempo médio e tempo mediano de consulta acima de
19 dias); e o grupo dos clientes Não-Churn (com baixo tempo de consulta).

83
Figura 3: Dispersão entre o Tempo de Consulta e Probabilidade de Churn

A Figura 3 mostra através da Probabilidade predita (Predicted Probability)
que quanto maior é o tempo de consulta do paciente, maior é sua chance de se
tornar um Churn.
B. Tempo de Exame – Variável que representa, em dias, o tempo
decorrido desde o último exame.
Tabela 11: Comparativo no Tempo de Exame entre Churn e não-Churn

84
O comportamento da variável Tempo de Exame se mostra similar ao
comportamento do Tempo de consulta; ou seja, ex-clientes possuem um elevado
nível em dias no tempo de exame, como se pode ver na Tabela 11.
Figura 4: Dispersão entre o Tempo de Exame e Probabilidade de Churn
Em outras palavras, à medida que se aumenta o Tempo de exame, aumenta a
probabilidade de se tornar um ex-clientes. Pode-se ver isso através da Figura 4.
C. Valor T2 – Representa o valor da mensalidade do plano, pago à
empresa, no penúltimo mês. É razoável supor que clientes ativos tenham uma
distribuição de valores superiores aos clientes inativos. A Tabela 12 abaixo,
confirma essa suposição.

85
Tabela 12: Comparativo no Penúltimo Valor Pago entre Churn e não-Churn

D. Valor T3 - Valor da mensalidade do plano, pago à empresa, no
antepenúltimo mês. Clientes que não pagam esses valores (valor t2 e t3) tendem se
tornar inativos. Tal afirmação se confirma através da variável dicotômica criada
para verificação de inadimplência no pagamento (flag Atraso).
Mais ainda; a Tabela 13 indica semelhança entre as variáveis Valor t2 e t3. Era
de se esperar que os valores t1, t2 e t3 tivesse comportamentos semelhantes, visto
que um assinante contrata um plano mensal num valor estipulado.
Tabela 13: Comparativo Antepenúltimo Valor Pago entre Churn e não-Churn

E. Flag Atraso – Indica se o cliente teve algum “não pagamento” nos
últimos três meses. Onde 1 (um) indica atraso em um dos três possíveis pagamento.
Intuitivamente, tem-se que os clientes com atraso são os que mais se desligam do
plano de saúde.
86
Tabela 14: Churn versus Atraso - Absoluto

Churn
Total
Não Sim
Atraso
Não 59.151 42.918 102.069
Sim 4.698 23.785 28.483
Total 63.849 66.703 130.552
Tabela 15: Churn versus Atraso - Percentual

Churn
Total
Não Sim
Atraso
Não 45,3% 32,9% 78,2%
Sim 3,6% 18,2% 21,8%

Total 48,9% 51,1% 100,0%
Nas tabelas 14 e 15 acima, se evidencia quem aqueles assinantes em atraso
têm maior chance de ser tornar Inativo.
F. Ano de Inclusão – Ano de entrada do participante na empresa
(posterior a 1998). Proporcionalmente, clientes que entraram em 2004 e 2005 são
mais propensos a se tornarem Churn, como se pode ver através das Tabelas 16 e 17
abaixo.
87
Tabela 16: Churn versus Ano de Inclusão - Absoluto

Churn
Total
Não Sim
1999 1.080 382 1.462
2000 1.042 509 1.551
2001 4.893 3.418 8.311

Ano de Inclusão
2002 6.277 4.562 10.839
2003 5.520 6.187 11.707
2004 9.102 19.133 28.235
2005 12.411 20.148 32.559
2006 21.750 11.825 33.575
2007 1.774 539 2.313
Total 63.849 66.703 130.552
Tabela 17: Churn versus Ano de Inclusão - Percentual

Churn
Total
Não Sim
1999 1,7% 0,6% 1,1%
2000 1,6% 0,8% 1,2%
2001 7,7% 5,1% 6,4%

Ano de Inclusão
2002 9,8% 6,8% 8,3%
2003 8,6% 9,3% 9,0%
2004 14,3% 28,7% 21,6%
2005 19,4% 30,2% 24,9%
2006 34,1% 17,7% 25,7%
2007 2,8% 0,8% 1,8%
Total 100,0% 100,0% 100,0%

88
G. Segmento de Utilização – Indica forma mais habitual com que os
clientes utilizam os planos (Definição em Anexo 1). Dos clientes que não
costumam utilizar, os considerados “Sem segmento”, espera-se uma maior
probabilidade de Churn. De fato isso ocorre, como mostra a Figura 5
Figura 5: Distribuição entre os Clientes Ativos e Churn através do Segmento

100%
90%
6.326 8.646
80% 20.574 20.445
70% 10.712
60%
50% CHURN
40% ATIVO
7.421 13.246
30% 16.959 21.756
20% 4.467
10%
0%
Cirurgia/ Consulta/ Consulta/ Consulta/ Sem
Internação Exame Alta Exame Exame Segmento
Baixa Média
.
H. Opcional – Indica a presença de algum tipo de opcional (Opcional
Odontologia, Opcional p/ Emergências, Opcional para Viagens, Opcional Air) no
plano original do paciente.
Tabela 18: Churn versus Opcional - Absoluto

Churn
Total
Não Sim
Opcional
Não 41.149 52.732 93.881
Sim 22.700 13.971 36.671
Total 63.849 66.703 130.552

89
Tabela 19: Churn versus Opcional - Percentual

Churn
Total
Opcional
Não Sim
Não 31,5% 40,4% 71,9%
Sim 17,4% 10,7% 28,1%
Total 48,9% 51,1% 100,0%
Os pacientes que com opcionais têm mais chance de não permanecer ativo.
Essa afirmação é corroborada através da Tabela 19.
I. Faixa Etária – Quanto maior a faixa etária, maior é a chance de haver
clientes ativos. Isso pode ser explicado pelo alto valor do plano, associado à faixa
etária, mas principalmente à necessidade da idade. Clientes idosos necessitam
recorrer mais ao plano se comparados aos mais jovens. Isso se evidencia nas
Tabelas 20 e 21, abaixo.
Tabela 20: Churn versus Faixa Etária - Absoluto

Churn
Total
Não Sim
até 18 anos 18.669 19.075 37.744
entre 19 e 23 3.174 4.286 7.460
entre 24 e 28 7.037 9.720 16.757
entre 29 e 33 6.888 9.678 16.566

Faixa Etária
entre 34 e 38 6.318 7.785 14.103
entre 39 e 43 5.148 6.057 11.205
entre 44 e 48 3.639 3.519 7.158
entre 49 e 53 2.624 2.290 4.914
entre 54 e 58 2.100 1.380 3.480
59 anos ou mais 8.252 2.913 11.165
Total 63.849 66.703 130.552

.
90
Tabela 21: Churn versus Faixa Etária - Percentual

Churn
Total
Não Sim
até 18 anos 29,2% 28,6% 28,9%
entre 19 e 23 5,0% 6,4% 5,7%
entre 24 e 28 11,0% 14,6% 12,8%
entre 29 e 33 10,8% 14,5% 12,7%

Faixa Etária
entre 34 e 38 9,9% 11,7% 10,8%
entre 39 e 43 8,1% 9,1% 8,6%
entre 44 e 48 5,7% 5,3% 5,5%
entre 49 e 53 4,1% 3,4% 3,8%
entre 54 e 58 3,3% 2,1% 2,7%
59 anos ou mais 12,9% 4,4% 8,6%
Total 100,0% 100,0% 100,0%
A definição das Faixas Etárias no estudo, pautou-se nas faixas definidas
originalmente na operadora de plano de saúde. Em virtude disso, só é possível notar
diferenças significativas na última faixa de idade.
J. Área de Rendimento - Classificação de Áreas Administrativas do
Estado do Rio de Janeiro, segundo participação de receita da área com a empresa.
Essa variável detecta regiões, no Estado do Rio de Janeiro, com maior proporção de
clientes com menor poder econômico. Vale lembrar que os bairros que
correspondem a Área de Rendimento no Estado do Rio de Janeiro podem ser visto
na Figura 6 (definição no Anexo 1):

91
Figura 6: Distribuição Econômica nos Bairros do Estado do Rio de Janeiro

Apesar de ser significativa no modelo probabilístico de Churn, não há
diferença significativa entre cliente e ex-clientes nas Áreas de Rendimento, ou seja,
não se destaca nenhuma área em relação a outra (como visto na Tabela 5)
K. Rede de Produto - Grupo de produto onde se classificam os planos dos
associados. Quanto melhor classificado é o plano, menos chance de se tornar
inativo tem o cliente. Isso se deve a importância e os benefícios que esse plano lhe
traz.
92
Figura 7: Distribuição entre os Clientes Ativos e Churn através do Plano

100%
537
90%
7.760 964
80% 24.902 7.802 24.738
70%
60%
50%
2.297 CHURN
40%
9.317 1.360
30% 22.345 8.701 19.829 ATIVO
20%
10%
0%
Personal é o plano mais básico, na rede de produtos, seguidos
respectivamente pelos planos Alfa, Beta, Delta e Omega. Planos antigos ou mal
especificados pela operadora, foram alocados em Não identificados. As diferenças
entre os planos (rede de produtos) citados, são: a presença de privilégios, tais como
uma rede de hospitais diferenciada, a opção de quarto ou enfermaria, entre outros.
A Figura 7 ratifica a intuição de que quanto melhor é o plano do assinante, menos
chance o mesmo tem de ser tornar Inativo.

93
6.5 RESULTADOS NO PSM
Para aplicação do PSM foi utilizado um algoritmo desenvolvido por
Raynald Levesque e adaptado ao SPSS 13.0 © por John Painter (Fev 2004, Anexo
3). Este algoritmo possui uma limitação de seleção de amostra de até 20.000
indivíduos para classificação do PSM. Assim, foi selecionada uma amostra de
10.000 clientes Ativos (ou assinantes) e, através do algoritmo, foram encontrados
10.000 clientes Inativos ou Churn (um para cada indivíduo Ativo) para formarem
os pares de probabilidade.
Devido à limitação do algoritmo em até 20.000 indivíduos, o critério de
seleção da amostra foi de selecionar os clientes com maior propensão a se tornarem
Churn. Ou seja, o algoritmo busca o primeiro indivíduo Ativo com maior
probabilidade estimada e tenta encontrar um par Inativo como probabilidade similar
ao par Ativo. Se não achar, o algoritmo busca um próximo indivíduo Ativo e tenta
encontrar o seu par (Inativo). E assim sucessivamente.
A principal aplicação deste algoritmo de PSM, no estudo, foi encontrar
públicos-alvos adequados, que possa ser testados numa ação de recuperação de
clientes Inativos. Encontrando esses pares, foi possível traçar um comparativo entre
os dois públicos (10.000 ativos e 10.000 inativos) para se testar a eficácia de uma
possível ação de rentabilização.

94
Abaixo, seguem as comparações das características entre os grupos. Cada
Tabela representa o perfil dos clientes e ex-clientes selecionados através do PSM.
Em cada tabela, pode-se notar diferenças entre os grupos. No final deste Capítulo se
atestará uma breve descrição na interpretação dos resultados do PSM.
Tabela 22: Churn PSM por Sexo

Clientes Ex-Clientes
Sexo Absoluto % Absoluto %
Feminino 6.560 65,6% 5.880 58,8%
Masculino 3.440 34,4% 4.120 41,2%
Total 10.000 100,0% 10.000 100,0%
Tabela 23: Churn PSM por Faixa Etária

Faixa Etária Absoluto % Absoluto %
até 18 anos 2.390 23,9% 2.470 24,7%
entre 19 e 23 600 6,0% 690 6,9%
entre 24 e 28 1.540 15,4% 1.020 10,2%
entre 29 e 33 1.640 16,4% 1.240 12,4%
entre 34 e 38 1.330 13,3% 970 9,7%
entre 39 e 43 1.140 11,4% 780 7,8%
entre 44 e 48 480 4,8% 460 4,6%
entre 49 e 53 340 3,4% 480 4,8%
entre 54 e 58 200 2,0% 270 2,7%
59 anos ou mais 340 3,4% 1.620 16,2%
Total 10.000 100,0% 10.000 100,0%

95
Tabela 24: Churn PSM por Safra de Entrada (Ano de Inclusão)
Safra de
Absoluto % Absoluto %
Entrada
1999 40 0,4% 100 1,0%
2000 80 0,8% 100 1,0%
2001 430 4,3% 770 7,7%
2002 880 8,8% 620 6,2%
2003 1.340 13,4% 770 7,7%
2004 6.640 66,4% 1.290 12,9%
2005 590 5,9% 2.260 22,6%
2006 0 0,0% 3.790 37,9%
2007 0 0,0% 300 3,0%
Total 10.000 100,0% 10.000 100,0%
Tabela 25: Churn PSM por Tipo de Plano
Plano Absoluto % Absoluto %
ALFA 5.260 52,6% 2.910 29,1%
BETA 1.010 10,1% 1.350 13,5%
DELTA 1.060 10,6% 1.540 15,4%
OMEGA 150 1,5% 300 3,0%
PERSONAL 2.520 25,2% 3.770 37,7%
NAO IDENTIFICADO 0 0,0% 130 1,3%
Total 10.000 100,0% 10.000 100,0%

96
Tabela 26: Churn PSM por Área de Rendimento

Area de
Absoluto % Absoluto %
Rendimento
A 1.160 11,6% 1.750 17,5%
B 4.380 43,8% 4.770 47,7%
C 3.990 39,9% 2.980 29,8%

OUT CIDADE DO RJ 60 0,6% 200 2,0%
Outros 410 4,1% 300 3,0%
Total 10.000 100,0% 10.000 100,0%
Tabela 27: Churn PSM por Segmento de Utilização

Segmento Absoluto % Absoluto %
Cirurgia/Internação 770 7,7% 910 9,1%
Consulta/Exame Alta 740 7,4% 720 7,2%
Consulta/Exame Baixa 4.000 40,0% 3.230 32,3%
Consulta/Exame Média 2.950 29,5% 2.150 21,5%
Sem Segmento 1.540 15,4% 2.990 29,9%
Total 10.000 100,0% 10.000 100,0%
Tabela 28: Churn PSM por Estado Civil

Estado Civil Absoluto % Absoluto %
Solteiro 6.710 67,1% 6.330 63,3%
Casado 2.920 29,2% 2.910 29,1%
Outros 370 3,7% 760 7,6%
Total 10.000 100,0% 10.000 100,0%

97
Tabela 29: Churn PSM por Flag de Atraso

Tabela 30: Churn PSM por Tempo de Consulta, Tempo de Exame, e pelos
Valores pagos da penúltima e antepenúltima parcela
A análise comparativa da seleção através do PSM, as Tabelas 22 a 30,
acima, fornecem indícios de que os grupos selecionados não apresentam
características semelhantes, apesar de termos os grupos selecionados a partir dos
pares de probabilidades aproximados.
Em algumas variáveis essas diferenças não ocorrem significativamente, tais
como Idade, Estado Civil e Área de Rendimento. No restante, há significativas

98
diferenças. Além disso, pode-se observar que o grupo selecionado de ex-clientes é
caracterizado por possuir planos (rede de produtos) mais diferenciados, ter tempo
de exame e de consulta menores em relação aos clientes.
Significa dizer que existem perfis diferentes de indivíduos ativos e inativos
com propensão a se tornarem Churn semelhantes. Em virtude disso, é importante
atestar esses diferentes perfis e traçar planejamentos distintos para cada grupo de
clientes.
Uma das limitações nesse estudo para a aplicação do PSM foi a
impossibilidade de se expandir o PSM para o universo analisado na Regressão
Logística.
99
7 CONCLUSÕES, RECOMENDAÇÕES E SUGESTÕES
7.1 CONCLUSÕES
O principal objetivo deste estudo foi elaborar um modelo probabilístico de
Regressão Logística que descrevesse, para cada indivíduo presente na base
analisada de clientes da empresa, o risco de cancelamento no plano de saúde.
Consequentemente, após a aplicação do modelo de Churn, foi possível traçar o
perfil dos assinantes mais propensos a se tornar Churn, como também os menos
propensos. Além de traçar perfil dos ex-assinantes.
Em um segundo momento do estudo, após serem estimadas as
probabilidades, traçou-se um modelo de comparação entre os clientes assinantes
ativos e os clientes inativos. Para tal comparação, foi utilizado o algoritmo de
Propensity Score Matching numa amostra de 20.000 clientes. O objetivo desta
comparação era caracterizar assinantes e ex-assinantes com probabilidades a Churn
similares. Do ponto de vista mercadológico, a principal contribuição do PSM
consiste no uso alternativo de seleção de público, o qual pode ser facilmente
replicado para outros problemas de pesquisa.

100
É possível afirmar que o modelo proposto pode ser eficiente para
determinação do risco de cancelamento de clientes, a partir de variáveis
geográficas, demográficas e transacionais.
Nos 130.552 clientes analisados, as variáveis significativas, no modelo
Logit, para determinar a propensão a Churn foram 13 (em ordem de importância):
Tempo de Exame, Segmento de Utilização, Flag de Atraso, Tempo de Consulta,
Ano de Inclusão, Valor T3, Faixa Etária, Área de Rendimento, Valor T2, Rede de
Produto, Flag de Opcional, Sexo e Estado Civil.
A tabela de classificação mostrou que a taxa de acerto geral do modelo de
Regressão Logística é de 87,7% e que as taxas de acerto dos grupos individuais são
altas e indicam uma consistência na previsão de qualquer um dos dois grupos. O
grupo que cancela apresentou taxa de acerto de 84,4% enquanto o grupo que não
cancela tem taxa de acerto de 91,1%. O pseudo R2 de Nagelkerke apresentou um
poder de explicação de 0,695 e a medida Hosmer e Lemeshow de ajuste geral
através de um teste estatístico indica que não houve diferença estatisticamente
significativa entre as classificações observadas e previstas para o modelo final.
Além disso, o valor de -2LL aumentou a cada passo. A combinação dessas medidas
de avaliação do ajuste e da precisão do modelo indica a aceitação deste como um
modelo de Regressão Logística significante.
Assim, de acordo com as variáveis assumidas no modelo de Regressão
Logística, conclui-se que o perfil do assinante com maior risco de cancelamento da
sua assinatura é: aquele com maior tempo entre exames e consultas, com valores
mais baixo de mensalidades e consequentemente, rede de produtos inferiores,

101
clientes que atrasam mais os pagamentos e têm menos opcionais, clientes mais
novos e que pouco utilizam o plano.
Os resultados obtidos indicam que o modelo é bastante eficiente em
distinguir assinantes que possivelmente cancelariam sua assinatura (contrato) dos
que não cancelariam.
7.2 RECOMENDAÇÕES
Dentre as inúmeras utilidades deste estudo para empresas gestoras de planos
de saúde, as principais são:
- A empresa pode estimular clientes que não possuem opcional no plano de
saúde, na tentativa de estimular o mesmo a continuar ativo;
- Os assinantes das áreas de rendimento com maior propensão a se tornarem
Churn poderiam ser estimulados se a empresa implantasse algum posto médico de
atendimento especializado;
- O público mais idoso poderia ter um atendimento domiciliar,
estabelecendo uma relação afetiva com a empresa;
- Nos clientes que se tornaram ex-assinantes, se poderia implementar uma
pesquisa (através do callcenter da empresa), para se captar os principais motivos do
desligamento do plano;
- Através da seleção do público gerada pelo PSM torna-se possível uma
mensuração mais qualificada de alguma ação de rentabilização da base.

102
7.3 SUGESTÕES DE PESQUISA
Os resultados obtidos indicam algumas ações de marketing e de negócio
podendo contribuir para aumentar a rentabilidade da empresa através da retenção de
clientes ou da implementação de ações que melhorem a qualidade da venda,
revertendo assim em clientes que permaneçam mais tempo na carteira.
As empresas que têm por objetivo entender o comportamento de seus
clientes devem montar uma base de dados que registre o relacionamento dos
produtos com seus consumidores e também o perfil dos clientes e prospects.
Para trabalho futuros, seria necessário pensar em alternativas de variáveis,
tais como, incluir indicadores de satisfação do assinante, perfil do assinante antes
de se submeter ao plano atual, variáveis que conseguissem enquadrar a vida social
do assinante (visto que, por exemplo, clientes que possui uma atividade física
correria risco diferentes de utilização de planos de saúde).
Outro ponto para se pesquisar, seria encontrar formas alternativas de se
encontrar o Escore de Churn, podendo-se utilizar outras ferramentas, tais como
Redes Neurais, ou Árvore de Decisão, entre outras.

103
REFERÊNCIAS BIBLIOGRÁFICAS
ABADIE, A., DRUKKER, D., HERR, J., IMBENS, G. Implementing matching estimators
for average treatment effects in Stata. The Stata Journal, n.1, p.1-18, 2001.
ARAÚJO, Bruno C. P. O. Potencial Exportador das Firmas Industriais Brasileiras. 2005.

Mestrado em Economia. UNB - Escola de Administração Fazendária.
BARROS, J.E.G. Análise de Sobrevivência: Modelo de Risco de Desligamento de

Clientes. 2002, Mestrado. UFRJ – Administração.
BATESON, J.E.G.; HOFFMAN, K.D. Marketing de Serviços. 4a Ed., Porto Alegre:

Bookman, 2001.
BECKER S.O., ICHINO, A. Estimation of average treatment effects based on propensity

score. Stata Journal, v2, p.358-377, 2002. Disponível em: www.sobecker.de/pscore.html.
BERGER, Paul D.; NASR, NadaI. Customer Lifetime Value: Marketing Models and
Applications, Journal of Interactive Marketing, 12 (Winter), 17–30, 1998. .
BERRY, L.L. e PARASURAMAN, A. Serviços de Marketing. 3ª Ed. São Paulo: Editora

Maltese, 1992.
BRETZKE, Miriam. CRM em tempo real. São Paulo, Atlas, 2000.
BROCHI, Leila. Análise do atendimento da medicina laboratorial e convênio, sob o foco

das estratégias de marketing de relacionamento. Dissertação - Mestrado UFSC - Eng. de
Produção, 2004.
CHARNET, R.; FREIRE, C. A. de L.; CHARNET, E. M. R.; BONVINO, H. Análise de

Modelos de Regressão Linear com Aplicações. Editora da Unicamp, 1999.
CISTER, Angelo M.; EBECKEN, Nelson F. F. - “CRM through DM: a case study” – Third
International Conference on Data Mining- DATA MINING III, Bolongna, Italy-2002. .
CISTER, Angelo M. Mineração de dados para a análise de atrito em telefonia móvel tese
de doutorado - UFRJ - Eng. Civil, 2005.
104
DIPAK, Jain; SINGH, Siddhartha S. Customer Lifetime Value Research In Marketing: A

Review And Future Directions, Journal of Interactive Marketing, 16 (2), 34-47, 2002. .
GUJARATI, N. Damodar - Econometria Básica. 4ª ed.2006
GUPTA, Sunil; - LEHMANN, Donald R. Gerenciando Clientes como Investimentos: o

valor estratégico dos clientes a longo prazo, ISBN: 85-363-0669-6: Bookman, 2006.
HAIR, Joseph F. Jr.; ANDERSON. Rolph E.; TATHAM Ronald L.; BLACK William C.
Análise Multivariada de Dados, ISBN 85-363-0482-0: Bookman 2005
HECKMAN J.; Ichimura H.; SMITH J.; TODD P.,Matching as an econometrics evaluation
estimator – Review of Economics Studies,65, 261-294, 1998.
HIRANO, K., IMBENS, G. W., RIDDER, G. Efficient estimation of average treatment

effects using the estimated propensity score. Cambridge, MA.: National Bureau of
Economic Research, 2003. Disponível em: http://ideas.repec.org/s/nbr/nberwo.html.
HOSMER, David; LEMESHOW, Stanley. Applied Logistic Regression – 2º Edition.

University of Massachusetts, Amherst, Massachusetts, 2000.
JONES, T.; SASSER JR. e EARL, W. Why satisfied customer defect. Harvard Business
Revivew, v. 73, n. 6, 9. 88-99, Nov./Dec. 1995.
KOTLER, Philip. Administração de Marketing. Editora Pearson, 12ª ed.: São Paulo, 2006. .
KOTLER, P. e ARMSTRONG, G. Princípios de marketing. 7ª.ed. Rio de janeiro: Prentice-

Hall, 1995. Cap. 18.
KRZANOWSKY, W. J. Principles of multivariate analysis. Oxford: Clarendon Press,

1988.
KUMAR, V.; RAMANI, G.; BOHLING, T. Customer Lifetime Value Approaches and
Best Practice Applications, Journal of Interactive Marketing, Vol 18. pag 60-72, 2004. .
LOVERLOCK, C.H. e WRIGHT, L. Services: Marketing e Gestão. Rio de Janeiro:

Saraiva, 2001.
105
LU, Junxiang. Predicting Customer Churn in the Telecommunication: An Aplication of

Survival Analysis Modeling Using SAS. Kansas – USA, Sprint Communications
Company, 2001. .
MCKENNA, R. Marketing de relacionamento: estratégias bem-sucedidas para a era do

cliente. Rio de Janeiro: Campus, 1993. 254p.
MCLACHLAN, G. Discriminant Analysis and Statistical Pattern Recognition. New York:

John Wiley e Sons.1992.
MENARD, SCOTT. Applied logistic regression analysis. 1995.
MEYER, P. L. – Probabilidade: aplicações à estatística; tradução do Prof. Ruy de C. B.

Lourenço Filho. Rio de Janeiro, Livros Técnicos e Científicos, 1978.
PARSONS, S. L. “Reducing Bias in a Propensity Score Matched-Pair Sample Using

Greedy Matching Techniques”. Proceedings of the 26º Annual SAS. Paper 214-26 <
http://www2.sas.com/proceedings/sugi26/p214-26.pdf. 2001.
PAULA, G.A. Modelos de regressão com apoio computacional. IME - USP. 294p.
Disponível em <http:// www.ime.usp.br/~giapaula>, 2004.
PEPPERS, Don. e ROGERS, Martha. Marketing One to One: ferramentas para

implementação de programas de marketing direto. São Paulo, 2001.
PINTO, Solange da C. Marketing de Relacionamento e Retenção de Clientes: um estudo de

caso na indústria jornalística. 1997. Mestrado. UFMG – Administração.
RAVALLION, M. The impact of economic policies on poverty and income distribution:

evaluation techniques and tools. Washington D.C.: World Bank, 2003. Cap.5, p.103-122.
REICHHELD, F.F. The loyalty effect: the hidden force behind growth, profits, and lasting
value. Boston: Harvard Business Scholl Press, 1996. .
REINARTZ, Werner J.; KUMAR, V. Customer Relationship Management: A Databased

Approach, ISBN: 0-471-27133-0, USA: John Wileye Sons, 2006. .
ROSENBAUM, P., Rubin, D. “The central role of the propensity score in observational
studies for causal effects”. Biometrika 70, 41–55. Rubin, D., 1983.
106
SABATINO, Luiz. Fidelização: a ferramenta de marketing que promove relacionamentos

duradouros com os clientes Rio de Janeiro: Reichmann e Afonso Editores, 2003 .
VAVRA, T.G. Marketing de relacionamento: Aftermarketing. São Paulo: Atlas, 1993.
ANS – Agência Nacional de Saúde Suplementar, < http://www.ans.gov.br>, 2003
IBGE – Instituto Brasileiro de Geografia e Estatística, < http://www.ibge.gov.br>, 2004

107
ANEXOS
ANEXO 1 – DEFINIÇÃO DAS VARIÁVEIS
SEGMENTO DE UTILIZAÇÃO
- Cirurgia: se o cliente fez alguma cirurgia nos últimos 12 meses
- Obstetrícia: se o cliente não teve evento de cirurgia, mas teve obstetrícia nos últimos 12
meses
- Consulta /Exame Baixa: se ocliente não fez cirurgia e não fez obstetrícia e sua média
mensal de eventos foi de até 0,667
- Consulta /Exame Média: se o cliente não fez cirurgia e não fez obstetrícia e sua média
mensal de eventos foi 0,667 a 1,667
- Consulta /Exame Alta: se o cliente não fez cirurgia e não fez obstetrícia e sua média
mensal de eventos foi superior a 1,667
- Não Usou: se o cliente não teve evento algum nos últimos 12 meses
ÁREA DE RENDIMENTO
- Classe A: Área Administrativa na cidade do Rio de Janeiro com Share de Rendimento até
5%
- Classe B: Área Administrativa no Rio de Janeiro com Share de Rendimento entre 5% e
10%
- Classe C: Área Administrativa no Rio de Janeiro com Share de Rendimento entre 10% e
15%
- Classe D: Área Administrativa no Rio de Janeiro Share de Rendimento entre 15% e 20%
- Classe E: Área Administrativa no Rio de Janeiro com Share de Rendimento acima de
20%
- Outros: Outros Estados no Estado do Rio de Janeiro
108
SHARE DE RENDIMENTO
- Representa o percentual médio que cada domicílio disponibiliza de sua renda mensal em
planos de saúde. Sua formulação segue:
109
ANEXO 2 – FREQUÊNCIA E CODIFICAÇÃO DAS VARIÁVEIS NO MODELO

110
ANEXO 3 – SYNTAX DO PSM (adaptado de John Painter, Fev 2004)
GET FILE= 'C:\Vinicius\Dissertacao\DADOS\churn_unimed.sav'.

COMPUTE id=$CASENUM.
exec.
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\churn_unimed.sav'
FILTER OFF.
USE ALL.
SAMPLE .20.
EXECUTE .
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\churn_unimed_amostra20.sav'
GET FILE= 'C:\Vinicius\Dissertacao\DADOS\churn_unimed_amostra20.sav'
COMPUTE X = RV.UNIFORM(1,26191) .
SORT CASES BY CHURN(D) PREV(D) X.
COMPUTE idx=$CASENUM.
exec.
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\mydata.sav'
* Erase the previous temporary result file, if any.

ERASE FILE= 'C:\Vinicius\Dissertacao\DADOS\results.sav'.
COMPUTE key=1.
SELECT IF (1=0).
exec.
* Create an empty data file to receive results.
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\results.sav'
SET MPRINT=no.
*////////////////////////////////.
DEFINE !match (nbtreat=!TOKENS(1)).
!DO !cnt=1 !TO !nbtreat
111
GET FILE= 'C:\Vinicius\Dissertacao\DADOS\mydata.sav'.

SELECT IF idx=!cnt OR CHURN=0.
* Select one CHURN case and all control .
DO IF $CASENUM=1.
COMPUTE #target=PREV.
ELSE.
COMPUTE delta=PREV-#target.
END IF.
EXECUTE.
SELECT IF ~MISSING(delta).
IF (delta<0) delta=-delta
SORT CASES BY delta.

SELECT IF $CASENUM=1.
COMPUTE key=!cnt .
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\used.sav'.
ADD FILES FILE=*.
/FILE= 'C:\Vinicius\Dissertacao\DADOS\results.sav'.
************************************************ Match back to original and

drop case from original .
SORT CASES BY idx .
MATCH FILES.
/FILE=*.
/IN=mydata.
/FILE= 'C:\Vinicius\Dissertacao\DADOS\used.sav'.
/IN=used.
/BY idx .
SELECT IF (used = 0).
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\mydata.sav'.
/ DROP = used mydata key delta.
EXECUTE.
!DOEND.
112
!ENDDEFINE.
*////////////////////////////////
SET MPRINT=yes
**************************.
* MACRO CALL (first insert the number of cases after nbtreat below) .
**************************.
!match nbtreat=5000
* Sort results file to allow matching
GET FILE= 'C:\Vinicius\Dissertacao\DADOS\results.sav'.

SORT CASES BY key.
******************.
* Match each CHURN cases with the most similar non CHURN case.
* To include additional variables from original file list them on the RENAME
subcommand below.
******************

MATCH FILES /FILE=*.
/FILE= 'C:\Vinicius\Dissertacao\DADOS\results.sav'.
/RENAME (idx = d0) (id=id2) (PREV=PREV2).
(CHURN=CHURN2) (key=idx).
/BY idx.
/DROP= d0.
FORMATS delta PREV PREV2 (F10.8).
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\mydata and results.sav'.
EXECUTE.

Vinicius Mendes Dissert

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Vinicius Mendes Dissert

Загружено:

Авторское право:

Доступные форматы

UNIVERSIDADE FEDERAL FLUMINENSE

MESTRADO EM ENGENHARIA DE PRODUÇÃO

VINÍCIUS DE PAULA MENDES

MODELOS DE CHURN DE CLIENTES EM PLANO DE SAÚDE

Dissertação apresentada ao Curso de Pós-Graduação Stricto

Orientador: Prof. Annibal Parracho Sant’Anna, PhD

M538 Mendes, Vinícius de Paula.

Orientador: Annibal Parracho Sant’Anna.

1. Marketing de relacionamento. 2. Logística. 3. Plano de saúde.

VINÍCIUS DE PAULA MENDES

MODELOS DE CHURN DE CLIENTES EM PLANO DE SAÚDE

Dissertação apresentada ao Curso de Pós-Graduação Stricto

Aprovada em Outubro de 2008

Ao meu orientador Annibal Parracho, pelos esclarecimentos oportunos.

Um agradecimento especial à minha esposa Shihane Mohamad, por me incentivar a

“Não tenho medo de falar que não sei.

2 OBJETIVOS E RELEVÂNCIA ................................................................................................... 25

2.1 OBJETIVOS .......................................................................................................................... 25

3 REVISÃO DE LITERATURA ..................................................................................................... 29

3.1 MARKETING DE RELACIONAMENTO E RETENÇÃO .............................................. 30

4.1 PLANOS PRIVADOS DE ASSISTÊNCIA À SAÚDE ....................................................... 40

5 METODOLOGIA DE ANÁLISE ................................................................................................ 49

5.1 O MODELO DE REGRESSÃO LOGÍSTICA .................................................................... 49

6 ANÁLISE DOS RESULTADOS .................................................................................................. 73

6.1 RESULTADOS DO MODELO DE REGRESSÃO ............................................................ 73

6.1.1 INTERPRETAÇÃO DOS PARÂMETROS NO MODELO................................................................ 77

7 CONCLUSÕES, RECOMENDAÇÕES E SUGESTÕES .......................................................... 99

7.1 CONCLUSÕES ..................................................................................................................... 99

Figura 1: Nº de Beneficiários em plano de saúde privado no Brasil por Idade ..................... 19

Figura 2: Curva de distribuição de probabilidade logit (dados simulados)............................ 52

Figura 3: Dispersão entre o Tempo de Consulta e Probabilidade de Churn .......................... 83

Figura 4: Dispersão entre o Tempo de Exame e Probabilidade de Churn ............................. 84

Figura 5: Distribuição entre os Clientes Ativos e Churn através do Segmento ..................... 88

Figura 6: Distribuição Econômica nos Bairros do Estado do Rio de Janeiro ........................ 91

Figura 7: Distribuição entre os Clientes Ativos e Churn através do Plano ............................ 92

Tabela 1: Descrição das Variáveis, presente no banco de dados ........................................... 23

Tabela 2: Descrição das variáveis utilizadas na Regressão Logística.................................... 48

Tabela 3: Modelo apenas com a constante............................................................................. 74

Tabela 4: Teste Omnnibus de coeficientes do Modelo .......................................................... 74

Tabela 5: Estimação do Modelo de Churn ............................................................................. 76

Tabela 6: Máxima verossimilhança e R2 ............................................................................... 78

Tabela 7: Teste de Hosmer e Lemeshow ............................................................................... 79

Tabela 8: Classificação no modelo final ................................................................................ 80

Tabela 9: Peso das variáveis no modelo final ........................................................................ 81

Tabela 10: Comparativo no Tempo de Consulta entre Churn e não-Churn ........................... 82

Tabela 11: Comparativo no Tempo de Exame entre Churn e não-Churn .............................. 83

Tabela 12: Comparativo no Penúltimo Valor Pago entre Churn e não-Churn....................... 85

Tabela 14: Churn versus Atraso - Absoluto ........................................................................... 86

Tabela 15: Churn versus Atraso - Percentual......................................................................... 86

Tabela 16: Churn versus Ano de Inclusão - Absoluto ........................................................... 87

Tabela 17: Churn versus Ano de Inclusão - Percentual ......................................................... 87

Tabela 18: Churn versus Opcional - Absoluto ....................................................................... 88

Tabela 19: Churn versus Opcional - Percentual..................................................................... 89

Tabela 20: Churn versus Faixa Etária - Absoluto .................................................................. 89

Tabela 21: Churn versus Faixa Etária - Percentual ................................................................ 90

Tabela 22: Churn PSM por Sexo ........................................................................................... 94

Tabela 23: Churn PSM por Faixa Etária ................................................................................ 94

Tabela 25: Churn PSM por Tipo de Plano ............................................................................. 95

Tabela 26: Churn PSM por Área de Rendimento .................................................................. 96

Tabela 27: Churn PSM por Segmento de Utilização ............................................................. 96

Tabela 28: Churn PSM por Estado Civil ............................................................................... 96

Tabela 29: Churn PSM por Flag de Atraso ............................................................................ 97

penúltima e antepenúltima parcela......................................................................................... 97

Atualmente, as movimentações no mercado mostram que é mais lucrativo