Вы находитесь на странице: 1из 113

UNIVERSIDADE FEDERAL FLUMINENSE

MESTRADO EM ENGENHARIA DE PRODUÇÃO


CENTRO TECNOLÓGICO

VINÍCIUS DE PAULA MENDES

MODELOS DE CHURN DE CLIENTES EM PLANO DE SAÚDE

Dissertação apresentada ao Curso de Pós-Graduação Stricto


Sensu em Engenharia de Produção da Universidade Federal
Fluminense, como requisito parcial para obtenção do Grau de
Mestre em Engenharia de Produção. Área de concentração:
Sistemas de Apoio à Decisão

Orientador: Prof. Annibal Parracho Sant’Anna, PhD

Niterói
2008
Ficha Catalográfica elaborada pela Biblioteca da Escola de Engenharia e Instituto de Computação da UFF

M538 Mendes, Vinícius de Paula.


Modelos de Churn de clientes em plano de saúde / Vinícius de
Paula Mendes. – Niterói, RJ : [s.n.], 2008.
102 f.

Orientador: Annibal Parracho Sant’Anna.


Dissertação (Mestrado em Engenharia de Produção) -
Universidade Federal Fluminense, 2008.

1. Marketing de relacionamento. 2. Logística. 3. Plano de saúde.


4. Sistema de apoio à decisão. I.Título.
CDD 658.8
2

VINÍCIUS DE PAULA MENDES

MODELOS DE CHURN DE CLIENTES EM PLANO DE SAÚDE

Dissertação apresentada ao Curso de Pós-Graduação Stricto


Sensu em Engenharia de Produção da Universidade Federal
Fluminense, como requisito parcial para obtenção do Grau de
Mestre em Engenharia de Produção. Área de concentração:
Sistemas de Apoio à Decisão

Aprovada em Outubro de 2008

BANCA EXAMINADORA

___________________________________________________
Prof. Annibal Parracho Sant’Anna, PhD - Orientador
Universidade Federal Fluminense - UFF

___________________________________________________
Prof. Marco Antônio Farah Caldas, PhD
Universidade Federal Fluminense - UFF

__________________________________________________
Prof.ª Ismenia Blavatsky de Magalhães, Dsc
Escola Nacional de Ciências Estatísticas - ENCE

Niterói
2008
3

DEDICATÓRIA

Dedico este trabalho aos meus pais, Eduardo e Maria Ceiça, por construírem o
pilar para o que sou hoje. E aos meus avôs Dolores e Evilázio, que estão
orgulhosos onde estiverem.
4

AGRADECIMENTOS

Ao meu orientador Annibal Parracho, pelos esclarecimentos oportunos.

Aos meus amigos Thiago Ramos, Anderson Pinho, Rodrigo Rocha e Rodrigo
Moreira, pela ajuda nos requisitos técnicos.

Um agradecimento especial à minha esposa Shihane Mohamad, por me incentivar a


todo o momento e pelo seu apoio incondicional.
E a todos que de certa forma torceram por mim nesta empreitada.
5

EPÍGRAFE

“Não tenho medo de falar que não sei.


Nem de falar que não aprendi.
Tenho sim, medo de dizer que não tentei.”
(Vinícius de Paula Mendes)
6

SUMÁRIO

1 INTRODUÇÃO ............................................................................................................................. 14

1.1 CONTEXTUALIZAÇÃO..................................................................................................... 14
1.2 O VALOR DO CLIENTE ..................................................................................................... 16
1.3 O PLANO DE SAÚDE E SUA IMPORTÂNCIA ................................................................ 19
1.4 ESTRUTURA DA DISSERTAÇÃO .................................................................................... 21
1.4.1 SOBRE O ESTUDO.................................................................................................................... 21
1.4.2 SOBRE O BANCO DE DADOS.................................................................................................... 21

2 OBJETIVOS E RELEVÂNCIA ................................................................................................... 25

2.1 OBJETIVOS .......................................................................................................................... 25


2.2 RELEVÂNCIA ...................................................................................................................... 27

3 REVISÃO DE LITERATURA ..................................................................................................... 29

3.1 MARKETING DE RELACIONAMENTO E RETENÇÃO .............................................. 30


3.2 MARKETING DE RELACIONAMENTO E FIDELIZAÇÃO......................................... 34
3.3 MARKETING DE RELACIONAMENTO E CHURN ...................................................... 35

4 O CONTEXTO DA PESQUISA................................................................................................... 40

4.1 PLANOS PRIVADOS DE ASSISTÊNCIA À SAÚDE ....................................................... 40


4.2 DATABASE MARKETING ................................................................................................. 42
4.3 COLETA DAS INFORMAÇÕES ........................................................................................ 45
4.4 MANIPULAÇÃO E TRATAMENTO DOS DADOS ......................................................... 46

5 METODOLOGIA DE ANÁLISE ................................................................................................ 49

5.1 O MODELO DE REGRESSÃO LOGÍSTICA .................................................................... 49


5.2 INFERÊNCIA NO MODELO DE REGRESSÃO LOGÍSTICA ....................................... 53
5.2.1 O PROBLEMA DA DETERMINAÇÃO DO VALOR DE CORTE ...................................................... 55
5.3 PROCEDIMENTO DE AJUSTE DO MODELO ............................................................... 56
5.3.1 INCLUSÃO E EXCLUSÃO DE VARIÁVEIS NOS MODELOS DE REGRESSÃO .............................. 57
5.3.2 TESTES DE CONFIRMAÇÃO NOS MODELOS DE REGRESSÃO .................................................. 59
5.3.3 MEDIDAS DE AJUSTES NOS MODELOS DE REGRESSÃO.......................................................... 62
5.3.4 RAZÃO DE PROBABILIDADES (ODDS) ................................................................................... 64
5.4 O MÉTODO DE MACHING ............................................................................................... 65
5.4.1 PROPENSITY SCORE MATCHING (ESCORE DE PROPENSÃO) .................................................. 66
5.4.2 ATT (TREATMENT ON THE TREATED) .................................................................................... 67

6 ANÁLISE DOS RESULTADOS .................................................................................................. 73

6.1 RESULTADOS DO MODELO DE REGRESSÃO ............................................................ 73


7

6.1.1 INTERPRETAÇÃO DOS PARÂMETROS NO MODELO................................................................ 77


6.2 AJUSTE FINAL DO MODELO........................................................................................... 78
6.3 PRECISÃO DA ESTIMATIVA DO MODELO ................................................................. 79
6.4 INTERPRETAÇÃO DOS RESULTADOS ......................................................................... 82
6.5 RESULTADOS NO PSM ...................................................................................................... 93

7 CONCLUSÕES, RECOMENDAÇÕES E SUGESTÕES .......................................................... 99

7.1 CONCLUSÕES ..................................................................................................................... 99


7.2 RECOMENDAÇÕES ......................................................................................................... 101
7.3 SUGESTÕES DE PESQUISA ............................................................................................ 102
8

LISTA DE FIGURAS

Figura 1: Nº de Beneficiários em plano de saúde privado no Brasil por Idade ..................... 19

Figura 2: Curva de distribuição de probabilidade logit (dados simulados)............................ 52

Figura 3: Dispersão entre o Tempo de Consulta e Probabilidade de Churn .......................... 83

Figura 4: Dispersão entre o Tempo de Exame e Probabilidade de Churn ............................. 84

Figura 5: Distribuição entre os Clientes Ativos e Churn através do Segmento ..................... 88

Figura 6: Distribuição Econômica nos Bairros do Estado do Rio de Janeiro ........................ 91

Figura 7: Distribuição entre os Clientes Ativos e Churn através do Plano ............................ 92


9

LISTA DE TABELAS

Tabela 1: Descrição das Variáveis, presente no banco de dados ........................................... 23

Tabela 2: Descrição das variáveis utilizadas na Regressão Logística.................................... 48

Tabela 3: Modelo apenas com a constante............................................................................. 74

Tabela 4: Teste Omnnibus de coeficientes do Modelo .......................................................... 74

Tabela 5: Estimação do Modelo de Churn ............................................................................. 76

Tabela 6: Máxima verossimilhança e R2 ............................................................................... 78

Tabela 7: Teste de Hosmer e Lemeshow ............................................................................... 79

Tabela 8: Classificação no modelo final ................................................................................ 80

Tabela 9: Peso das variáveis no modelo final ........................................................................ 81

Tabela 10: Comparativo no Tempo de Consulta entre Churn e não-Churn ........................... 82

Tabela 11: Comparativo no Tempo de Exame entre Churn e não-Churn .............................. 83

Tabela 12: Comparativo no Penúltimo Valor Pago entre Churn e não-Churn....................... 85

Tabela 13: Comparativo Antepenúltimo Valor Pago entre Churn e não-Churn .................... 85

Tabela 14: Churn versus Atraso - Absoluto ........................................................................... 86

Tabela 15: Churn versus Atraso - Percentual......................................................................... 86

Tabela 16: Churn versus Ano de Inclusão - Absoluto ........................................................... 87

Tabela 17: Churn versus Ano de Inclusão - Percentual ......................................................... 87

Tabela 18: Churn versus Opcional - Absoluto ....................................................................... 88

Tabela 19: Churn versus Opcional - Percentual..................................................................... 89

Tabela 20: Churn versus Faixa Etária - Absoluto .................................................................. 89

Tabela 21: Churn versus Faixa Etária - Percentual ................................................................ 90

Tabela 22: Churn PSM por Sexo ........................................................................................... 94

Tabela 23: Churn PSM por Faixa Etária ................................................................................ 94

Tabela 24: Churn PSM por Safra de Entrada (Ano de Inclusão) ........................................... 95
10

Tabela 25: Churn PSM por Tipo de Plano ............................................................................. 95

Tabela 26: Churn PSM por Área de Rendimento .................................................................. 96

Tabela 27: Churn PSM por Segmento de Utilização ............................................................. 96

Tabela 28: Churn PSM por Estado Civil ............................................................................... 96

Tabela 29: Churn PSM por Flag de Atraso ............................................................................ 97

Tabela 30: Churn PSM por Tempo de Consulta, Tempo de Exame, e pelos Valores pagos da

penúltima e antepenúltima parcela......................................................................................... 97


11

RESUMO

Atualmente, as movimentações no mercado mostram que é mais lucrativo

para a empresa o investimento no relacionamento com o cliente, com foco na

retenção, do que optar por incrementos na carteira dos mesmos. Conhecendo-se os

riscos associados ao desligamento, empresas podem direcionar estratégias de

marketing na retenção de clientes com maiores chances de evasão. Adotando-se

práticas de relacionamento, é possível otimizar os resultados de marketing, pois é

possível focar em ações mais assertivas. O objetivo deste estudo será o de

desenvolver um modelo estatístico, que relacione variáveis transacionais,

demográficas e dados sobre o histórico de eventos, com a probabilidade de

cancelamento dos clientes assinantes; e definir o perfil dos clientes com maior risco

de cancelamento em planos de saúde. Para que seja possível focar os recursos na

retenção dos clientes mais valiosos, maximizando os resultados da corporação e a

satisfação do assinante. Em um segundo momento, com o objetivo de definir perfis

estratégicos de clientes, será proposta uma análise, através do PSM (Propensity

Score Matching), no intuito de comparar clientes com probabilidades semelhantes

de evasão. Por fim, serão propostas algumas sugestões de ações voltadas para a

empresa administradora do plano de saúde, e pesquisas futuras.

Palavras-chave:

Churn, Marketing de Relacionamento, Retenção de Clientes, Análise de

Regressão Logística, PSM


12

ABSTRACT

Nowadays, the drives on the market show that is more profitable for the

companies to invest in relationships with customers, decreasing retention rates than

choose to add new features to their portfolio. By knowing the risk associated with

shutdown, the companies can direct marketing strategies to retain customers in

areas of higher probability of evasion. Bringing up practices of relationship, they

can ptimize the results of their marketing efforts by focusing on correct solutions.

The purpose of this study is to develop a statistical model to link transactional and

demographic information with the probability of unsubscribing. Additionally, we

will determine the profile of customers with greater risk of unsubscribing in health

plans. On this basis, the marketing managers become able to cener efforts on the

retention of the most valuable customers, maximizing the results for the corporation

and the satisfaction of the customers. Besides, intending to establish strategic

profiles of customers, it will be offered an analysis using PSM, to compare

customers with similar probabilities. Finally, some suggestions of directed actions

to the company health plan administrator and of future researches are presented.

Keywords:

Churn, Relationship Marketing, Customer Retention, Logistic Regression,

PSM
13

GLOSSÁRIO

ATT Efeito médio do tratamento é a diferença do resultado esperado de


um indivíduo selecionado aleatoriamente, da subpopulação de
indivíduos tratamento e o resultado que este indivíduo teria caso
não tivesse se sido tratado.

CHURN Termo utilizado para denotar a evasão (desligamento) do cliente de


uma determinada empresa.

CRM Customer Relationship Management, em português, gerenciamento


do relacionamento com cliente.

CROSS SELLING Prática que visa a aproveitar as sinergias entre produtos. Colocam-
se, por exemplo, produtos complementares na mesma prateleira.

DATA MINING Processo de explorar grandes quantidades de dados à procura de


padrões consistentes, como regras de associação ou seqüências
temporais, para detectar relacionamentos sistemáticos entre
variáveis.

DATABASE Ferramenta do marketing que se utiliza das tecnologias da


MARKETING
informática para a segmentação de grupos de consumidores através
da análise do seu perfil e do desenvolvimento de ações dirigidas.

LTV Lifetime Value é o valor presente de todos os lucros e futuros


gerados pelo cliente, ao longo de sua vida de negócios com a
empresa

MARKET SHARE Participação no mercado. Quantifica em porcentagem a quantidade


do mercado dominado por uma empresa.

PSM Probabilidade condicional de receber um tratamento, dadas


algumas características a priori.
14

1 INTRODUÇÃO

1.1 CONTEXTUALIZAÇÃO

As estratégias de negócio mais difundidas atualmente se baseiam na idéia de

entender os anseios e as necessidades do consumidor. Apesar da aparente aceitação

da importância do cliente, as ações da maioria das empresas não correspondem a

esse fato. E isso não se deve necessariamente à falta de esforços ou recursos. Uma

das grandes dificuldades nas empresas é avaliar o impacto de seus investimentos de

marketing quando as estratégias de curto prazo, como corte o de custos e

promoções, começam a ser substituídas por um programa de relacionamento e

fidelização do cliente.

As estratégias de marketing atuais ainda se encontram baseadas, grande

parte, no conceito de “marketing de massa”, marketing este em que a empresa

produz, distribui e promove em massa um produto para todos os compradores.

Porém, tal conceito há muito tempo se revela inadequado para o novo cenário. O

marketing está passando por uma reavaliação intensa à luz de vastos desafios

globais, tecnológicos, econômicos e sociais enfrentados pelas empresas atuais. Os


15

mercados de massa estão fragmentando-se em pequenos mercados. Canais

múltiplos de distribuição estão substituindo canais únicos; consumidores estão

comprando diretamente através de catálogos, telemarketing e compra eletrônica;

preços com descontos e promoção de vendas estão em ascensão, prejudicando a

lealdade de marca; mídias convencionais de propaganda estão atingindo menor

número de consumidores potenciais e custando mais.

O aumento da competição, atualmente, motiva as empresas a passarem por

algumas metamorfoses que vão desde a adaptação dos produtos e serviços para

atender às necessidades de seus clientes, e estabelecer diferenciais, até mudanças

nos processos internos de gestão. Uma dessas mudanças acontece na área de

Marketing, com o surgimento nos últimos anos, do conceito de Marketing de

Relacionamento. Durante mais de uma década, o papel do marketing tem sido alvo

de constante atenção. Os gestores querem do marketing mais impacto na receita e

resultados mais imediatos.

O Marketing de Relacionamento representa um caminho para que o

marketing preserve sua posição estratégica, ajudando a empresa a crescer em um

ambiente competitivamente desafiador. Neste ambiente, os relacionamentos são os

únicos bens verdadeiros de uma empresa. São eles que fornecem à empresa

rendimentos a longo prazo, com baixo risco, viabilizando a permanência da mesma

no mercado.

Marketing de Relacionamento é como a empresa encontra, conhece,

mantém e garante ao seu cliente, que ele obtenha o que deseja e o que lhe foi

prometido em todos os aspectos do negócio (Bretzke, 2000). Caracteriza-se por

tentar conhecer o consumidor individualmente, corresponder aos seus anseios,


16

agregar novos valores, ou seja, fazer com que o cliente aumente seu consumo, e por

fim, criar um relacionamento duradouro e vantajoso para ambos durante toda uma

vida de parceria. Cumprindo esse papel, as empresas conseguem atingir e manter

um relacionamento com os clientes, induzindo a sua fidelização.

Diante do quadro atual, as empresas estão focadas em medir o retorno de

cada projeto, para investirem recursos que maximizem os resultados e lhes tragam

retorno tanto financeiro quanto na relação com o consumidor. Ao mesmo tempo,

pesquisas são realizadas para identificar os clientes com maior risco de

cancelamento (Churn), e atuar sobre eles com ações de retenção para reverter ou

impedir a perda destes clientes.

Segundo Reichheld (1996), as empresas podem aumentar seus lucros de

25% a 85% reduzindo seu Churn em 5%; e, segundo Kotler (2006), reter um cliente

custa entre quatro e oito vezes menos que adquirir um novo. Para reconhecer esses

clientes é preciso que a empresa tenha um Database Marketing bem estruturado,

que armazene o histórico de transações dos consumidores e os dados de cadastro

regularmente, mantendo a integridade das informações para monitorar

continuamente o comportamento dos clientes.

1.2 O VALOR DO CLIENTE

De acordo com Kumar (2004), programas voltados à retenção de clientes

devem analisar a viabilidade econômico-financeira de cada um dos clientes, de

acordo com o negócio da empresa. Para empresas que administram plano de saúde,
17

especificamente, é importante conhecer o perfil do consumidor de alto risco de

desligamento e identificar quais clientes têm maior probabilidade de serem perdidos

para permitir que a empresa priorize suas ações de retenção.

Os programas de relacionamento (CRM – Customer Relationship

Management) têm por objetivo aumentar o valor do cliente. Os clientes são

diferentes em seu valor para a empresa e em suas necessidades. Ignorar ou

desconhecer essas diferenças não os tornam iguais. O objetivo da diferenciação de

clientes é encontrar os clientes de maior valor (levando-se em conta o valor total

gasto pelo assinante ao longo do relacionamento) e os clientes de maior potencial

de se tornar Churn. O ideal para empresa é encontrar determinado grupo que tenha

alto valor para empresa e alto potencial a se tornar Churn. Esse grupo deverá

receber prioridade ação de retenção.

Não é fácil encontrar uma relação estreita, ou uma fórmula fechada, que

defina o valor de um cliente em qualquer negócio. Um cliente é visto e valorizado

diferentemente por diferentes segmentos de mercado. Por tudo isso, faz-se

necessário determinar, em cada negócio, formas objetivas de conhecer o valor de

cada cliente presente e no futuro.

Quando se fala de valor do cliente, deve-se procurar pensar em “Valor

Vitalício”, ou Lifetime Value (LTV), como sendo o valor de um cliente em toda sua

história transacional com a empresa, as referências que ele fez e que se

transformaram em vendas, entre outros. O LTV do cliente é definido por Gupta e

Lehmann (2004) como o valor presente de todos os lucros e futuros gerados pelo

cliente, ao longo de sua vida de negócios com a empresa.


18

Em administradoras de plano de saúde, deve-se buscar exprimir valor do

cliente em termos de lucratividade (receita paga subtraído pelo gasto de utilização).

Deve-se, não obstante, medir quanto cada cliente despendeu em suas transações

com a empresa, e quanto o mesmo pagou, decorrente do valor do seu o plano. De

um modo geral, a manutenção dos clientes mais valiosos torna a empresa mais

rentável. Gupta e Lehman (2004) indicam que também é preciso estimar por quanto

tempo um cliente permanecerá na base. Só assim seria possível medir o LTV

individualmente.

Administradoras de planos de saúde, por exemplo, procuram formas de

estimar o valor do cliente não pautando somente no valor de receita gasto por

cliente ao longo do relacionamento. A sua disposição ao desligamento, ou a

propensão a se tornar Churn é uma das soluções possíveis de serem adotadas para

medir a eficiência de um programa de relacionamento. E é nesse aspecto de

propensão ao Churn, que esse estudo se concentrará.

Estimando a probabilidade de cancelamento do plano de saúde (ou

simplesmente Churn), consegue-se medir o risco da perda de cada cliente, sendo

assim possível identificar os perfis de clientes que cancelam o contrato. Em outras

palavras, é possível calcular um valor de Churn do cliente e classificá-los de acordo

com esse Escore. Associando esse valor de Churn aos melhores clientes, a

administradora de planos de saúde poderá fazer ou não esforço para manter esse

mesmo indivíduo (titular no domicílio) em sua carteira, bastando associar seu

Escore de Churn ao seu dispêndio. Estratégias de CRM, como essa citada, podem

ser traçadas no intuito de rentabilizar os clientes.


19

1.3 O PLANO DE SAÚDE E SUA IMPORTÂNCIA

De acordo com a ANS – Agência Nacional de Saúde Suplementar (2003), o

cenário que vem delineando o mercado de saúde privada no Brasil, apresentado na

Figura 1, evidencia uma expectativa de expansão considerável da demanda da

população idosa para os próximos dez anos.

Figura 1: Nº de Beneficiários em plano de saúde privado no Brasil por Idade


Fonte: ANS (2003)

0 a 17 anos 9.768.844

18 a 29 anos 8.388.008

30 a 39 anos 6.718.887

40 a 49 anos 5.552.466

50 a 59 anos 3.477.376

60 a 69 anos 1.999.087

70 ou mais 1.884.083

Total de Benefeciários 37.788.751

0 5.000.000 10.000.000 15.000.000 20.000.000 25.000.000 30.000.000 35.000.000

Essa expectativa elevada da demanda da população idosa no mercado

privado de saúde, segundo a ANS (2003), terá reflexos nos anos subseqüentes, pois

haverá uma maior utilização dos serviços de assistência à saúde. Os gastos com

saúde irão se elevar e com a evolução do tratamento médico, as pessoas terão maior

tempo de vida.

A população brasileira viverá mais. Estima-se que a expectativa de vida da

população brasileira atingirá a faixa de 80 anos em 2050, de acordo com o

levantamento do IBGE (2004). Os avanços da medicina e a melhoria nas condições


20

de vida serão os principais protagonistas deste aumento da perspectiva de vida. O

envelhecimento da população é uma preocupação para todas as operadoras de

planos de saúde, que contarão com um contingente maior de clientes idosos. A

pergunta que se impõe é: As empresas atenderão todas as exigências de garantia aos

serviços contratados?

O mercado está preparado para absorver esses clientes que compram

serviços com a finalidade de garantir a assistência à saúde, tecnologia, qualidade,

acesso à rede de serviços, assistência médica, hospitalar, ambulatorial, odontológica

e todos os serviços cobertos pelo contrato celebrado entre as partes operadora e

clientes?

Quando os clientes estabelecem contratos de planos de saúde, de certa

forma, elas deixam de estar sujeitas à referida restrição orçamentária, uma vez que,

supostamente, deixam de arcar com as despesas totais com a saúde privada. Em

outras palavras, ao assinar um plano de saúde, o indivíduo espera obter um gasto

médio mensal inferior ao gasto que ele teria, se não tivesse o plano e precisasse

recorrer à rede privada de saúde.

Clientes assinam planos de saúde para se prevenirem contra os riscos de

saúde. A existência de um pagador, a operadora, que muda a demanda por estes

serviços, potencialmente afeta os incentivos do provedor destes serviços. Os

incentivos à sobre-utilização de serviços de saúde estão presentes na relação

paciente-prestador de serviços e na relação contratual entre a operadora e o

prestador de serviços. Esta sobre-utilização é incorporada pela operadora no cálculo

dos gastos esperados, determinando a elevação no valor do prêmio e,


21

conseqüentemente, nos gastos totais com saúde. Este aumento, por seu turno, eleva

a probabilidade do Churn.

1.4 ESTRUTURA DA DISSERTAÇÃO

1.4.1 Sobre o Estudo

Iniciou-se esse estudo com o primeiro Capítulo de Introdução, onde se

descreveu sobre o tema proposto. A seguir, no Capítulo 2 é apresentado o objetivo e

a relevância deste trabalho, dentro da estrutura de Sistemas de Apoio à Decisão. Na

sequência, apresenta-se o Capítulo 3, contendo o referencial teórico fundamentado

nas abordagens de Marketing de Relacionamento, seus conceitos essenciais e

aspectos mais relevantes. Nos Capítulos 4 e 5, é apresentado a metodologia da

pesquisa, assim como a coleta e a manipulação das informações. No Capítulo 6 são

descritos os resultados encontrados, interpretados segundo a metodologia exposta

no Capítulo anterior. E por fim, no Capítulo 7 relata as conclusões deste trabalho de

dissertação, assim como algumas recomendações de pesquisa.

1.4.2 Sobre o Banco de Dados

O banco de dados utilizado nesse estudo pertence a uma grande operadora

de planos de saúde no Estado do Rio de Janeiro. Para a obtenção das análises finais,

precisaram-se efetuar alguns filtros até que chegasse à base final. Entre os filtros, o
22

principal deles foi o de só selecionar clientes (ativos ou inativos) que começaram a

usar o plano de saúde dessa operadora a partir de 1999. No capitulo 4, há um maior

detalhamento das motivações desse filtro para o estudo. A base final utilizada

continha 130.552 assinaturas (domicílios), sendo 63.849 (48,9%) domicílios ativos

no plano de saúde e 66.703 (51,1%) domicílios inativos no plano.

Além da variável principal, que distingue se um cliente é Ativo ou não

(Churn ou não), outras variáveis importantes foram consideradas. Para serem

consideradas no estudo, primeiramente se fez um levantamento empírico das

informações contidas no banco de dados até a data de 31/07/2007 (última data

disponível de atualização do banco).

Para melhor identificação do modelo, algumas informações precisaram ser

codificadas e recodificadas. No Anexo 1, algumas dessas variáveis estão

especificadas. Outras serão mais bem descritas ao longo dos capítulos.

Abaixo, seguem as variáveis analisadas, separadas por natureza

Demográfica, Geográfica, Cadastral e Transacional:


23

Tabela 1: Descrição das Variáveis, presente no banco de dados


Fonte: Elaboração Própria

Nos 130.552 clientes analisados, clientes que possuíam planos individuais

(com ou sem dependentes), as variáveis significativas consideradas para determinar

a propensão a Churn, no modelo de Regressão Logística, foram treze ao todo (em

ordem de importância): Tempo de Exame, Segmento de Utilização, Flag de Atraso,

Tempo de Consulta, Ano de Inclusão, Valor T3, Faixa Etária, Área de Rendimento,

Valor T2, Rede de Produto, Flag de Opcional, Sexo e Estado Civil.

A tabela de classificação mostrou que a taxa de acerto geral do modelo de

Regressão Logística é acima de 85%, e que as taxas de acerto dos grupos

individuais são altas e indicam uma consistência na previsão de qualquer um dos


24

dois grupos. O grupo que cancela plano de saúde apresentou taxa de acerto acima

de 80%, enquanto o grupo que não cancela, tem taxa de acerto acima de 90%. Esses

números (mais explicitados nos capítulos posteriores), em primeira instância,

corroboram com a utilização dos modelos de Regressão Logística para se estimar a

probabilidade de um cliente se tornar Inativo.


25

2 OBJETIVOS E RELEVÂNCIA

2.1 OBJETIVOS

Existem diversos trabalhos focados na análise de retenção, principalmente

no contexto das empresas de telecomunicações. Ao contrário, a pesquisa, efetuada

para fundamentar o presente estudo, não encontrou artigos que abordassem uma

análise detalhada sobre Churn para empresas que administram planos de saúde.

Apoiados na base de dados de uma empresa do segmento de plano de saúde,

presente no Rio de Janeiro, são dois os objetivos principais deste estudo:

- Desenvolver um modelo probabilístico de Regressão Logística que

determine a probabilidade de clientes, desse plano de saúde, se tornar Churn e

traçar consequentemente o perfil dos assinantes com maior risco de desligamento.

- Desenvolver um PSM (Propensity Score Matching) para ordenar e delinear

os assinantes de acordo com seu perfil e sua Probabilidade de Churn, e propiciar a

proposição de ações de retenção que aumentem a lucratividade da carteira de

assinantes da empresa.
26

O perfil de um grupo é definido através das informações sócio-

demográficas, de atitude, e de comportamento. Portanto, faz-se necessário definir as

variáveis que influenciam o comportamento de compra do consumidor e,

consequentemente, as que ajudam a descrever o grupo que cancela o plano de saúde

e o grupo contrário. Apesar de nem todas as variáveis julgadas relevantes estarem

disponíveis no banco de dados da empresa analisada, é necessário estudá-las, para

observar possíveis valores que possam distorcer os modelos finais. Uma limitação

deste estudo é que nem todas as variáveis levantadas no modelo teórico puderam

ser aplicadas no modelo final ajustado, devido a algumas restrições explicadas mais

adiante.

Uma pergunta que esse estudo se propõe a responder seria: é possível definir

o perfil do cliente que cancela seu contrato de plano de saúde?

A técnica estatística utilizada para indicar o risco de cancelamento dos

assinantes destes planos é a Regressão Logística, que determina a probabilidade de

uma assinatura (contrato) pertencer ao grupo dos que cancelam ou ao grupo dos que

não cancelam planos de saúde. Adiante, será usada a metodologia de Propensity

Score Matching (ou, Escore de Propensão) para agrupar os clientes com maior

probabilidade de se tornar Churn.

Ao se traçar o perfil dos clientes com risco de cancelamento, torna-se

possível atuar sobre eles através de ações de retenção, que revertam à perda desses

clientes. Além dos objetivos principais, de definir o perfil do cliente propenso ao

cancelamento do contrato do plano de saúde, e agrupá-los através do seu Escore e

seus perfis, esse estudo busca ainda atingir alguns objetivos secundários:
27

a. Fazer uma revisão de literatura para construir o entendimento dos

conceitos relacionados ao Churn de clientes;

b. Medir o risco de cancelamento de cada cliente, que nada mais é do

que a probabilidade ou (Escore de propensão) de cancelamento do contrato;

c. Identificar as variáveis que explicam o perfil do cliente que se desliga

do plano de saúde;

d. Classificar os clientes em grupos relevantes para ações de marketing:

2.2 RELEVÂNCIA

“Relacionamento duradouro” é uma das expressões mais procurada pelos

empreendedores (Kumar, 2004), ou seja, conhecer o usuário e possuir alternativas

de soluções para se chegar até ele. Esse tipo de iniciativa, cujo objetivo é

aperfeiçoar os canais de atendimento, representa apenas um dos elementos que

compõem uma política de CRM (Customer Relationship Marketing). Entretanto, os

benefícios do CRM não se limitam à conquista e à retenção de clientes. Eles

também se traduzem em redução de custos e aumento da receita média por

assinante. Com a utilização desse conceito, a companhia economiza, porque foca no

alvo certo evitando estratégias erradas e reduzindo a possibilidade de erro na

implementação de ações voltadas aos clientes.

Após a descoberta dos clientes de maior potencial a ser tornarem inativos, o

próximo passo é incentivá-los a interagir com a empresa. A interação é a única

forma de conhecer cada vez mais os clientes. O objetivo final é desenvolver uma
28

relação de aprendizado, onde cada vez mais os serviços e produtos são

personalizados para o cliente que verá conveniência em continuar fiel à empresa.

Os resultados deste estudo podem contribuir para a tomada de decisão em

ações de Marketing, com o objetivo de reter e rentabilizar os indivíduos.

Conhecendo os riscos de cancelamento da base de assinantes (Churn), a

companhia administradora de plano de saúde pode direcionar ações efetivas de

rentabilização, para o público com alta propensão de desligamento, com perfil

similar ao daqueles que se desligaram. Em vez de aplicar suas ações para grupos de

clientes, cujos riscos de saída são baixos, ou ainda que possuam alto risco, mas não

o perfil totalmente adequado à empresa (clientes que possam ter relacionamento

duradouro).

Assim, qualquer organização pode otimizar seu investimento em marketing.

Quando uma empresa aumenta sua taxa de retenção de clientes, aumenta a chance

de reduzir despesas de marketing e vendas, visando à expansão da base de clientes.

Consequentemente é possível obter lucratividade pelo incremento do tempo de

permanência dos seus clientes atuais.


29

3 REVISÃO DE LITERATURA

É possível fazer crescer as empresas de três maneiras, como sugere

Reichheld (1996): diminuindo o percentual de perda de clientes, atraindo novos

consumidores e fazendo mais negócios com seus consumidores. Quanto maior o

tempo durante o qual uma empresa retém seu cliente, maior é o lucro gerado por ele

(Reichheld, 1996). Provavelmente, as empresas não conseguem eliminar todos os

cancelamentos – e não devem tentar – embora, elas possam e devam reduzi-los.

Com vínculos mais enraizados, é possível cobrar mais pelo uso de seus produtos e

serviços.

Vavra (1993) descreve as razões mais comuns que levam o cliente a

abandonar uma empresa:

a. Insatisfação com o produto, entrega, instalação, serviços ou os preços;.

b. Reclamações ignoradas, minimizadas ou mal solucionadas;.

c. Descontentamento com mudanças de preço, políticas ou vendedores;.

d. Insatisfação com o tratamento ou falta de cortesia;.

e. Novos funcionários ou novas políticas da empresa;.

f. Aceitação de uma oferta do concorrente.


30

Uma pesquisa rápida (utilizando sites de busca) através das universidades

européias, americanas e até brasileiras, mostra que Marketing de Relacionamento é

amplamente difundido na literatura acadêmica. A questão da implementação do

CRM é amplamente divulgada através de publicações acadêmicas e

mercadológicas. E suas aplicações são descobertas em diversos segmentos de

mercado tais como implementação de CRM em Telecomunicações, setores do

Varejo, Indústria, Bancos e Instituições Financeiras entre outras.

Pode-se ter uma visão do CRM como um conjunto de estratégias

quantitativas e qualitativas empresariais inovadoras utilizadas para obter benefícios

e vantagens competitivas, gerando maiores lucros e adquirindo um maior nível de

retenção dos clientes. Essa definição é corroborada por Gupta e Lehman (2004). A

evolução do mercado levou à necessidade de uma evolução do marketing em

direção ao marketing de relacionamento e a fidelização dos clientes.

É importante, para melhor entendimento, deste estudo, conceituar alguns

pontos no Marketing de relacionamento tais como Fidelização, Retenção, e

principalmente Churn.

3.1 MARKETING DE RELACIONAMENTO E RETENÇÃO

Para grande parte das organizações, as últimas tendências no Marketing

apontam para a estratégia de busca de relações duradouras com os clientes. Vários

autores têm-se preocupado com esta questão e com freqüência recomendam que as

empresas procurem uma estratégia de mercado focada no relacionamento de longo


31

prazo. Kotler e Armstrong (1995) recomendam que seja dado um cuidado todo

especial à perda de clientes. As perdas de clientes trazem grandes prejuízos às

organizações e exigem medidas para reduzir o índice de deserção.

As empresas devem modificar suas estratégias para se adaptar ao novo

ambiente competitivo. Devem trocar a gestão de produtos pela gestão de clientes.

Além de repetirem a compra, clientes satisfeitos falam favoravelmente da empresa

(Berry e Parasuraman, 1992), são menos sensíveis a preço (Bateson e Hoffman,

2001), são propensos a permanecerem leais por mais tempo a despeito de ofertas

competitivas atraentes (Loverlock e Wright, 2001) e custam menos para serem

mantidos (Kotler, 2006).

Diante da acirrada concorrência, as empresas têm o desafio de reter seus

clientes ativos. Surge então a idéia de Marketing de Relacionamento como uma

alternativa ao Marketing de massa. O objetivo é desenvolver uma relação individual

com os clientes e desenvolver com eles um relacionamento duradouro.

Cada vez mais as empresas têm se preocupado em crescer de maneira

sustentável e as ações de médio e longo prazo têm passado a fazer parte da agenda.

As empresas que conseguem manter relacionamentos com os seus mais valiosos

clientes possuem uma vantagem competitiva. Diante deste cenário, houve profunda

mudança no conceito que aborda o marketing transacional (venda como único fim),

para o marketing relacional (relacionamentos de longo prazo). Além disso, as

profundas mudanças que ocorrem no comportamento do consumidor fazem

aumentar a exigência dos clientes e influenciam transformações na administração

de marketing.
32

Existem cinco níveis diferentes de abordagens de marketing segundo Kotler

(2006):

a. Marketing Básico: o vendedor simplesmente vende o produto;.

b. Marketing Reativo: o vendedor vende o produto e encoraja o cliente a

contatar em caso de dúvidas, comentários e queixas;

c. Marketing Responsável: o vendedor contata o cliente após a venda e

verifica o atendimento de expectativas, investiga decepções e pede sugestões de

melhoria; as informações obtidas auxiliam a empresa a melhorar seu desempenho;.

d. Marketing Pró-ativo: o vendedor entra em contato com o cliente de

forma regular para falar de melhorias na utilização dos produtos ou de novos

produtos; e.

e. Marketing de Parceria: a empresa trabalha continuamente com o

cliente buscando formas de melhorar seu desempenho.

Peppers e Rogers (2001) definem Marketing de Relacionamento como

marketing one to one, estabelecendo-o como uma estratégia voltada ao

entendimento e à antecipação das necessidades dos clientes atuais e potenciais de

uma empresa, utilizando o auxílio da Tecnologia da Informação. Segundo Peppers

e Rogers (2001), o resultado final do Marketing de Relacionamento é a construção

de um ativo exclusivo da empresa denominado Rede de Relacionamentos. Esta rede

consiste em ter boas relações com todos os envolvidos no negócio da empresa e que

fazem contato com ela, sejam clientes, fornecedores ou intermediários.

Segundo Kotler e Armstrong (1995), o Marketing de Relacionamento é

baseado na idéia de estabelecer uma relação de aprendizado com os consumidores


33

procurando aumentar sua satisfação e minimizar qualquer problema de

atendimento.

Para a construção de relacionamentos com o cliente, as empresas devem

entender as mudanças no comportamento do consumidor ao longo do tempo e

precisam aprender em cada interação, personalizando os contatos e fortalecendo o

vínculo entre o cliente e a empresa. O acesso à informação sobre o consumidor é

um aspecto fundamental no relacionamento com o cliente. Apesar disso, este

relacionamento não pode estar baseado apenas no ‘database marketing’.

“Reter clientes é uma ótima maneira de crescer. Estudos

mostram que o preço para adquirir novos clientes é cinco

vezes maior do que o custo para reter clientes antigos”.

(McKenna, 1993)

É de grande importância acompanhar os clientes atuais. Na área de seguros,

segundo a Life Insurance Marketing and Research Association nº 23 pag.3, 2006

(http:/ http://www.sitenarede.com/mentalidade/marketing/), os segurados mais

antigos têm 50% mais chances de manter suas contas ativas do que os recém-

chegados. Corretores que se mantêm em contato com seus melhores clientes fazem

novos negócios e têm menores probabilidades de fracassarem em suas tentativas de

vendas cruzadas.

Quanto mais antiga a relação com o cliente, melhor. O mundo atual oferece

inúmeras opções aos clientes. Clientes fiéis por muitos anos são mais propensos a

recomendar a organização que os serve à família e aos amigos.


34

3.2 MARKETING DE RELACIONAMENTO E FIDELIZAÇÃO

Fidelidade, de acordo com Loverlock e Wright (2001), “é a decisão

voluntária de um cliente de continuar prestigiando uma empresa específica durante

um período prolongado”. Essa fidelidade, entretanto, não pode ser garantida, uma

vez que o cliente continuará fiel à empresa apenas enquanto acreditar receber valor

melhor do que poderá obter pela troca para outro fornecedor.

A fidelização é construída sobre os alicerces do relacionamento e da

confiança mútua, que se pode utilizar ou não de programa de recompensas. Quando

se coloca para a empresa a questão do gerenciamento do relacionamento com o

cliente, não se está sugerindo mecanismos de estímulo-resposta e sim, maneiras de

compreender em profundidade as características, hábitos, desejos, necessidades e

potencialidades do cliente; com o objetivo de se desenvolver ações voltadas ao

fortalecimento dos vínculos de relacionamento, “encantá-lo” e motivá-lo a manter-

se fiel ao seu negócio.

Diante desse quadro de competitividade, não é mais admissível que a

empresa fique à margem do que acontece com os seus clientes em geral e com cada

grupo de clientes, em particular. Ignorar o cliente, desconhecer as causas de seu

comportamento e deixar de monitorar o seu relacionamento com a empresa é

candidatar-se à obsolescência. Muitas empresas gastam fortunas tentando escrever

sua missão. É preciso ficar claro que a principal missão da empresa é interferir na

decisão do cliente em tornar-se fiel.


35

Se a empresa desapontar o cliente ou se um concorrente oferecer valor

significativamente melhor, existe a possibilidade de deserção do cliente, ou seja, a

transferência da lealdade a outra empresa (Sabatino, 2003). De acordo com

Sabatino (2003), o processo de fidelização “é caracterizado pelo ato ou pela

vontade de um cliente investir tempo e dinheiro para construir um relacionamento

com uma organização”.

3.3 MARKETING DE RELACIONAMENTO E CHURN

Uma das perguntas mais freqüentes no contexto de Marketing de

Relacionamento é: como se define o Churn?

Churn, objeto principal deste estudo, trata da perda de clientes sofrida por

uma empresa para a concorrência, ou pelo simples cancelamento do contrato (no

caso, plano de saúde). Ou seja, é um conceito inverso à retenção dos clientes. Este é

o conceito que está mais em pauta entre as empresas de serviços. Um exemplo

muito conhecido é o setor de telecomunicações, onde estudos e ações voltadas para

diminuir esses índices de perda na carteira de clientes estão muito mais avançados.

Outros setores da economia também têm que administrar o Churn de clientes

através de ações de marketing direto. Os bancos e as administradoras de cartão de

crédito são dois exemplos bem conhecidos.

Até pouco tempo atrás, a cultura das empresas era “conquistar o cliente a

qualquer preço”. Atualmente, a cultura é “reter o cliente” e, claro, conquistar o bom


36

cliente. Conquistar um cliente do tipo alta-rotatividade, com propensão compulsiva

ao Churn pode não ser um bom negócio; melhor deixá-lo com a concorrência.

Segundo Pinto (1997), existem três tipos de Churn: involuntário, voluntário

e inevitável.

a. Involuntário - quando o usuário torna-se incapaz de pagar pelo serviço

e tem seu fornecimento cancelado. Os motivos pelos quais o cliente deixa de pagar

podem ser os mais diversos, como desemprego e falta de capital suficiente para se

manter, entre outros.

b. Voluntário - quando o cliente decide mudar de fornecedor, seduzido

por campanhas de marketing e/ou promoções.

c. Inevitável - quando o usuário vem a falecer ou muda-se para uma

localidade não atendida pelo fornecedor.

Já se tem fixado na mente dos empreendedores, que o custo para se manter

um cliente é muito menor que o de se conquistar um novo cliente. É crescente o uso

de ferramentas de mineração de dados, além de técnicas estatísticas multivariadas,

objetivando o melhor acerto estratégico de retenção dos clientes. Neste estudo,

especificamente, será empregada a técnica estatística de Modelagem Logística

(descrita no Capítulo 5). Estas ferramentas permitem que se analise o banco de

dados com informações do perfil histórico de cada usuário e que se determinem

quais clientes são “fiéis”, quem tem mais propensão ao Churn, quais são

dispensáveis e quem realmente está considerado no alto valor para a empresa.


37

Com base nessas informações de clientes, a empresa toma atitudes não só

reativas, em relação aos clientes, que desistiram do serviço, mas, principalmente,

ações pró-ativas, ao identificar os bons clientes e selecionar planos especiais para

garantir sua fidelização. Evitando, com isso, a evasão dos indivíduos que agregam

alto valor para a mesma. Não se pode assumir automaticamente que uma taxa de

Churn alta é ruim ou uma taxa de Churn baixa é boa. Em mercados altamente

competitivos ou em transição, quando se deseja manter uma participação elevada na

publicidade, o Churn alto pode ser o custo de tal estratégia.

O baixo percentual de Churn também deve ser considerado no contexto

estratégico. É lucrativo, mas pode significar pouca agressividade de marketing,

revelando-se (ou não) prejudicial em longo prazo, já que tende a inibir a entrada de

novos consumidores para cobrir os cancelamentos naturais ao longo do tempo.

Atualmente, a análise de Churn tem-se tornado um desafio para empresas de

vários ramos. Porém, poucas reconhecem suas reais implicações. Quando se diz que

a taxa de Churn de uma empresa varia de 25% a 30% anualmente, deseja-se

realmente dizer que essa empresa está perdendo de 25% a 30% dos clientes que se

encontram na sua base de dados. Isso significa que ela está perdendo clientes que

fazem ou já fizeram negócios com ela e que, por algum motivo, não ficaram

satisfeitos e se evadiram de sua base de dados.

Hoje, a palavra é relacionamento. Antigamente, o atendimento se resumia,

apenas, na recepção ao cliente. Esse tipo de iniciativa, cujo objetivo é aperfeiçoar

os canais de atendimento, representa apenas um dos elementos que compõem uma

política de CRM. Predizer que é provável que clientes saiam e persuadir os


38

"Churners" a permanecerem é empreendimento extremamente difícil para a maioria

das companhias. A dificuldade se deve geralmente pela falta de informação de

perfil de assinantes propícios a se desligarem do plano.

Com isso, modelos preditivos começam a serem mais difundidos. Suas

construções se baseiam em um grupo de variáveis, que, por conhecimento prévio do

negócio ou estudo específico, demonstram ser relevantes para explicação do evento

que se deseja prever. É um modelo baseado no comportamento do cliente, que

exibe a probabilidade de abandono e o valor que o cliente representa para empresa.

Com esses dados, a operadora pode fazer uma campanha de retenção com uma

perda de recursos muito pequena, além de exigir investimentos menores nessa ação.

Segundo Hosmer e Lemeshow (2000), o principal objetivo dos modelos

preditivos é atribuir, para cada variável, coeficientes (ou pesos) que estão

relacionados ao poder que cada variável possui de explicar o evento em questão.

Variáveis muito importantes para a conclusão do modelo devem receber os maiores

pesos, enquanto que as mais secundárias receberão pesos inferiores.

A análise de Churn tem que ser detalhada o suficiente para descobrir as

variáveis que fazem com que esses clientes insatisfeitos evadam-se e o porquê da

insatisfação. Outro ponto é que muitos desses clientes são clientes que têm um

grande potencial de gasto com a empresa. Portanto, são clientes valiosos que a

empresa está perdendo e que, provavelmente, nunca voltarão. “Uma análise

detalhada de Churn, permite às empresas determinarem aqueles clientes que

apresentam um comportamento que indica que eles podem se tornar “Churn” e

quais desses merecem uma atenção especial” (Cister e Ebecken, 2002).


39

As informações, descritas numa investigação aprofundada dos clientes,

contribuem para que as empresas melhorem os seus programas de fidelização dos

clientes e reduzam os seus custos em marketing, em um contexto de queda no

crescimento do mercado e a alta competitividade.


40

4 O CONTEXTO DA PESQUISA

4.1 PLANOS PRIVADOS DE ASSISTÊNCIA À SAÚDE

Os Planos Privados de Assistência à Saúde no Brasil são muito distintos em

dois instantes de tempo. Em virtude da regulamentação da Lei nº 9.656, publicada

em 3 de Junho de 1998, alterada através da Medida Provisória nº 2.177-44 em 24 de

Agosto de 2001, as operadoras de plano de saúde criaram novas categorias de

planos de saúde, mais adequados aos seus custos.

A Lei n.º 9.656, de 3 de junho de 1998, define através da ANS, como

operadoras de planos de assistência à saúde, empresas e entidades que operam, no

mercado de saúde suplementar, planos de assistência à saúde. Os planos privados

de assistência à saúde seguem as diretrizes estabelecidas na Lei nº 9.656/98.

Determinadas características, como a modalidade da contratação, a data da

assinatura do plano, a cobertura assistencial e a abrangência geográfica, fazem com

que os planos se diferenciem.


41

Através dessa medida provisória, muitos procedimentos que não eram

cobertos passaram a ser obrigatórios, tais como implantes de próteses, consultas

sem limite, transplantes de órgãos, internação durante 365 dias/ano, entre outros.

A partir da aprovação desta lei, as operadoras de plano de saúde privados

passaram a elaborar um trabalho de reestruturação de planos e convencimento com

seus assinantes. Não era vantajoso para as operadoras permanecerem com clientes

assinantes de planos nos antigos moldes. Em contrapartida, não era obrigatório, por

parte dos assinantes, tais mudanças para o novo modelo. Na verdade, a migração

dos planos para nova lei poderia ser vantajosa, entretanto, acarretaria em um

aumento no prêmio.

Entretanto, para o detentor titular do plano de saúde, não era

necessariamente vantagem à mudança para os novos planos regulamentados,

principalmente pelo acréscimo no valor da mensalidade dos novos planos. Baseado

nisso, esse estudo se propõe investigar somente os assinantes cujo plano de saúde se

inicia a partir do ano de 1999.

O filtro na base de dados original do estudo é justificado de acordo com a

pauta desse estudo, que visa caracterizar clientes e suas possíveis chances de se

tornar Churn. Visto isso, os planos vigentes e criados antes de 1999 são

caracterizados por possuírem indivíduos, ou titulares nos domicílios, mais idosos e

consequentemente menos propensos ao Churn. Pois esses mesmos planos,

adquiridos antes de 1999 trazem benefícios improváveis de serem conquistados

novamente.
42

Como dito anteriormente, a proposta deste trabalho é estudar a carteira de

assinantes de plano de saúde de uma administradora no Rio de Janeiro, filtrando

apenas para os planos individuais (com ou sem dependentes).

4.2 DATABASE MARKETING

O Database Marketing tem permitido que grandes companhias identifiquem

e analisem segmentos de consumidores na mineração de informações importantes

que possam ser usadas para o crescimento do impacto de campanhas de marketing.

Empresas que estão descobrindo o potencial do Database Marketing para

ajudá-las a construir um relacionamento mais forte com seus clientes. O processo

de criação do banco de dados combina esses conjuntos de dados em registros de

Marketing utilizáveis.

“Database Marketing é uma coleção de dados inter-

relacionados de clientes e transações que permite a oportuna

busca ou uso daquelas informações para transformá-las em

oportunidades de mercado. Em outras palavras, você pode

utilizá-lo para segmentar lista de clientes ou de prospects

(possíveis clientes), identificar e prever tendências de compra,

e personalizar as suas comunicações de Marketing para estes

clientes ou prospects, de modo a assegurar o maior índice

possível de resposta”.(Kotler, 2006)


43

O Database Marketing funciona com igual eficiência no trabalho do

Marketing direto junto a empresas e a consumidores. E o foco de suas atividades

inclui:

- descobrir quem está comprando um produto ou serviço, para que se possa

identificar e alcançar mais prospects (clientes em potencial) como eles;

- aumentar a freqüência de compra dos usuários menos ativos;

- estender um tratamento especial aos usuários mais ativos e reativar antigos

clientes;

- identificar oportunidades para novos produtos, serviços e negócios;

- acompanhar a eficiência de custos do trabalho de propaganda em longo

prazo, através da medição das compras repetidas, feitas por clientes recém-

conquistados;

- proteger a base de clientes por meio de reações oportunas às promoções e

concorrência.

Um dos pilares para o sucesso em marketing de relacionamento está na

identificação de um grande número de segmentos específicos e homogêneos de

clientes, correntes ou prospects, sobre os quais atuarem.

Para identificação desses clientes propensos ao Churn serão verificadas

informações presentes no Database. Serão consideradas as informações cadastrais,

demográficas, geográficas e transacionais, as quais possam ser utilizadas para a

estimação dos modelos aqui propostos. Cada tipo de informação possui sua

importância e relevância:
44

- Demográficas: associadas ao plano contratado, informando o perfil de

idade, sexo entre outros;

- Cadastrais: que segundo Kotler (2006) são os meios mais comuns de se

distinguir grupos de clientes pela relação explicativa em necessidades, desejos e

preferências dos consumidores;

- Geográficas: no que se refere à distinção de bairros e áreas de

planejamento geográfico;

- E finalmente, Transacionais: pois experiências com Database Marketing

permitidas pelo avanço da tecnologia mostram que esta, sem dúvida, é uma grande

fonte de informação na identificação de padrões de relacionamento implícitos.

As variáveis cadastrais, demográficas e de localização são importantes para

a gestão eficiente de uma empresa, seja pela análise do potencial de mercado ou

pela segmentação da base de clientes atuais ou potenciais. Isto contribui para o

planejamento e a projeção de respostas a campanhas ou projeções de tendências. O

comportamento de um cliente pode variar profundamente em termos de geografia e

isso pode levar uma empresa a adotar estratégias diferentes de acordo com a região

onde se encontram seus clientes e seus prospects. Como destaca Kotler (2006),

clientes com perfis demográficos distintos precisam ter campanhas de marketing

próprias para obtenção de melhores resultados.

As transações são de grande importância para a geração de valor de uma

organização. Segundo Kumar (2004), entende-se por transação qualquer interação

do cliente com uma empresa que pode ser classificada em termos de canal de
45

contato, forma de pagamento, tipo de produto adquirido e tempo de relacionamento,

que explicarão o valor financeiro que cada consumidor gera ao longo do tempo.

Os consumidores possuem comportamentos desiguais e expressam essa

diversidade através de transações diferentes, que geram custos maiores ou menores

para a empresa e impactam de maneira distinta na geração de caixa de uma

companhia. Um cliente pode gerar mais valor do que outro de acordo com a forma

que interage com a empresa. O uso de informações transacionais dos clientes para

guiar as decisões de marketing deve ser adotado por todas as empresas. Para

redirecionar seus esforços e obter maior efetividade nas ações estratégicas da

empresa com o objetivo de aumentar a rentabilidade dos clientes, alavancando os

fluxos de caixa da organização, através da redução dos custos de transação ou pelo

aumento do faturamento de cada cliente.

4.3 COLETA DAS INFORMAÇÕES

A coleta de informações foi realizada inicialmente através de pesquisa

bibliográfica em livros e revistas conceituadas, dissertações, artigos e periódicos.

Em um segundo momento, foi feito um aprofundamento nos dados fornecidos pela

empresa, operadora de plano de saúde, no que diz respeito às variáveis

demográficas, geográficas e transacionais.

As variáveis selecionadas estavam pré-definidas no banco de dados. Assim,

variáveis consideradas importantes, a priori para se obter o perfil dos clientes,

foram desconsideradas, como por exemplo: variáveis indicadoras de satisfação com


46

o serviço e com os planos, variáveis de veiculação a outro plano anteriormente a

entrada no plano, entre outras.

A Tabela 1 anteriormente, descreveu as variáveis existentes no banco de

dados. Outra restrição é a procura por trabalhos que utilizam Modelos de Regressão

Logística para prever o Churn (risco de cancelamento de clientes). Não se encontra

em nossa literatura trabalhos que abordem tais técnicas conjuntamente. A definição

de Churn não está muito bem difundida nas publicações nacionais. Além disso, não

foram encontrados trabalhos que utilizassem a metodologia de Matching para

classificar os clientes com maiores chances de cancelarem os planos. Por fim, deve-

se notar que o modelo definido e analisado tem características específicas e não é

recomendável sua total transposição para bancos de dados de empresas similares.

4.4 MANIPULAÇÃO E TRATAMENTO DOS DADOS

Foram analisados contratos vigentes entre Agosto de 2006 a Julho de 2007.

A base de dados da administradora de planos de saúde possui todas as informações

dos clientes ativos e inativos, a partir de 1999.

Lu (2001) propõe que consumidores com menos de três meses de

relacionamento sejam excluídos da análise, em função do baixo tempo de

relacionamento. Devido à atuação do Marketing de Relacionamento da empresa

concentrar-se no Estado do Rio de Janeiro, somente clientes residentes neste Estado

foram considerados.
47

Outra seleção dos dados, como registrado na Tabela 2 a seguir, trata da

exclusão de clientes, com data de inclusão anterior a 1999, tendo em vista a

diferente legislação que regulamenta os planos de saúde anteriores a esta data.

E por fim, faz-se necessário o uso do filtro, talvez o mais importante de

todos, de exclusão dos assegurados por contratos empresariais, uma vez que quem

determina a permanência ou não no plano não é o cliente, e sim o empregador.

Utilizando-se dos filtros, anteriormente propostos, e considerando-se

somente domicílios, obtive-se um total 130.552 clientes dentre ativos e inativos,

com data base final de Julho de 2007.

Depois desse tratamento, a população analisada ficou com 130.552

assinaturas (domicílios), sendo 63.849 (48,9%) domicílios ativos e 66.703 (51,1%)

domicílios inativos. A Tabela 2 ilustra as variáveis finais que serão investigadas

para obtenção do Escore de Churn nos capítulos subsequentes:


48

Tabela 2: Descrição das variáveis utilizadas na Regressão Logística


Fonte: Elaboração Própria
49

5 METODOLOGIA DE ANÁLISE

5.1 O MODELO DE REGRESSÃO LOGÍSTICA

Na literatura, duas técnicas são mais usadas para separar dois grupos ou

alocar um novo elemento em um desses grupos. Ambas as técnicas, Análise

Discriminante e Regressão Logística, se enquadram na classe de métodos

estatísticos multivariados de dependência, pois relacionam um conjunto de

variáveis independentes com uma variável dependente categórica (Hair et al.,

2005). As técnicas de discriminação buscam uma função ou conjunto de funções

que discrimine os grupos definidos pela variável categórica, visando a minimizar

erros de classificação.

Em outras palavras, segundo Menard (1995) essas duas técnicas tentam

associar as variáveis explicativas à variável resposta (que necessita ser dicotômica

ou categórica). Nestes modelos, define-se uma variável dependente (Y) e procura-

se verificar a influência de uma ou mais variáveis ditas independentes, causais ou

explicativas (X’s) sobre esta variável dependente.


50

A Análise Discriminante é adequada quando o conjunto de variáveis

independentes (variáveis explicativas para o modelo) possui comportamento

probabilístico de normalidade multivariada (isto é, supõe-se que cada variável

explicativa segue assintoticamente distribuição normal). Porque minimiza os erros

de classificação.

Segundo McLachlan (1992), erros de classificação são decorrentes no

processo de estimação, e na Regressão Logística precisam ser minimizados. No

estudo, erro do tipo I ocorre quando se rejeita a hipótese nula sendo ela verdadeira

(afirma-se que um indivíduo é Churn, quando ele não é) e o erro tipo II ocorre

quando aceita-se a hipótese nula, sendo ela falsa (afirma-se que um indivíduo não é

Churn quando na verdade ele já se tornou Churn).

Segundo Hair et al. (2005), o outro ponto para pouca utilização do método

da Análise Discriminante em detrimento aos modelos de Regressão Logística

(modelos Logit), é a dificuldade de interpretação do Escore fornecido pela

expressão discriminante. Na Análise Discriminante, este Escore é basicamente um

dispositivo (discriminatório) de classificação ordinal, não tendo embutido nenhum

aspecto probabilístico. Já nos modelos Logit, o Escore estimado representa a

probabilidade associada a cada indivíduo classificado.

Outro fator positivo na Regressão Logística é a possibilidade de

interpretação direta dos coeficientes como medidas de associação. A interpretação

destes coeficientes pode ser estendida para qualquer problema prático. Hair et al.

(2005) ainda afirmam que existem algumas razões pelas quais a Regressão

Logística representa uma alternativa atraente à Análise Discriminante. Em primeiro

lugar, a Regressão Logística é menos afetada pelas desigualdades


51

variância/covariância dentre os grupos, um pressuposto básico exigido na Análise

Discriminante. Em segundo lugar, a Regressão Logística pode cuidar facilmente de

variáveis categóricas independentes, enquanto que, na Análise Discriminante1, o

uso de variáveis dummy (variável categórica definida em 0 e 1) cria problemas com

as igualdades da variância/covariância.

Finalmente, a Regressão Logística é similar à Regressão linear múltipla em

termos de sua interpretação e nas medidas de diagnóstico direcionadas a casos

disponíveis para o exame de resíduos. Segundo Hosmer e Lemeshow (2000), a

técnica de Regressão Logística tornou-se um método padrão de análise de regressão

para variáveis medidas de forma dicotômica.

Mesmo quando a resposta de interesse não é originalmente do tipo binário, é

possível dicotomizar a resposta de modo que a probabilidade de sucesso possa ser

modelada através da Regressão Logística. Krzanowski (1988) e Mclachlan (1992)

defendem que o modelo logístico possui poder discriminante e é um método

utilizado de forma mais abrangente, pois não faz suposições quanto à forma

funcional das variáveis independentes, e o número de parâmetros envolvidos no

processo de estimação provavelmente será menor.

Comparando as duas técnicas, Krzanowski (1988) ressalta que a

discriminação logística deve ser preferida, quando as distribuições são claramente

não-normais.

Outra vantagem da Regressão Logística é sua abordagem probabilística, já

que essa regressão estima a chance de ocorrer certo evento a partir de uma série de

variáveis independentes ou explanatórias.

1
Para maiores informações sobre Análise Discriminante, consultar Hair et AL (2005)
52

Segundo Hosmer e Lemeshow (2000), o objetivo da Regressão Logística é

achar o melhor relacionamento entre a variável resposta (variável dependente) e um

conjunto de variáveis explicativas ou preditivas, sendo o modelo final aquele que

apresentar o melhor ajuste e for naturalmente razoável de se explicar.

Para uma variável dicotômica, o desvio padrão é determinado pela média p

da variável. Já que existe um relacionamento funcional entre o desvio padrão e a

média, a homogeneidade de variância dentre os valores da variável dependente não

pode ser satisfeita. Ao predizer o valor de uma variável numa escala de 0 a 1, faz

sentido ajustar uma curva em forma de S aos dados, na Figura 2:

Figura 2: Curva de distribuição de probabilidade Logit (dados simulados)


Fonte: Elaboração Própria

A função logística está limitada em 0 (zero) e 1 (um), de modo que

predições impossíveis não podem ocorrer. Há efetivamente uma família inteira de

funções em forma de S, sendo o Probit uma variante bem conhecida.


53

5.2 INFERÊNCIA NO MODELO DE REGRESSÃO LOGÍSTICA

O primeiro passo para a construção de um modelo de Regressão Logística é

verificar se os dados foram coletados em escala contínua ou discreta. Para situações

tempo-discreto, Meyer (1978) sugere o método maximum likelihood (Máxima

Verossimilhança) para estimar os parâmetros do modelo de Regressão Logística.

Para Meyer (1978), esse método de estimação dos parâmtros da regressão conduz

estimativas razoáveis para dados dicotômicos.

Se todas as variáveis explicativas forem categóricas, a estimação do modelo

Logit pode ser feita por método log-linear. Para Hair et al. (2005), a análise Logit é

um método que determina quais variáveis independentes devem ser incluídas no

modelo para se prever adequadamente a variável dependente categórica.Como fator

limitador para uso da função Logit, as variáveis dependentes e independentes

devem ser categóricas, obrigatoriamente.

A Regressão Logística reescreve o modelo clássico de regressão linear de

modo a confirmar o valor da variável resposta para a faixa de 0 (zero) a 1 (um), ao

mesmo tempo em que as variáveis independentes possam variar continuamente.

Isto é obtido pela equação abaixo:


Onde X1, X2,..., Xk representam as K
variáveis explicativas e os β’s, seus
respectivos parâmetros, estimados através do
método da Máxima-Verossimilhança.
(β0 representa o parâmetro do intercepto). E

representa a probabilidade estimada para


cada indivíduo i.
54

Assim, a Regressão Logística é aplicada a uma variável dependente

dicotômica, onde a variável dependente não representa os valores de dados brutos,

mas representa a probabilidade do evento estudado ocorrer.

Nos modelos Logit, a principal suposição é a de que o LN(Odds), ou seja,

logaritmo da razão entre as probabilidades de ocorrência e não ocorrência do evento

é linear. Sendo assim, a equação da função Logit que descreve uma relação linear

na Regressão Logística é:

onde os termos da direita são os termos padrão para as variáveis

independentes e o intercepto numa equação de Regressão linear. E do

lado esquerdo está o ln(Odds) é chamada de Logit.

Na Regressão Logística há um relacionamento linear com as variáveis

independentes, mas é linear nas probabilidades de LOG e não nas probabilidades

originais. Como o objeto de estudo é a probabilidade de ocorrência de um evento (o

indivíduo se tornar Churn), a equação Logit pode ser transformada numa equação

na probabilidade (Paula, 2004).

Diferente da Regressão linear clássica, os erros desse modelo não seguem

uma distribuição normal, mas sim a de Bernoulli. Na Regressão Logística usa-se o

método da máxima verossimilhança para se estimar os valores dos parâmetros β0,

..., βk, que maximizem a probabilidade de se obter o conjunto observado de dados

(Hosmer e Lemeshow, 1989).


55

Os parâmetros da Regressão Logística podem ser estimados de forma bem

semelhante à Regressão linear múltipla pelo fato de que um modelo de base é

primeiro estimado visando a fornecer um padrão para comparação. Na Regressão

linear múltipla, a média é utilizada para estabelecer o modelo base e calcular a

soma total dos quadrados dos afastamentos. Na Regressão Logística, o mesmo

processo é utilizado, com a média usada no modelo estimado não para estabelecer a

soma dos quadrados, mas para estabelecer o valor de probabilidade log.

5.2.1 O Problema da determinação do valor de corte

Fazendo uma síntese, pode-se dizer que um Modelo de Regressão Logística

prevê a probabilidade direta de um evento ocorrer. No caso dessa dissertação, o

evento em questão é a probabilidade do indivíduo se tornar Inativo (Churn).

A grande questão na classificação dos modelos Logit é: Como obter um

valor de corte confiável a ponto de evitar perdas para a empresa? Tanto pela não

classificação de risco para clientes que podem cancelar o plano de saúde e,

consequentemente, não serão impactados pelas ações de marketing, quanto pela

atribuição de risco para clientes sem propensão ao cancelamento e que consomem

parcelas importantes dos investimentos de marketing utilizados na retenção de

clientes.

Com isso, o ponto de corte para este estudo deve ser o valor que minimize

os erros de classificação dos assinantes. Existem dois tipos de erros: erro tipo I

(quando se rejeita a hipótese nula sendo ela verdadeira) e o erro tipo II (aceitar a

hipótese nula, sendo ela falsa) Usualmente se estabelece o ponto de corte em “p =


56

^
0.5”, ou seja, indivíduos são classificados Churn se p > 0.5. Em outras palavras,

para se encontrar um bom ajuste do modelo, uma das aferições é através da tabela

de contingência, onde se estabelece um ponto de corte e se avalia o percentual de

erro (tanto do tipo I quanto do tipo II). Gujarati (2006) confirma que é mais

importante minimizar o erro do tipo I.

A inovação deste estudo também acontece ao não se estabelecer o ponto de

corte fixo. Na dissertação tentou-se utilizar a metodologia de Macthing (descrita no

Capítulo 5.6) para se estabelecer um ponto de corte. Entretanto, devido às

limitações do algoritmo utilizado (mais adiante, no Capítulo 6.5), não foi possível

expandir esse ponte de corte para todo o universo de indivíduos analisados.

5.3 PROCEDIMENTO DE AJUSTE DO MODELO

Na equação de regressão logística, para se verificar o efeito ou poder de

discriminação de cada uma das variáveis independentes com relação à variável

dependente, são calculados os coeficientes de regressão. O cálculo dos coeficientes

do modelo é feito através da maximização da função de verossimilhança que

calcula a probabilidade de que um evento ocorra (Menard, 1995). Este

procedimento é equivalente a minimizar a função logaritmo de verossimilhança

(-2LL)1.

1
Nos modelos lineares vistos na literatura (Gujarati, 2005), têm-se que os coeficientes de regressão
são calculados através da minimização da função de erro quadrático, conhecido como Mínimos
Quadrados Ordinários. Já na Regressão Logística, o cálculo é feito através da minimização da
função de verossimilhança (-2 vezes o logaritmo do valor da verossimilhança e é chamada de -2LL,
ou -2logverossimilhança)
57

É importante se ter em mente que o que se quer é verificar o poder de ajuste

da equação, ou seja, verificar o quanto as variáveis independentes explicam a

variável dependente, ou seja, quer se medir o seu poder de influência sobre a

variável dependente. Um modelo com bom ajuste terá um valor baixo para -2LL,

sendo que o valor mínimo é 0 (zero). Um modelo com ajuste perfeito terá como

resposta um valor de verossimilhança igual a 1 (um) e, portanto, -2LL será igual a 0

(zero). O valor da verossimilhança também pode ser comparado entre equações,

onde a diferença representa a mudança no ajuste preditivo de uma equação para

outra.

Os coeficientes estimados (β0, β1, β2, ..., βk) são, na verdade, medidas das

variações na proporção das probabilidades, chamada de ODDS (razão de

probabilidade ou razão de desigualdade). É importante dizer que um coeficiente

positivo indica aumento da probabilidade, ao passo que um valor negativo

representa diminuição da probabilidade prevista.

5.3.1 Inclusão e Exclusão de variáveis nos Modelos de Regressão

Um das técnicas utilizadas para inclusão ou exclusão de variáveis nos

modelos Logit é stepwise, que minimiza o número de variáveis para que o modelo

resultante seja mais facilmente generalizado e estável numericamente, dado que,

quanto mais variáveis são incluídas no modelo, mais ele se torna dependente dos

dados. Hosmer e Lemeshow (2000) descrevem que os procedimentos stepwise

incluem os métodos enter, backward e forward.


58

O método enter incorpora ao modelo todas as variáveis e deve ser utilizado

principalmente quando se tem certeza de que todas as variáveis são necessárias para

se estimar os parâmetros do modelo. O método backward caracteriza-se por

incorporar todas as variáveis e, após percorrer várias etapas, uma variável por vez

pode ser eliminada.

Se em uma determinada etapa (do procedimento de stepwise) não houver

eliminação de alguma variável, o processo é interrompido e as variáveis restantes

definem o modelo final. Numa dada etapa, tem-se um determinado modelo que se

denomina modelo completo da etapa e são investigadas as contribuições individuais

das variáveis a esse modelo. A variável de pior desempenho é eliminada

comparando-se o modelo completo com o modelo reduzido, pela retirada de tal

variável (Charnet et al, 1999).

O método forward se inicia com a variável independente de maior

coeficiente de correlação amostral observado com a variável resposta. A cada etapa,

uma variável pode vir a ser incorporada. Se em uma etapa não houver uma

inclusão, o processo é interrompido e as variáveis selecionadas até esta etapa

definem o modelo final (Charnet et al., 1999).

Em uma determinada etapa do stepwise chega-se a um modelo definido

como modelo reduzido. O modelo reduzido de cada etapa é comparado ao modelo

em que uma nova variável é acrescentada. O uso desta técnica na Regressão

Logística baseia-se em critérios tais como a estatística G e a estatística de Wald

(descrita no Capítulo a seguir). Existindo um modelo de melhor desempenho

(escolhido através da estatística de Wald ou G), a correspondente variável é

incorporada ao elenco de variáveis já escolhidas.


59

Enquanto em uma etapa do procedimento backward comparam-se vários

modelos reduzidos com um único modelo completo devido ao objetivo de eliminar

uma variável, em uma etapa do procedimento forward as comparações são feitas

entre vários modelos completos e um único modelo reduzido, graças ao objetivo de

incorporar uma variável (Charnet et al., 1999)

5.3.2 Testes de confirmação nos Modelos de Regressão

Depois de calcular os coeficientes, o passo seguinte consiste em determinar

se as variáveis independentes são associadas significativamente à variável de

resultado. Segundo Paula (2004) existem duas estatísticas mais importantes, que

foram utilizadas, neste estudo, para testar hipóteses relativas ao vetor de parâmetros

de β, que são deduzidos de distribuições assintóticas.

A primeira denominada estatística de Wald é baseada na distribuição

assintótica de (estimador de β ) e é geralmente mais usada no caso de hipóteses

relativas a um único coeficiente β k. É uma generalização da estatística t de Student.

Como

E sob o teste de hipótese


60

A Estatística de Wald é:

, onde é o desvio padrão de

A segunda estatística é a Razão de verossimilhança (também conhecida

como Deviance ou D ou - 2LL) e é geralmente preferida no caso de hipóteses

relativas a vários parâmetros β ’s. Utiliza-se o teste da razão de verossimilhança

para verificar a adequação do modelo como um todo devido a sua distribuição

conhecida. Na equação é aplicado “menos duas vezes seu LOG”, pois sua

distribuição corresponde ao Qui-Quadrado. Isto é, a comparação entre valores

preditos e observados é baseada na estatística D (Deviance):

A estatística D, conhecida como Deviance, avalia o valor ajustado na

Regressão Logística, desempenhando o mesmo papel que a soma dos quadrados

dos resíduos (SSE – Sum Square Error) na Regressão Linear.

Na verdade, para estimar a significância de uma variável independente,

comparam-se o valor de D com e sem a variável independente na equação. Essa

alteração em D (devido à inclusão da variável independente) dá origem à estatística

de teste G, que é uma variação da estatística de teste D (Deviance).

G = D (para o modelo sem a variável) – D (para o modelo com variável)


61

A estatística G desempenha o mesmo papel na Regressão Logística, como

faz o numerador do teste F na Regressão linear, porque a verossimilhança do

modelo saturado é comum para ambos os valores de D, sendo eliminado no cálculo

de G. Assim, sob:

Utiliza-se a estatística de teste:

onde k é o número de β’s (variáveis) no modelo e λ é a função de verossimilhança.


Rejeita-se H0 se o p-valor associado a essa estatística de teste G for < 0,05.

Para Hosmer e Lemeshow (2000), uma aproximação para testar a

significância do coeficiente de uma variável em qualquer modelo relaciona-se com

a seguinte questão: o modelo que inclui a variável em questão diz mais sobre a

variável resultante ou resposta, do que o modelo que não inclui a variável?

Ainda segundo Hosmer e Lemeshow (2000), os cálculos do logaritmo de

verossimilhança e o teste da razão de verossimilhanças são aspectos característicos

de qualquer pacote de regressão logística. Isto torna possível verificar a

significância da adição de novos termos no modelo como um assunto de rotina. No

caso de uma única variável independente, recomenda-se ajustar primeiro um

modelo contendo apenas o termo constante. Em seguida ajustar um modelo

contendo a variável independente, bem como a constante. Estes dados originam um

novo LOG de verossimilhança. O teste da razão de verossimilhanças é obtido


62

multiplicando-se a diferença destes dois valores por -2. Este resultado, bem como o

p-valor associado à distribuição Qui-quadrado, podem ser obtidos na maioria dos

pacotes estatísticos.

Em resumo, o método para testar a significância do coeficiente de uma

variável na regressão logística segue uma aproximação parecida com aquela usada

na regressão linear, mas usa a função de verossimilhança para a variável resposta

dicotômica.

5.3.3 Medidas de ajustes nos Modelos de Regressão

Além das estatísticas de testes descritas, existe uma a medida Hosmer e

Lemeshow de ajuste geral. Essa medida indica se houve ou não diferença

estatisticamente significativa entre as classificações observadas e previstas. Estas

duas medidas, em combinação, fornecem suporte para que se aceite o modelo de

Regressão Logística.

Esta medida Hosmer e Lemeshow (ou teste HL) tem a finalidade de avaliar

a validade preditiva do modelo de Regressão Logística. É baseado não no valor de

verossimilhança, mas na visão real da variável dependente (Hosmer e Lemeshow,

2000).

Considerando-se Y como o valor real da variável e como o valor

previsto, o teste é feito com intuito de medir a proximidade de ambos. A hipótese

nula (hipótese de teste) é que não existe diferença significativa entre o valor real e o

valor previsto, ou seja, equivale a dizer que o modelo tem bom poder de ajuste.

Quanto menor é o valor da diferença entre Y e , mais os valores previstos se


63

aproximam dos reais e, portanto, melhor desempenho preditivo tem o modelo.

Desta forma, um fator positivo a favor do modelo é quando se aceita a seguinte

hipótese nula: H0: Y =

Estes testes, descritos acima, asseguram a evidência de significância

estatística das variáveis, devendo se considerar outros fatores relevantes, como a

importância da variável em relação ao evento modelado e a influência conjunta de

outras importantes variáveis (Hair et al., 2005).

Existem ainda, nos modelos lineares generalizados, ainda duas medidas

comparáveis ao R2 no modelo de regressão múltipla. A medida R2 Cox e Snell

opera da mesma forma, com valores mais altos indicando maior ajuste do modelo.

Entretanto, esta medida está limitada pelo fato de que não consegue alcançar o

valor máximo de um, de modo que Nagelkerke (Hair et al., 2005) propôs uma

modificação que tem a amplitude de 0 (zero) a 1 (um).

A medida proposta por Nagelkerke denomina-se “Pseudo R2" ou R2 Logit e

é calculada com base na melhoria do valor -2LL:

Ao se incluir ou excluir variáveis (através dos métodos stepwise descritos

anteriormente) utilizam-se a estatística de Wald, a mudança na probabilidade, ou a

estatística condicional como método de escolha para a eliminação ou inclusão de

variáveis. Para a obtenção do modelo final de Regressão Logística, após estimar os

coeficientes da equação de regressão, é necessário verificar se cada variável é


64

significativamente relacionada com a variável resposta do modelo. Isto é realizado

geralmente através da formulação de testes de hipóteses estatísticas, que avaliam o

modelo com a variável e sem a variável (Hosmer e Lemeshow, 2000).

5.3.4 Razão de Probabilidades (ODDS)

Além de predizer e estimar a probabilidade de um indivíduo (titular do

plano de saúde) continuar ou não com o plano de saúde, os Modelos de Regressão

Logística também permitem conhecer as relações entre as variáveis explicativas e a

variável dependente. Ou seja, permitem identificar quais são as variáveis

explicativas mais relevantes no processo de escolha.

A vantagem de se trabalhar com o Modelo Logit se deve ao fato de ele

apresentar uma forma fechada. Sua especificação permite relacionar facilmente as

ODDS (Razões de Probabilidades) de um evento com as variáveis explicativas.

Estas razões comparativas são comuns, por exemplo, no contexto de uma

partida de futebol. Se as ODDS são de três para um em favor da seleção brasileira,

isso significa uma expectativa de uma vitória ocorrer com três vezes mais

frequência do que uma derrota. Mas se as ODDS são de dois para um contra a

seleção, isto significa uma expectativa de uma derrota ocorrer com duas vezes mais

frequência do que uma vitória.

É fácil converter ODDS em probabilidades e vice-versa. Com ODDS de três

para um a favor, há uma expectativa de três vitórias e uma derrota em quatro

tentativas, ou seja, uma probabilidade de vitória igual a 75%. Por outro lado, para

uma probabilidade de vitória igual a 20% espera-se uma vitória e quatro derrotas a
65

cada cinco tentativas, em outras palavras, uma chance de “4 para 1” de acontecer

uma derrota.

Onde X1, X2,..., Xk representam as K variáveis explicativas e os β ’s, seus


respectivos parâmetros, estimados através do método da Máxima-

Verossimilhança. (β0 representa o parâmetro do intercepto). E = 1


representa a probabilidade estimada para cada indivíduo i se tornar Churn.

5.4 O MÉTODO DE MACHING

Matching (ou pareamento) é um método amplamente utilizado na literatura

de avaliação de tratamentos. O método consiste basicamente em tomar como base

as características das unidades tratadas e tentar encontrar unidades em um grupo de

controle não experimental que possuam as mesmas características, previamente

definidas no grupo de tratamento. Em seguida, o grupo de comparação é

emparelhado ao grupo de tratamento através do Propensity Escore (Escore de

propensão ou probabilidade predita de participação).

Segundo Hirano, Imbens e Ridder (2003) o efeito médio para uma

subpopulação com um dado valor para as variáveis observáveis pode ser estimado

simplesmente tirando a diferença entre as médias dos grupos de tratamento e

controle nestas subpopulações. Para que se possa obter uma estimativa não viesada

do efeito do tratamento, tem de identificar um grupo de controle que seja o mais


66

próximo possível do grupo de tratamento em termos das características gerais que

são capturadas por uma variável designada de X.

Rosenbaum e Rubin (1983) sustentam que ajustando as diferenças entre as

unidades de tratamento e controle, apenas através do Escore de propensão, todo o

viés associado às diferenças nas variáveis prévias observáveis é removido.

A utilização do Escore de propensão baseia-se em duas hipóteses-chave. A

primeira é que a seleção nos observáveis requer que a participação no programa

seja independente dos resultados, condicional nas covariáveis.

A segunda hipótese refere-se à existência de um suporte comum. Esta

condição requer que existam unidades de ambos os grupos, tratamento e controle,

para cada característica X para o qual se deseja comparar.

É necessário que 0 < P(X) < 1. Isto assegura que para cada indivíduo tratado

exista outro indivíduo não tratado pareado, com valores similares de X. Dessa

forma, os indivíduos devem possuir uma probabilidade de serem participantes ou

não participantes que se situe entre 0 e 1, não podendo ser esta igual aos extremos.

Em outras palavras, a variável X precisa seguir uma distribuição de probabilidade.

5.4.1 Propensity Score Matching (Escore de Propensão)

O Escore de Propensão é definido por Rosenbaum e Rubin (1983) como a

probabilidade condicional de receber um tratamento, dadas algumas características a

priori:

.onde D = {0, 1} é o indicador da

exposição ao tratamento e X é o vetor multidimensional de características a priori.


67

O principal objetivo do PSM (Propensity Score Matching) é descobrir o

efeito médio do tratamento (ATT), ou seja, responder à pergunta: o que aconteceria

com o grupo de controle se recebesse o tratamento e o que aconteceria com o grupo

de tratamento se ele não o recebesse?

Nesse estudo, o PSM será utilizado para descobrir e emparelhar indivíduos

com características parecidas, com resultados contrários, ou seja, indivíduos que se

tornaram Churn (perdidos) versus indivíduos que não se tornaram. Fazendo esse

emparelhamento é possível definir dois grupos similares para comparação de perfil.

Se a distribuição do tratamento fosse aleatória dentro de uma amostra (isto

é, se o experimento fosse natural), essa pergunta teria uma resposta simples, a

saber: bastaria testar a diferença de médias da variável supostamente impactada

pelo tratamento para os grupos de tratamento e de controle.

5.4.2 ATT (Treatment on the Treated)

ATT é a medida que melhor responde à pergunta: Como o programa

mudaria o resultado dos participantes caso eles não tivessem se “desligado” da base

de plano de saúde? Formalmente pode ser representada como:

ATT(x, P(X) =1) = E(∆ |X = x, P(X) = 1) = E(Y1 - Y0 | X = x, P(X) = 1).

O valor de ATT é a diferença do resultado esperado de um indivíduo

selecionado aleatoriamente, da subpopulação de indivíduos que se tornaram Churn

e o resultado que este indivíduo teria caso não tivesse se tornado Churn.
68

No modelo probabilístico, a probabilidade de um indivíduo se tornar Churn

é regredida sobre seus supostos determinantes a fim de corrigir o viés de seleção na

distribuição do tratamento. Nesse sentido, essa probabilidade é o escalar que se

procura.

Depois, há o pareamento das probabilidades estimadas. Esse casamento é

^
realizado da seguinte forma: seja p (Xi) a probabilidade de se tornar Churn do

indivíduo i, que se tenha tornado efetivamente Churn. Se dentro de um raio

^ ^
(pequeno) partindo p (Xi) existir pelo menos um p (Xj), em que j é um indivíduo

que não se tornou Churn, os indivíduos i e j formarão um par tratamento-controle

(Churn-não Churn). Assim, pode-se acompanhar esses grupos no tempo e efetuar o

teste de médias a fim de calcular o efeito médio do “ suposto tratamento” (neste

estudo, o “tratamento” é o indivíduo se tornar Churn) .

A metodologia de Matching consiste na escolha de um grupo de controle

ideal a partir de uma amostra maior que a amostra do grupo de tratamento. O grupo

de controle é “casado” com o grupo de tratamento a partir de um conjunto de

características observadas ou utilizando um Escore de propensão (probabilidade de

Churn dadas certas características). Quanto mais próximos esses Escores, melhor o

”Matching”. Conforme citou Ravallion (2003), um bom grupo de controle vem do

mesmo ambiente econômico, social e cultural que o grupo de tratamento. Nesse

caso, a escolha do grupo de controle (indivíduos que não se tornaram Churn) se

dará de forma aleatória.

Existem várias metodologias de aplicação do ”Matching”, as mais utilizadas

na literatura e apresentadas por Becker e Ichino (2002) são:


69

- Vizinho mais próximo;

- Radius Matching;

- Kernel Matching e;

- Estratificação.

O método de Estratificação consiste na divisão das observações em

intervalos de acordo com o Escore de propensão. Dentro de cada intervalo, a média

do Escore de propensão das observações de controle e de tratamento deve ser igual.

Para facilitar o processo, na prática, podem ser utilizados os mesmos blocos

identificados pelo algoritmo da estimação do Escore de propensão. Em cada

intervalo computa-se a diferença entre as médias da variável de resultado das

observações de controle e das observações de tratamento. O ATT final será a média

do ATT de cada bloco ponderada pela distribuição das observações entre os blocos.

Uma das desvantagens dessa metodologia é que não são levadas em

consideração observações que pertençam a um bloco onde apenas existam

observações de controle ou apenas observações de tratamento. Uma maneira de

resolver este problema seria utilizando a metodologia de “matching-Vizinho Mais

Próximo”, pois esta procura, para cada observação tratada, a observação de controle

com o Escore de propensão a Churn mais próximo. Esta busca pode ser feita com

ou sem reposição, visto que uma observação de controle pode ser o melhor

“matching” para mais de uma observação tratada. Uma vez encontrados todos os

“matchings”, a diferença dos resultados de cada grupo é computada e o ATT final

será a média dessas diferenças.


70

O único problema dessa metodologia é que, algumas vezes, a qualidade do

“matching” pode não ser muito boa tendo em vista que o controle mais próximo de

uma observação tratada pode estar bem distante em termos de Escore de propensão

a Churn. As metodologias “Radius matching” e “Kernel matching” têm uma

solução para este problema.

No método de Radius matching, cada unidade tratada é “casada” com um

controle pertencente a uma vizinhança predefinida com base no Escore de

propensão do tratado. Se definirmos uma vizinhança restrita, existe uma grande

chance de não encontrarmos controle dentro desta vizinhança para todas as

observações tratadas.

Por outro lado, quanto menor a vizinhança, melhor será a qualidade do

Matching, e mais próximos estarão os grupos de tratamento e de controle. O

método de kernel leva em consideração todas as observações de tratamento e de

controle, e essas são casadas (pareadas) de maneira ponderada.

Todos os controles são aproveitados e o peso utilizado para cada um é

inversamente proporcional à distância do seu Escore de propensão e o Escore da

observação tratada. Vale ressaltar que, em todos os métodos, a qualidade do

Matching pode ser melhorada quando impomos uma região de suporte comum. A

escolha do método a ser utilizado vai depender do tipo de dados que se tem

disponível. É clara, a existência de um trade-off (substituição) entre a qualidade do

Matching e a quantidade de observações casadas.

De forma a se tornar mais claro o entendimento do método do PSM e sua

aplicação para os modelos de Churn, será a seguir desenvolvido um exemplo:


71

^
Seja p (Xj) a probabilidade de um indivíduo j se tornar Churn. Diz-se que j

^
é um potencial a Churn se, dentro de um raio (pequeno) partindo de p (Xj), existir

^
pelo menos um p (Xi), sendo i um indivíduo com Potencial a não-Churn. A idéia é

que, se o modelo for bem especificado, os indivíduos potenciais a Churn e os

indivíduos potenciais a não-Churn gêmeos terão características semelhantes.

Mais formalmente, sabe-se que é uma

função de distribuição acumulada, Xj é um vetor-linha dos determinantes da

probabilidade de um indivíduo ter potencial a Churn j e β é o vetor-coluna dos

coeficientes estimados do modelo.

Se o PSM faz:

Dessa forma:

A interpretação da expressão mencionada é:

Ou os indivíduos potenciais a Churn possuem características muito

semelhantes aos indivíduos com potencial a não-Churn, ou, ainda que apresentem

algumas variáveis Xjk e Xik distintas, essas diferenças, ponderadas pelos βk, de

algum modo, se compensam. Com efeito, como serão demonstrados, os resultados

favorecem a primeira interpretação.


72

A aplicação do PSM para encontrar indivíduos com potenciais a Churn

apresenta vantagem metodológica sobre as demais alternativas, como, por exemplo,

a de definir como potenciais a Churn indivíduos que não se tornaram Churn, mas

^
apresentam p (X) >0,5.

A primeira vantagem é que esse corte é necessariamente arbitrário. (A

escolha de p(X) = 0,5 é arbitrária).

A segunda vantagem é que o PSM possibilita a identificação dos indivíduos

com Potencial a Churn “ocultos”, o que o corte de probabilidade pode perder. Isso

pode ser ilustrado da seguinte forma: suponha-se que o único determinante da

probabilidade de se tornar Churn fosse a Idade do indivíduo, na forma linear, e essa

relação fosse positiva. Ao estabelecer, então, um corte de probabilidade, estar-se-ia

implicitamente estabelecendo um corte de tamanho do tipo indivíduos com Idade

abaixo de Y não têm potencial a Churn, o que poderia contradizer à observação de

que vários indivíduos com Idade acima de Y, apresentam excelentes níveis de

potencial a Churn.

Cabe salientar, entretanto, que a qualidade dessa classificação depende do

modelo probabilístico.
73

6 ANÁLISE DOS RESULTADOS

6.1 RESULTADOS DO MODELO DE REGRESSÃO

Utilizando-se do software estatístico SPSS 13.0 ©, o modelo de Regressão

Logística binária foi aplicado. Para ajustar o modelo final que minimiza o número

de variáveis e maximiza a precisão do modelo, foi adotado o método de iteração

stepwise forward, que através da estatística de Wald encontrou o modelo

parcimonioso com 13 variáveis. Em um segundo momento, utilizando as 13

variáveis finais, o modelo de Churn foi novamente validado.

O ponto de corte utilizado para classificação foi o de probabilidade igual

0.5, pois define probabilidade Churn igual para os dois grupos (ativos e inativos).

Como nossa amostra possui uma porcentagem de clientes inativos muito próxima a

50%, foi possível adotar tal corte.

O resultado do modelo inicial apresenta a tabela de classificação

considerando o modelo com apenas uma constante, ou seja, se arbitrariamente todas

as assinaturas fossem consideradas canceladas, a taxa de acerto seria de 51,1%. O


74

modelo de Regressão Logística que irá estimar o risco de cancelamento de clientes

precisa ser mais assertivo na classificação dos clientes.

Tabela 3: Modelo apenas com a constante


Fonte: Elaboração Própria

A primeira variável incluída no modelo é a que tiver a estatística de

pontuação mais alta, estatística Wald. No caso, a variável tempo desde último

exame é selecionada a compor o modelo. Em segundo lugar, a variável Segmento

de uso do plano (ver definição em Anexo 1) foi incorporada ao modelo. E em

seguida, a variável dicotômica que indica Atraso no pagamento. Essas três variáveis

contribuem com 70,5% do poder explicativo do modelo. Na Tabela 4 abaixo,

verifica-se que o modelo proposto apresenta-se.com o coeficiente significativo.

Tabela 4: Teste Omnnibus de coeficientes do Modelo


Fonte: Elaboração Própria
75

O modelo de Regressão Logística final, para estimar o Churn individual,

ficou ajustado da seguinte forma:

Onde X1, X2,..., X12 representam as variáveis


explicativas e os β ’s, seus respectivos
parâmetros, estimados através do método da
Máxima-Verossimilhança. (β0 representa o

parâmetro do intercepto). E representa a


probabilidade estimada de cada indivíduo i se
tornar Churn.

X1 – Tempo de Exame (tempo desde o último, em dias)

X2 – Segmento de Utilização1

X3 – Flag de Atraso1

X4 – Tempo de Consulta (tempo desde a última, em dias)

X5 – Ano de Inclusão

X6 – Valor em T3 (valor pago no antepenúltimo mês)

X7 – Faixa Etária

X8 – Área de Rendimento1

X9 – Valor em T2 (valor pago no penúltimo mês)

X10 – Rede de Produto1

X11 - Opcional1

X12 – Sexo

X13 – Estado Civil

A Tabela 5 contém as variáveis presentes no modelo ajustado e seus

respectivos parâmetros. A seguir, a partir do Capítulo 6.1.1 e 6.2, se discorrerão os

ajustes do modelo e suas interpretações.


76

Tabela 5: Estimação do Modelo de Churn


Fonte: Elaboração Própria
77

6.1.1 Interpretação dos Parâmetros no Modelo

No modelo final encontram-se variáveis contínuas (Valor T2, Valor T3,

Tempo de Consulta e Tampo de Exame), variáveis categóricas (Ano de Inclusão,

Faixa Etária, Rede de Produto, Área de Rendimento, Estado Civil e Segmento de

Utilização) e variáveis binárias (Sexo, Flag de Atraso e Flag Opcional). A

interpretação dos parâmetros β ’s acontece na seguinte forma:

- Variáveis Contínuas: Sendo β positivo, a medida que é acrescido um valor

na variável contínua, aumenta-se a probabilidade de Churn. Sendo β negativo,

diminui-se a probabilidade de Churn. A real relação pode ser vista através da Razão

de Chance, ou EXP (β ). Exemplificando, a razão de chance da variável Tempo de

Exame é de 1,189. Isto significa dizer que aumentando-se o Tempo de Exame em 1

(um) dia, a chance de se tornar Inativo aumenta na razão de 1,189.

- Variáveis Categóricas: É escolhida uma categoria da variável como

referência, e partir dessa referência, se comparam as outras categorias da variável.

Em outras palavras, por exemplo, em Área de Rendimento, a categoria de

referência escolhida foi “A”. Significa então que morar numa área de Rendimento

“B” ou “C” aumenta a chance de se tornar Churn em relação a quem reside numa

área de Rendimento “A”.

- Variáveis Binárias: A presença da variável incide positiva ou

negativamente na probabilidade de Churn (de acordo com o β ). Exemplo, ter o

Flag Opcional diminui a chance do indivíduo se tornar inativo (β negativo e EXP(β )

menor que 1).


78

6.2 AJUSTE FINAL DO MODELO

Além das interpretações dos parâmetros, se faz necessário analisar algumas

estatísticas de validação, nos modelos de Regressão Logística.

A começar pela Deviance. A estatística de probabilidade -2log likelihood

(Deviance) diminuiu à medida que foi incluída uma variável no modelo, indicando

melhora. Em contrapartida, as medidas pseudo R2 aumentaram à medida que

previsores foram adicionados. O pseudo R2 de Nagelkerke no último passo ficou em

0.695 (Tabela 6), considerado pela literatura como um excelente poder de

explicação do modelo.

Tabela 6: Máxima verossimilhança e R2


Fonte: Elaboração Própria

A medida Hosmer e Lemeshow de ajuste geral tem um teste estatístico que

indica que não houve diferença estatisticamente significativa entre as classificações

observadas e previstas para todos os modelos com duas ou mais variáveis. O valor

Hosmer e Lemeshow mede a correspondência dos valores efetivos e previstos da

variável dependente. Neste caso, o melhor ajuste do modelo é indicado por uma

diferença menor na classificação observada e prevista. Um bom ajuste de modelo é

indicado por um valor Qui-quadrado (Chi-square) não significante (Hair et al.,

2005).
79

O SPSS 13.0 © utiliza algoritmos iterativos que buscam um subconjunto de

variáveis para maximizar a probabilidade. Não é o mesmo que maximizar a

precisão da estimativa. Então, pode haver problemas na utilização de métodos de

Regressão quando o objetivo da análise é a precisão da estimativa.

Tabela 7: Teste de Hosmer e Lemeshow


Fonte: Elaboração Própria

A medida Hosmer e Lemeshow, apresentada no modelo (Tabela 7), é

significativa a qualquer nível de significância (Sig). Essa medida indica a ausência

de diferença significativa na distribuição de valores dependentes efetivos e

previstos. Essas medidas combinadas sugerem a aceitação do modelo do último

passo como um modelo significante de Regressão Logística.

6.3 PRECISÃO DA ESTIMATIVA DO MODELO

A tabela de classificação final, também utilizada quando se descreve um

modelo na Técnica de Análise Discriminante (Hair et al., 2005), mostra taxas de

acerto extremamente altas, de casos corretamente classificados para o modelo final

proposto, de 13 variáveis. Como se verifica na Tabela 8.


80

Tabela 8: Classificação no modelo final


Fonte: Elaboração Própria

A taxa de acerto geral foi de 87,7%. Além disso, as taxas de acerto de

grupos individuais são consistentemente altas e não indicam um problema na

previsão de qualquer um dos dois grupos. Apesar de altas, as taxas de acerto do

grupo “não se torna Churn” é ainda maior que a taxa do grupo que “se torna

Churn”, 91,1% contra 84,4%.

O modelo inicial, que considerava apenas a constante, tinha uma taxa geral

de acerto de 51,1%. O modelo completo com 13 variáveis aumenta 1,7 vezes a taxa

de acerto na previsão.

Nos últimos passos do stepwise, a melhora no R2 é pequena e a taxa de

acerto geral do modelo não se altera tanto. Isto indica que as últimas variáveis

inseridas no modelo não apresentam tanto peso para determinar o Escore de Churn.

No entanto, tais variáveis permaneceram no modelo final para ajudar na definição

do perfil dos domicílios que cancelam a assinatura (contrato) do plano de saúde. A

Tabela 9 (abaixo) indica a Estatística de Wald que considera a importância de cada

variável no modelo proposto.


81

O valor percentual foi calculado a partir dos valores absolutos de cada

variável através da Estatística de Wald. De maneira percentualizada é possível

comparar a importância das variáveis.

Tabela 9: Peso das variáveis no modelo final


Fonte: Elaboração Própria

Estatística %
WALD Peso

Tempo de Exame 8.059,07 31,4%

Segmento de Utilização 6.310,48 24,6%

Flag Atraso 4.456,58 17,3%

Tempo de Consulta 2.078,84 8,1%

Ano Inclusão 1.174,45 4,6%

Valor em T3 1.167,41 4,5%

Faixa Etária 1.029,57 4,0%

Área de Rendimento 354,72 1,4%

Valor em T2 320,30 1,2%

Rede de Produto 306,68 1,2%

Opcional 225,49 0,9%

Sexo 135,15 0,5%

Estado Civil 73,27 0,3%

As 3 variáveis mais importantes para o modelo, ou seja, as que carregam a

maior informação relacionada à probabilidade do indivíduo se desligar do plano de

saúde são, respectivamente: o Tempo de Exame, a Segmentação de Utilização e o

Flag de Atraso de Pagamento. Juntas, essas três variáveis carregam mais de 73% de

toda variabilidade explicada pelo modelo Logit. Tempo de consulta se apresenta

como uma quarta variável (no nível de importância). Essas quatro variáveis

ultrapassam os 80% da explicação do modelo probabilístico.


82

6.4 INTERPRETAÇÃO DOS RESULTADOS

Como será visto mais adiante, as principais variáveis explicativas do

modelo, apresentam os sinais esperados, no que diz respeito à correlação com o

Churn.

A. Tempo de Consulta – Esta variável representa, em dias, o tempo

decorrido desde a última consulta. É de se esperar que pacientes com elevado

tempo desde sua última consulta, tenham uma maior probabilidade de se tornar ex-

cliente.

Tabela 10: Comparativo no Tempo de Consulta entre Churn e não-Churn


Fonte: Elaboração Própria

Observando a Tabela 10 acima, é possível distinguir o grupo dos clientes

que se tornaram Churn, (com tempo médio e tempo mediano de consulta acima de

19 dias); e o grupo dos clientes Não-Churn (com baixo tempo de consulta).


83

Figura 3: Dispersão entre o Tempo de Consulta e Probabilidade de Churn


Fonte: Elaboração Própria

A Figura 3 mostra através da Probabilidade predita (Predicted Probability)

que quanto maior é o tempo de consulta do paciente, maior é sua chance de se

tornar um Churn.

B. Tempo de Exame – Variável que representa, em dias, o tempo

decorrido desde o último exame.

Tabela 11: Comparativo no Tempo de Exame entre Churn e não-Churn


Fonte: Elaboração Própria
84

O comportamento da variável Tempo de Exame se mostra similar ao

comportamento do Tempo de consulta; ou seja, ex-clientes possuem um elevado

nível em dias no tempo de exame, como se pode ver na Tabela 11.

Figura 4: Dispersão entre o Tempo de Exame e Probabilidade de Churn

Fonte: Elaboração Própria

Em outras palavras, à medida que se aumenta o Tempo de exame, aumenta a

probabilidade de se tornar um ex-clientes. Pode-se ver isso através da Figura 4.

C. Valor T2 – Representa o valor da mensalidade do plano, pago à

empresa, no penúltimo mês. É razoável supor que clientes ativos tenham uma

distribuição de valores superiores aos clientes inativos. A Tabela 12 abaixo,

confirma essa suposição.


85

Tabela 12: Comparativo no Penúltimo Valor Pago entre Churn e não-Churn


Fonte: Elaboração Própria

D. Valor T3 - Valor da mensalidade do plano, pago à empresa, no

antepenúltimo mês. Clientes que não pagam esses valores (valor t2 e t3) tendem se

tornar inativos. Tal afirmação se confirma através da variável dicotômica criada

para verificação de inadimplência no pagamento (flag Atraso).

Mais ainda; a Tabela 13 indica semelhança entre as variáveis Valor t2 e t3. Era

de se esperar que os valores t1, t2 e t3 tivesse comportamentos semelhantes, visto

que um assinante contrata um plano mensal num valor estipulado.

Tabela 13: Comparativo Antepenúltimo Valor Pago entre Churn e não-Churn


Fonte: Elaboração Própria

E. Flag Atraso – Indica se o cliente teve algum “não pagamento” nos

últimos três meses. Onde 1 (um) indica atraso em um dos três possíveis pagamento.

Intuitivamente, tem-se que os clientes com atraso são os que mais se desligam do

plano de saúde.
86

Tabela 14: Churn versus Atraso - Absoluto


Fonte: Elaboração Própria

Churn
Total
Não Sim
Atraso

Não 59.151 42.918 102.069

Sim 4.698 23.785 28.483

Total 63.849 66.703 130.552

Tabela 15: Churn versus Atraso - Percentual


Fonte: Elaboração Própria

Churn
Total
Não Sim
Atraso

Não 45,3% 32,9% 78,2%

Sim 3,6% 18,2% 21,8%


Total 48,9% 51,1% 100,0%

Nas tabelas 14 e 15 acima, se evidencia quem aqueles assinantes em atraso

têm maior chance de ser tornar Inativo.

F. Ano de Inclusão – Ano de entrada do participante na empresa

(posterior a 1998). Proporcionalmente, clientes que entraram em 2004 e 2005 são

mais propensos a se tornarem Churn, como se pode ver através das Tabelas 16 e 17

abaixo.
87

Tabela 16: Churn versus Ano de Inclusão - Absoluto


Fonte: Elaboração Própria

Churn
Total
Não Sim

1999 1.080 382 1.462

2000 1.042 509 1.551

2001 4.893 3.418 8.311


Ano de Inclusão

2002 6.277 4.562 10.839

2003 5.520 6.187 11.707

2004 9.102 19.133 28.235

2005 12.411 20.148 32.559

2006 21.750 11.825 33.575

2007 1.774 539 2.313

Total 63.849 66.703 130.552

Tabela 17: Churn versus Ano de Inclusão - Percentual


Fonte: Elaboração Própria

Churn
Total
Não Sim

1999 1,7% 0,6% 1,1%

2000 1,6% 0,8% 1,2%

2001 7,7% 5,1% 6,4%


Ano de Inclusão

2002 9,8% 6,8% 8,3%

2003 8,6% 9,3% 9,0%

2004 14,3% 28,7% 21,6%

2005 19,4% 30,2% 24,9%

2006 34,1% 17,7% 25,7%

2007 2,8% 0,8% 1,8%

Total 100,0% 100,0% 100,0%


88

G. Segmento de Utilização – Indica forma mais habitual com que os

clientes utilizam os planos (Definição em Anexo 1). Dos clientes que não

costumam utilizar, os considerados “Sem segmento”, espera-se uma maior

probabilidade de Churn. De fato isso ocorre, como mostra a Figura 5

Figura 5: Distribuição entre os Clientes Ativos e Churn através do Segmento


Fonte: Elaboração Própria

100%
90%
6.326 8.646
80% 20.574 20.445
70% 10.712
60%
50% CHURN
40% ATIVO
7.421 13.246
30% 16.959 21.756
20% 4.467
10%
0%
Cirurgia/ Consulta/ Consulta/ Consulta/ Sem
Internação Exame Alta Exame Exame Segmento
Baixa Média
.

H. Opcional – Indica a presença de algum tipo de opcional (Opcional

Odontologia, Opcional p/ Emergências, Opcional para Viagens, Opcional Air) no

plano original do paciente.

Tabela 18: Churn versus Opcional - Absoluto


Fonte: Elaboração Própria

Churn
Total
Não Sim
Opcional

Não 41.149 52.732 93.881

Sim 22.700 13.971 36.671

Total 63.849 66.703 130.552


89

Tabela 19: Churn versus Opcional - Percentual


Fonte: Elaboração Própria

Churn
Total
Opcional
Não Sim

Não 31,5% 40,4% 71,9%

Sim 17,4% 10,7% 28,1%

Total 48,9% 51,1% 100,0%

Os pacientes que com opcionais têm mais chance de não permanecer ativo.

Essa afirmação é corroborada através da Tabela 19.

I. Faixa Etária – Quanto maior a faixa etária, maior é a chance de haver

clientes ativos. Isso pode ser explicado pelo alto valor do plano, associado à faixa

etária, mas principalmente à necessidade da idade. Clientes idosos necessitam

recorrer mais ao plano se comparados aos mais jovens. Isso se evidencia nas

Tabelas 20 e 21, abaixo.

Tabela 20: Churn versus Faixa Etária - Absoluto


Fonte: Elaboração Própria

Churn
Total
Não Sim

até 18 anos 18.669 19.075 37.744

entre 19 e 23 3.174 4.286 7.460

entre 24 e 28 7.037 9.720 16.757

entre 29 e 33 6.888 9.678 16.566


Faixa Etária

entre 34 e 38 6.318 7.785 14.103

entre 39 e 43 5.148 6.057 11.205

entre 44 e 48 3.639 3.519 7.158

entre 49 e 53 2.624 2.290 4.914

entre 54 e 58 2.100 1.380 3.480

59 anos ou mais 8.252 2.913 11.165

Total 63.849 66.703 130.552


.
90

Tabela 21: Churn versus Faixa Etária - Percentual


Fonte: Elaboração Própria

Churn
Total
Não Sim

até 18 anos 29,2% 28,6% 28,9%

entre 19 e 23 5,0% 6,4% 5,7%

entre 24 e 28 11,0% 14,6% 12,8%

entre 29 e 33 10,8% 14,5% 12,7%


Faixa Etária

entre 34 e 38 9,9% 11,7% 10,8%

entre 39 e 43 8,1% 9,1% 8,6%

entre 44 e 48 5,7% 5,3% 5,5%

entre 49 e 53 4,1% 3,4% 3,8%

entre 54 e 58 3,3% 2,1% 2,7%

59 anos ou mais 12,9% 4,4% 8,6%

Total 100,0% 100,0% 100,0%

A definição das Faixas Etárias no estudo, pautou-se nas faixas definidas

originalmente na operadora de plano de saúde. Em virtude disso, só é possível notar

diferenças significativas na última faixa de idade.

J. Área de Rendimento - Classificação de Áreas Administrativas do

Estado do Rio de Janeiro, segundo participação de receita da área com a empresa.

Essa variável detecta regiões, no Estado do Rio de Janeiro, com maior proporção de

clientes com menor poder econômico. Vale lembrar que os bairros que

correspondem a Área de Rendimento no Estado do Rio de Janeiro podem ser visto

na Figura 6 (definição no Anexo 1):


91

Figura 6: Distribuição Econômica nos Bairros do Estado do Rio de Janeiro


Fonte: Elaboração Própria

Apesar de ser significativa no modelo probabilístico de Churn, não há

diferença significativa entre cliente e ex-clientes nas Áreas de Rendimento, ou seja,

não se destaca nenhuma área em relação a outra (como visto na Tabela 5)

K. Rede de Produto - Grupo de produto onde se classificam os planos dos

associados. Quanto melhor classificado é o plano, menos chance de se tornar

inativo tem o cliente. Isso se deve a importância e os benefícios que esse plano lhe

traz.
92

Figura 7: Distribuição entre os Clientes Ativos e Churn através do Plano


Fonte: Elaboração Própria

100%
537
90%
7.760 964
80% 24.902 7.802 24.738
70%
60%
50%
2.297 CHURN
40%
9.317 1.360
30% 22.345 8.701 19.829 ATIVO
20%
10%
0%

Personal é o plano mais básico, na rede de produtos, seguidos

respectivamente pelos planos Alfa, Beta, Delta e Omega. Planos antigos ou mal

especificados pela operadora, foram alocados em Não identificados. As diferenças

entre os planos (rede de produtos) citados, são: a presença de privilégios, tais como

uma rede de hospitais diferenciada, a opção de quarto ou enfermaria, entre outros.

A Figura 7 ratifica a intuição de que quanto melhor é o plano do assinante, menos

chance o mesmo tem de ser tornar Inativo.


93

6.5 RESULTADOS NO PSM

Para aplicação do PSM foi utilizado um algoritmo desenvolvido por

Raynald Levesque e adaptado ao SPSS 13.0 © por John Painter (Fev 2004, Anexo

3). Este algoritmo possui uma limitação de seleção de amostra de até 20.000

indivíduos para classificação do PSM. Assim, foi selecionada uma amostra de

10.000 clientes Ativos (ou assinantes) e, através do algoritmo, foram encontrados

10.000 clientes Inativos ou Churn (um para cada indivíduo Ativo) para formarem

os pares de probabilidade.

Devido à limitação do algoritmo em até 20.000 indivíduos, o critério de

seleção da amostra foi de selecionar os clientes com maior propensão a se tornarem

Churn. Ou seja, o algoritmo busca o primeiro indivíduo Ativo com maior

probabilidade estimada e tenta encontrar um par Inativo como probabilidade similar

ao par Ativo. Se não achar, o algoritmo busca um próximo indivíduo Ativo e tenta

encontrar o seu par (Inativo). E assim sucessivamente.

A principal aplicação deste algoritmo de PSM, no estudo, foi encontrar

públicos-alvos adequados, que possa ser testados numa ação de recuperação de

clientes Inativos. Encontrando esses pares, foi possível traçar um comparativo entre

os dois públicos (10.000 ativos e 10.000 inativos) para se testar a eficácia de uma

possível ação de rentabilização.


94

Abaixo, seguem as comparações das características entre os grupos. Cada

Tabela representa o perfil dos clientes e ex-clientes selecionados através do PSM.

Em cada tabela, pode-se notar diferenças entre os grupos. No final deste Capítulo se

atestará uma breve descrição na interpretação dos resultados do PSM.

Tabela 22: Churn PSM por Sexo


Fonte: Elaboração Própria

Clientes Ex-Clientes

Sexo Absoluto % Absoluto %

Feminino 6.560 65,6% 5.880 58,8%

Masculino 3.440 34,4% 4.120 41,2%

Total 10.000 100,0% 10.000 100,0%

Tabela 23: Churn PSM por Faixa Etária


Fonte: Elaboração Própria

Clientes Ex-Clientes

Faixa Etária Absoluto % Absoluto %

até 18 anos 2.390 23,9% 2.470 24,7%

entre 19 e 23 600 6,0% 690 6,9%

entre 24 e 28 1.540 15,4% 1.020 10,2%

entre 29 e 33 1.640 16,4% 1.240 12,4%

entre 34 e 38 1.330 13,3% 970 9,7%

entre 39 e 43 1.140 11,4% 780 7,8%

entre 44 e 48 480 4,8% 460 4,6%

entre 49 e 53 340 3,4% 480 4,8%

entre 54 e 58 200 2,0% 270 2,7%

59 anos ou mais 340 3,4% 1.620 16,2%

Total 10.000 100,0% 10.000 100,0%


95

Tabela 24: Churn PSM por Safra de Entrada (Ano de Inclusão)

Fonte: Elaboração Própria

Clientes Ex-Clientes

Safra de
Absoluto % Absoluto %
Entrada
1999 40 0,4% 100 1,0%

2000 80 0,8% 100 1,0%

2001 430 4,3% 770 7,7%

2002 880 8,8% 620 6,2%

2003 1.340 13,4% 770 7,7%

2004 6.640 66,4% 1.290 12,9%

2005 590 5,9% 2.260 22,6%

2006 0 0,0% 3.790 37,9%

2007 0 0,0% 300 3,0%

Total 10.000 100,0% 10.000 100,0%

Tabela 25: Churn PSM por Tipo de Plano

Fonte: Elaboração Própria

Clientes Ex-Clientes

Plano Absoluto % Absoluto %

ALFA 5.260 52,6% 2.910 29,1%

BETA 1.010 10,1% 1.350 13,5%

DELTA 1.060 10,6% 1.540 15,4%

OMEGA 150 1,5% 300 3,0%

PERSONAL 2.520 25,2% 3.770 37,7%

NAO IDENTIFICADO 0 0,0% 130 1,3%

Total 10.000 100,0% 10.000 100,0%


96

Tabela 26: Churn PSM por Área de Rendimento


Fonte: Elaboração Própria

Clientes Ex-Clientes

Area de
Absoluto % Absoluto %
Rendimento

A 1.160 11,6% 1.750 17,5%

B 4.380 43,8% 4.770 47,7%

C 3.990 39,9% 2.980 29,8%


OUT CIDADE DO RJ 60 0,6% 200 2,0%

Outros 410 4,1% 300 3,0%

Total 10.000 100,0% 10.000 100,0%

Tabela 27: Churn PSM por Segmento de Utilização


Fonte: Elaboração Própria

Clientes Ex-Clientes

Segmento Absoluto % Absoluto %

Cirurgia/Internação 770 7,7% 910 9,1%

Consulta/Exame Alta 740 7,4% 720 7,2%

Consulta/Exame Baixa 4.000 40,0% 3.230 32,3%

Consulta/Exame Média 2.950 29,5% 2.150 21,5%

Sem Segmento 1.540 15,4% 2.990 29,9%

Total 10.000 100,0% 10.000 100,0%

Tabela 28: Churn PSM por Estado Civil


Fonte: Elaboração Própria

Clientes Ex-Clientes

Estado Civil Absoluto % Absoluto %

Solteiro 6.710 67,1% 6.330 63,3%

Casado 2.920 29,2% 2.910 29,1%

Outros 370 3,7% 760 7,6%

Total 10.000 100,0% 10.000 100,0%


97

Tabela 29: Churn PSM por Flag de Atraso


Fonte: Elaboração Própria

Tabela 30: Churn PSM por Tempo de Consulta, Tempo de Exame, e pelos
Valores pagos da penúltima e antepenúltima parcela
Fonte: Elaboração Própria

A análise comparativa da seleção através do PSM, as Tabelas 22 a 30,

acima, fornecem indícios de que os grupos selecionados não apresentam

características semelhantes, apesar de termos os grupos selecionados a partir dos

pares de probabilidades aproximados.

Em algumas variáveis essas diferenças não ocorrem significativamente, tais

como Idade, Estado Civil e Área de Rendimento. No restante, há significativas


98

diferenças. Além disso, pode-se observar que o grupo selecionado de ex-clientes é

caracterizado por possuir planos (rede de produtos) mais diferenciados, ter tempo

de exame e de consulta menores em relação aos clientes.

Significa dizer que existem perfis diferentes de indivíduos ativos e inativos

com propensão a se tornarem Churn semelhantes. Em virtude disso, é importante

atestar esses diferentes perfis e traçar planejamentos distintos para cada grupo de

clientes.

Uma das limitações nesse estudo para a aplicação do PSM foi a

impossibilidade de se expandir o PSM para o universo analisado na Regressão

Logística.
99

7 CONCLUSÕES, RECOMENDAÇÕES E SUGESTÕES

7.1 CONCLUSÕES

O principal objetivo deste estudo foi elaborar um modelo probabilístico de

Regressão Logística que descrevesse, para cada indivíduo presente na base

analisada de clientes da empresa, o risco de cancelamento no plano de saúde.

Consequentemente, após a aplicação do modelo de Churn, foi possível traçar o

perfil dos assinantes mais propensos a se tornar Churn, como também os menos

propensos. Além de traçar perfil dos ex-assinantes.

Em um segundo momento do estudo, após serem estimadas as

probabilidades, traçou-se um modelo de comparação entre os clientes assinantes

ativos e os clientes inativos. Para tal comparação, foi utilizado o algoritmo de

Propensity Score Matching numa amostra de 20.000 clientes. O objetivo desta

comparação era caracterizar assinantes e ex-assinantes com probabilidades a Churn

similares. Do ponto de vista mercadológico, a principal contribuição do PSM

consiste no uso alternativo de seleção de público, o qual pode ser facilmente

replicado para outros problemas de pesquisa.


100

É possível afirmar que o modelo proposto pode ser eficiente para

determinação do risco de cancelamento de clientes, a partir de variáveis

geográficas, demográficas e transacionais.

Nos 130.552 clientes analisados, as variáveis significativas, no modelo

Logit, para determinar a propensão a Churn foram 13 (em ordem de importância):

Tempo de Exame, Segmento de Utilização, Flag de Atraso, Tempo de Consulta,

Ano de Inclusão, Valor T3, Faixa Etária, Área de Rendimento, Valor T2, Rede de

Produto, Flag de Opcional, Sexo e Estado Civil.

A tabela de classificação mostrou que a taxa de acerto geral do modelo de

Regressão Logística é de 87,7% e que as taxas de acerto dos grupos individuais são

altas e indicam uma consistência na previsão de qualquer um dos dois grupos. O

grupo que cancela apresentou taxa de acerto de 84,4% enquanto o grupo que não

cancela tem taxa de acerto de 91,1%. O pseudo R2 de Nagelkerke apresentou um

poder de explicação de 0,695 e a medida Hosmer e Lemeshow de ajuste geral

através de um teste estatístico indica que não houve diferença estatisticamente

significativa entre as classificações observadas e previstas para o modelo final.

Além disso, o valor de -2LL aumentou a cada passo. A combinação dessas medidas

de avaliação do ajuste e da precisão do modelo indica a aceitação deste como um

modelo de Regressão Logística significante.

Assim, de acordo com as variáveis assumidas no modelo de Regressão

Logística, conclui-se que o perfil do assinante com maior risco de cancelamento da

sua assinatura é: aquele com maior tempo entre exames e consultas, com valores

mais baixo de mensalidades e consequentemente, rede de produtos inferiores,


101

clientes que atrasam mais os pagamentos e têm menos opcionais, clientes mais

novos e que pouco utilizam o plano.

Os resultados obtidos indicam que o modelo é bastante eficiente em

distinguir assinantes que possivelmente cancelariam sua assinatura (contrato) dos

que não cancelariam.

7.2 RECOMENDAÇÕES

Dentre as inúmeras utilidades deste estudo para empresas gestoras de planos

de saúde, as principais são:

- A empresa pode estimular clientes que não possuem opcional no plano de

saúde, na tentativa de estimular o mesmo a continuar ativo;

- Os assinantes das áreas de rendimento com maior propensão a se tornarem

Churn poderiam ser estimulados se a empresa implantasse algum posto médico de

atendimento especializado;

- O público mais idoso poderia ter um atendimento domiciliar,

estabelecendo uma relação afetiva com a empresa;

- Nos clientes que se tornaram ex-assinantes, se poderia implementar uma

pesquisa (através do callcenter da empresa), para se captar os principais motivos do

desligamento do plano;

- Através da seleção do público gerada pelo PSM torna-se possível uma

mensuração mais qualificada de alguma ação de rentabilização da base.


102

7.3 SUGESTÕES DE PESQUISA

Os resultados obtidos indicam algumas ações de marketing e de negócio

podendo contribuir para aumentar a rentabilidade da empresa através da retenção de

clientes ou da implementação de ações que melhorem a qualidade da venda,

revertendo assim em clientes que permaneçam mais tempo na carteira.

As empresas que têm por objetivo entender o comportamento de seus

clientes devem montar uma base de dados que registre o relacionamento dos

produtos com seus consumidores e também o perfil dos clientes e prospects.

Para trabalho futuros, seria necessário pensar em alternativas de variáveis,

tais como, incluir indicadores de satisfação do assinante, perfil do assinante antes

de se submeter ao plano atual, variáveis que conseguissem enquadrar a vida social

do assinante (visto que, por exemplo, clientes que possui uma atividade física

correria risco diferentes de utilização de planos de saúde).

Outro ponto para se pesquisar, seria encontrar formas alternativas de se

encontrar o Escore de Churn, podendo-se utilizar outras ferramentas, tais como

Redes Neurais, ou Árvore de Decisão, entre outras.


103

REFERÊNCIAS BIBLIOGRÁFICAS

ABADIE, A., DRUKKER, D., HERR, J., IMBENS, G. Implementing matching estimators
for average treatment effects in Stata. The Stata Journal, n.1, p.1-18, 2001.

ARAÚJO, Bruno C. P. O. Potencial Exportador das Firmas Industriais Brasileiras. 2005.


Mestrado em Economia. UNB - Escola de Administração Fazendária.

BARROS, J.E.G. Análise de Sobrevivência: Modelo de Risco de Desligamento de


Clientes. 2002, Mestrado. UFRJ – Administração.

BATESON, J.E.G.; HOFFMAN, K.D. Marketing de Serviços. 4a Ed., Porto Alegre:


Bookman, 2001.

BECKER S.O., ICHINO, A. Estimation of average treatment effects based on propensity


score. Stata Journal, v2, p.358-377, 2002. Disponível em: www.sobecker.de/pscore.html.

BERGER, Paul D.; NASR, NadaI. Customer Lifetime Value: Marketing Models and
Applications, Journal of Interactive Marketing, 12 (Winter), 17–30, 1998. .

BERRY, L.L. e PARASURAMAN, A. Serviços de Marketing. 3ª Ed. São Paulo: Editora


Maltese, 1992.

BRETZKE, Miriam. CRM em tempo real. São Paulo, Atlas, 2000.

BROCHI, Leila. Análise do atendimento da medicina laboratorial e convênio, sob o foco


das estratégias de marketing de relacionamento. Dissertação - Mestrado UFSC - Eng. de
Produção, 2004.

CHARNET, R.; FREIRE, C. A. de L.; CHARNET, E. M. R.; BONVINO, H. Análise de


Modelos de Regressão Linear com Aplicações. Editora da Unicamp, 1999.

CISTER, Angelo M.; EBECKEN, Nelson F. F. - “CRM through DM: a case study” – Third
International Conference on Data Mining- DATA MINING III, Bolongna, Italy-2002. .

CISTER, Angelo M. Mineração de dados para a análise de atrito em telefonia móvel tese
de doutorado - UFRJ - Eng. Civil, 2005.
104

DIPAK, Jain; SINGH, Siddhartha S. Customer Lifetime Value Research In Marketing: A


Review And Future Directions, Journal of Interactive Marketing, 16 (2), 34-47, 2002. .

GUJARATI, N. Damodar - Econometria Básica. 4ª ed.2006

GUPTA, Sunil; - LEHMANN, Donald R. Gerenciando Clientes como Investimentos: o


valor estratégico dos clientes a longo prazo, ISBN: 85-363-0669-6: Bookman, 2006.

HAIR, Joseph F. Jr.; ANDERSON. Rolph E.; TATHAM Ronald L.; BLACK William C.
Análise Multivariada de Dados, ISBN 85-363-0482-0: Bookman 2005

HECKMAN J.; Ichimura H.; SMITH J.; TODD P.,Matching as an econometrics evaluation
estimator – Review of Economics Studies,65, 261-294, 1998.

HIRANO, K., IMBENS, G. W., RIDDER, G. Efficient estimation of average treatment


effects using the estimated propensity score. Cambridge, MA.: National Bureau of
Economic Research, 2003. Disponível em: http://ideas.repec.org/s/nbr/nberwo.html.

HOSMER, David; LEMESHOW, Stanley. Applied Logistic Regression – 2º Edition.


University of Massachusetts, Amherst, Massachusetts, 2000.

JONES, T.; SASSER JR. e EARL, W. Why satisfied customer defect. Harvard Business
Revivew, v. 73, n. 6, 9. 88-99, Nov./Dec. 1995.

KOTLER, Philip. Administração de Marketing. Editora Pearson, 12ª ed.: São Paulo, 2006. .

KOTLER, P. e ARMSTRONG, G. Princípios de marketing. 7ª.ed. Rio de janeiro: Prentice-


Hall, 1995. Cap. 18.

KRZANOWSKY, W. J. Principles of multivariate analysis. Oxford: Clarendon Press,


1988.

KUMAR, V.; RAMANI, G.; BOHLING, T. Customer Lifetime Value Approaches and
Best Practice Applications, Journal of Interactive Marketing, Vol 18. pag 60-72, 2004. .

LOVERLOCK, C.H. e WRIGHT, L. Services: Marketing e Gestão. Rio de Janeiro:


Saraiva, 2001.
105

LU, Junxiang. Predicting Customer Churn in the Telecommunication: An Aplication of


Survival Analysis Modeling Using SAS. Kansas – USA, Sprint Communications
Company, 2001. .

MCKENNA, R. Marketing de relacionamento: estratégias bem-sucedidas para a era do


cliente. Rio de Janeiro: Campus, 1993. 254p.

MCLACHLAN, G. Discriminant Analysis and Statistical Pattern Recognition. New York:


John Wiley e Sons.1992.

MENARD, SCOTT. Applied logistic regression analysis. 1995.

MEYER, P. L. – Probabilidade: aplicações à estatística; tradução do Prof. Ruy de C. B.


Lourenço Filho. Rio de Janeiro, Livros Técnicos e Científicos, 1978.

PARSONS, S. L. “Reducing Bias in a Propensity Score Matched-Pair Sample Using


Greedy Matching Techniques”. Proceedings of the 26º Annual SAS. Paper 214-26 <
http://www2.sas.com/proceedings/sugi26/p214-26.pdf. 2001.

PAULA, G.A. Modelos de regressão com apoio computacional. IME - USP. 294p.
Disponível em <http:// www.ime.usp.br/~giapaula>, 2004.

PEPPERS, Don. e ROGERS, Martha. Marketing One to One: ferramentas para


implementação de programas de marketing direto. São Paulo, 2001.

PINTO, Solange da C. Marketing de Relacionamento e Retenção de Clientes: um estudo de


caso na indústria jornalística. 1997. Mestrado. UFMG – Administração.

RAVALLION, M. The impact of economic policies on poverty and income distribution:


evaluation techniques and tools. Washington D.C.: World Bank, 2003. Cap.5, p.103-122.

REICHHELD, F.F. The loyalty effect: the hidden force behind growth, profits, and lasting
value. Boston: Harvard Business Scholl Press, 1996. .

REINARTZ, Werner J.; KUMAR, V. Customer Relationship Management: A Databased


Approach, ISBN: 0-471-27133-0, USA: John Wileye Sons, 2006. .

ROSENBAUM, P., Rubin, D. “The central role of the propensity score in observational
studies for causal effects”. Biometrika 70, 41–55. Rubin, D., 1983.
106

SABATINO, Luiz. Fidelização: a ferramenta de marketing que promove relacionamentos


duradouros com os clientes Rio de Janeiro: Reichmann e Afonso Editores, 2003 .

VAVRA, T.G. Marketing de relacionamento: Aftermarketing. São Paulo: Atlas, 1993.

ANS – Agência Nacional de Saúde Suplementar, < http://www.ans.gov.br>, 2003

IBGE – Instituto Brasileiro de Geografia e Estatística, < http://www.ibge.gov.br>, 2004


107

ANEXOS

ANEXO 1 – DEFINIÇÃO DAS VARIÁVEIS

SEGMENTO DE UTILIZAÇÃO
- Cirurgia: se o cliente fez alguma cirurgia nos últimos 12 meses
- Obstetrícia: se o cliente não teve evento de cirurgia, mas teve obstetrícia nos últimos 12
meses
- Consulta /Exame Baixa: se ocliente não fez cirurgia e não fez obstetrícia e sua média
mensal de eventos foi de até 0,667
- Consulta /Exame Média: se o cliente não fez cirurgia e não fez obstetrícia e sua média
mensal de eventos foi 0,667 a 1,667
- Consulta /Exame Alta: se o cliente não fez cirurgia e não fez obstetrícia e sua média
mensal de eventos foi superior a 1,667
- Não Usou: se o cliente não teve evento algum nos últimos 12 meses

ÁREA DE RENDIMENTO
- Classe A: Área Administrativa na cidade do Rio de Janeiro com Share de Rendimento até
5%
- Classe B: Área Administrativa no Rio de Janeiro com Share de Rendimento entre 5% e
10%
- Classe C: Área Administrativa no Rio de Janeiro com Share de Rendimento entre 10% e
15%
- Classe D: Área Administrativa no Rio de Janeiro Share de Rendimento entre 15% e 20%
- Classe E: Área Administrativa no Rio de Janeiro com Share de Rendimento acima de
20%
- Outros: Outros Estados no Estado do Rio de Janeiro
108

SHARE DE RENDIMENTO

- Representa o percentual médio que cada domicílio disponibiliza de sua renda mensal em
planos de saúde. Sua formulação segue:
109

ANEXO 2 – FREQUÊNCIA E CODIFICAÇÃO DAS VARIÁVEIS NO MODELO


110

ANEXO 3 – SYNTAX DO PSM (adaptado de John Painter, Fev 2004)

GET FILE= 'C:\Vinicius\Dissertacao\DADOS\churn_unimed.sav'.


COMPUTE id=$CASENUM.
exec.
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\churn_unimed.sav'

FILTER OFF.
USE ALL.
SAMPLE .20.
EXECUTE .
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\churn_unimed_amostra20.sav'

GET FILE= 'C:\Vinicius\Dissertacao\DADOS\churn_unimed_amostra20.sav'

COMPUTE X = RV.UNIFORM(1,26191) .
SORT CASES BY CHURN(D) PREV(D) X.
COMPUTE idx=$CASENUM.
exec.
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\mydata.sav'

* Erase the previous temporary result file, if any.


ERASE FILE= 'C:\Vinicius\Dissertacao\DADOS\results.sav'.
COMPUTE key=1.
SELECT IF (1=0).
exec.
* Create an empty data file to receive results.
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\results.sav'

SET MPRINT=no.
*////////////////////////////////.
DEFINE !match (nbtreat=!TOKENS(1)).
!DO !cnt=1 !TO !nbtreat
111

GET FILE= 'C:\Vinicius\Dissertacao\DADOS\mydata.sav'.


SELECT IF idx=!cnt OR CHURN=0.
* Select one CHURN case and all control .
DO IF $CASENUM=1.
COMPUTE #target=PREV.
ELSE.
COMPUTE delta=PREV-#target.
END IF.
EXECUTE.
SELECT IF ~MISSING(delta).
IF (delta<0) delta=-delta

SORT CASES BY delta.


SELECT IF $CASENUM=1.
COMPUTE key=!cnt .
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\used.sav'.
ADD FILES FILE=*.
/FILE= 'C:\Vinicius\Dissertacao\DADOS\results.sav'.
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\results.sav'

************************************************ Match back to original and


drop case from original .
GET FILE= 'C:\Vinicius\Dissertacao\DADOS\mydata.sav'.
SORT CASES BY idx .
MATCH FILES.
/FILE=*.
/IN=mydata.
/FILE= 'C:\Vinicius\Dissertacao\DADOS\used.sav'.
/IN=used.
/BY idx .
SELECT IF (used = 0).
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\mydata.sav'.
/ DROP = used mydata key delta.
EXECUTE.
!DOEND.
112

!ENDDEFINE.
*////////////////////////////////

SET MPRINT=yes

**************************.
* MACRO CALL (first insert the number of cases after nbtreat below) .
**************************.
!match nbtreat=5000

* Sort results file to allow matching

GET FILE= 'C:\Vinicius\Dissertacao\DADOS\results.sav'.


SORT CASES BY key.
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\results.sav'

******************.
* Match each CHURN cases with the most similar non CHURN case.
* To include additional variables from original file list them on the RENAME
subcommand below.
******************

GET FILE= 'C:\Vinicius\Dissertacao\DADOS\mydata.sav'.


MATCH FILES /FILE=*.
/FILE= 'C:\Vinicius\Dissertacao\DADOS\results.sav'.
/RENAME (idx = d0) (id=id2) (PREV=PREV2).
(CHURN=CHURN2) (key=idx).
/BY idx.
/DROP= d0.
FORMATS delta PREV PREV2 (F10.8).
SAVE OUTFILE= 'C:\Vinicius\Dissertacao\DADOS\mydata and results.sav'.
EXECUTE.

Вам также может понравиться