Вы находитесь на странице: 1из 10

ARTCULOS DE APLICACIN

3. ARTCULOS DE APLICACIN
TARIFICACIN DEL SEGURO DEL AUTOMVIL: MTODOS DE
ANLISIS MULTIVARIANTE
Eva Boj del Val
Departamento de Matemtica Econmica, Financiera y Actuarial
Universidad de Barcelona
1. Introduccin

2. Tarificacin de los seguros no vida

El actuario debe elaborar unas bases tcnicas


que comprendan, entre otros aspectos: informacin
genrica (explicacin del riesgo asegurable, los factores de riesgo considerados en la tarifa y los sistemas de tarificacin utilizados) e informacin estadstica sobre el riesgo (la estadstica utilizada indicando el tamao de la muestra, las fuentes, el mtodo de obtencin y el perodo a que se refiera).
Desde el punto de vista legal los seguros directos
se clasifican en los seguros de vida y el resto, tambin denominados de no vida. Los seguros de vida
cubren el riesgo de muerte y/o supervivencia de las
personas y los riesgos complementarios de accidenPara una correcta tarificacin es necesario tener te y enfermedad (vase [8] para un mayor detalle en
en cuenta las peculiariedades que cada cobertura la clasificacin de los ramos). En este trabajo nos
tiene actualmente en Espaa y en qu modo se rea- ocupamos de la tarificacin de los seguros no vida,
liza la recogida de datos, tanto a nivel de entidad y en especial del seguro del automvil.
aseguradora individual como a nivel de bases de da2.1. La prima o precio del seguro
tos y plataformas del sector asegurador.
Supongamos que disponemos de una cartera
El trabajo se ha estructurado como sigue: en el o conjunto de plizas infinita cuyos elementos son
apartado 2 realizamos una breve descripcin de los idnticos, es decir, que observamos el mismo riesgo
procesos de tarificacin de los seguros no vida; en de un ramo de no vida. Para cada pliza observael apartado 3 describimos el tipo de datos con el mos los datos referentes a la siniestralidad, recogida
que realizar el clculo de primas y los mtodos es- en las variables aleatorias nmero de siniestros (en
tadsticos aplicables para su resolucin, en especial general del perodo de un ao), N , y sus corresponel MLG y la RBD; en el apartado 4 discutimos las dientes cuantas, X para i = 1, . . . , N . El coste total
i
N
peculariedades del seguro obligatorio del automP
vil en Espaa y en qu modo deben ser tenidas en por pliza, S, viene dado por la suma: S = i=1 Xi . Si
cuenta en el clculo de sus tarifas; finalmente, en el asumimos como hiptesis del proceso de riesgo la de
apartado 5, comentamos las aportaciones recientes equidistribucin de las cuantas de los siniestros, la
y perspectivas futuras de investigacin respecto de de independencia entre dichas cuantas y la de indela RBD en su aplicacin en el mbito actuarial.
pendencia entre la cuanta por siniestro y el nmero

La tarificacin de los seguros, desde el punto de


vista tcnico1 , tiene como objetivo el correcto clculo de primas equitativas2 y suficientes3 . Distinguimos dos sistemas de tarificacin: a priori y a posteriori. Para la realizacin de un proceso de tarificacin el actuario hace uso de mtodos estadsticos,
principalmente de tcnicas de anlisis multivariante. En este trabajo nos centramos en las tcnicas
estadsticas que se aplican en la tarificacin a priori
del seguro del automvil, en concreto en el Modelo
Lineal Generalizado (MLG) y la Regresin Basada
en Distancias (RBD).

1 Ley

30/1995 de Ordenacin y Supervisin de los Seguros Privados.


principio de equidad se refiere a que la prima se ajuste al riesgo de siniestralidad de cada pliza, es decir, que el
asegurado pague segn el riesgo que incorpora. Este criterio implica tener en cuenta los factores de riesgo que explican en
mayor medida el comportamiento de la estructura aleatoria de siniestralidad.
3 El principio de suficiencia se refiere a que en trminos esperados las primas sean suficientes para cubrir todos los
riesgos de la cartera considerada y que permitan hacer rentable, en condiciones de estabilidad a largo plazo, a la empresa
aseguradora.
2 El

22

ARTCULOS DE APLICACIN

de siniestros, la esperanza del coste total por pliza,


E[S], la calculamos como el producto de la esperanza del nmero de siniestros por la esperanza de la
cuanta de un siniestro: E[S] = E [N ]E [X] . Esta
cantidad se denomina prima pura con bases de segundo orden, P . Cambiamos el riesgo aleatorio que
conlleva la pliza, que puede tomar cualquier valor
positivo o nulo, por un valor cierto fijo que coincide
con la esperanza matemtica del coste total:

tores potenciales de riesgo, los cuales pueden hacer


referencia a caractersticas del objeto asegurado o
a otros condicionamientos de este: caractersticas
del asegurado, del tomador del seguro, condiciones
socio-econmicas que lo rodean, etc. Los principios
tcnicos en que se basa la tarificacin a priori consisten en un proceso que debe solucionar las siguientes fases ([35], [19], [4], [6]):
1) La determinacin de la estructura de tarifa
que consiste en ([8]):

P = E [N ] E [X] .

- La seleccin de las variables de tarifa:


es la eleccin de los factores de riesgo
o caractersticas que utilizaremos para
distinguir a los asegurados con diferentes riesgos asociados ya que influyen en
la siniestralidad. Los factores seleccionados pasan a ser las denominadas variables tarificadoras o de tarifa;
- La determinacin de las clases de tarifa: es la eleccin de las clases o agrupaciones de clases de las variables tarificadoras que acaban discriminando a los
diferentes grupos de riesgo en la tarifa
final;
- La obtencin de los grupos de tarifa:
es la obtencin de grupos homogneos
de riesgo, exclusivos y exhaustivos, formados a partir de las clases de tarifa
anteriores;
- La inclusin de los gastos en la tarifa;
- Y el tratamiento especial y adecuado
de los grandes riesgos.

(1)

La prima pura (1) es la componente base del


precio del seguro, con esta cantidad la entidad aseguradora acumula la cantidad suficiente para hacer frente a los siniestros previstos y esperados. Su
clculo debe estar basado en informacin estadstica propia de cada ramo, y en su caso, de cada
producto o modalidad de seguro. Por ello, es necesario partir de una base de datos de calidad, tanto
a nivel individual de entidad aseguradora, como a
nivel sectorial.
En la prctica no se dispone ni de una cartera
infinita ni de suficiente informacin estadstica, por
lo que la prima de riesgo se corresponde con la esperanza matemtica (1) ms un recargo de seguridad
o de solvencia. Adems, hasta la obtencin del precio final del seguro, aadimos la parte de gastos de
gestin interna y externa de la entidad aseguradora, la parte de beneficios y los recargos externos a
la prima e impuestos repercutibles (ver [8]). En este
trabajo nos ocupamos nicamente del clculo de la
prima pura sin entrar en la aplicacin de recargos
de solvencia, para lo cual sera necesario tener en
2) El clculo de la prima para cada grupo de
cuenta que las diferentes coberturas no son indetarifa, que consiste en la estimacin de las primas
pendientes entre s.
de riesgo equitativas y suficientes que ajusten la si2.2. Tarificacin a priori o class-rating niestralidad para cada grupo de tarifa a partir de la
El sistema de tarificacin a priori asigna una esperanza del nmero de siniestros y de la cuanta
prima a un riesgo que se incorpora en una carte- por siniestro.
ra sin tener necesariamente experiencia sobre la si3) Por ltimo, se realiza la adecuacin de la taniestralidad que conlleva. nicamente es necesario rifa al mercado competitivo teniendo en cuenta la
conocer determinadas caractersticas para asignar competencia de mercado y los segmentos de poblauna siniestralidad esperada y con ella una prima.
cin a los que va dirigida la cobertura.
Supongamos que disponemos de la experiencia
Formamos pocos grupos si buscamos una tarifa
de una cartera para una determinada cobertura de resultante sencilla y aplicable, que diferencie mniseguro en un perodo fijado. Para cada pliza, se mamente los riesgos de calidades diferentes, o forhan observado los datos referentes a las variables mamos una agrupacin ms fina si el objetivo es
aleatorias de siniestralidad (nmero de siniestros y mayor ajuste en la prima individual y ms detalle
sus correspondientes cuantas), y una serie de fac- en la tarifa final.
23

ARTCULOS DE APLICACIN

Los pasos de seleccin de variables tarificadoras,


de determinacin de las clases de tarifa y de obtencin de los grupos de tarifa, dentro de la fase de
determinacin de la estructura de tarifa, estn entre ellos estrechamente vinculados, y su resolucin
no es independiente en funcin de las metodologas
de anlisis estadstico utilizadas (ver [8]).
Para la realizacin de un proceso de tarificacin
a priori es conveniente que la experiencia en que se
basa la tarifa pertenezca a un intervalo temporal lo
ms cercano posible al de actualizacin, y son necesarias revisiones peridicas con datos actualizados
que repitan el proceso con todas sus fases, empezando por la seleccin de variables de tarifa ([13]). Si el
perodo de observacin es el ao ms reciente los siniestros pueden ser siniestros en curso o pendientes
de reclamacin, ya que ese ao es el que tiene los siniestros ms inmaduros. En tal caso es conveniente
realizar, previamente al estudio de tarificacin, una
revisin de reservas de siniestros pendientes con el
objetivo de obtener niveles actualizados de siniestralidad. Este es el caso del seguro obligatorio del
automvil cuando analizamos la cuanta por siniestro para la cobertura de responsabilidad civil de
daos personales, ya que el perodo de maduracin
de dichos siniestros es largo.
2.3. Tarificacin
experience-rating

posteriori

En el seguro del automvil ([27], [30], [36], [37])


su aplicacin suele tomar como referencia el nmero de siniestros declarados en un perodo de un
ao; si no se han declarado siniestros a las garantas
computables se asciende por la escala de descuentos
uno o ms escalones. Por cada siniestro declarado a
las garantas computables se desciende por la escala
uno o ms tramos, bien reducindose los descuentos,
bien aplicando recargos. Tambin se han realizado
estudios basados en las cuantas de los siniestros
declarados ([33]).
3. Tarificacin y anlisis multivariante
En este apartado, describimos el tipo de datos
con el que realizar los estudios de tarificacin y las
tcnicas de anlisis multivariante empleadas para
su resolucin.
3.1. Datos: experiencia de siniestralidad
y factores de riesgo

Una fase previa a todo el proceso de tarificacin


es la recopilacin de los datos. Es imprescindible
procesar la mxima informacin en torno al riesgo
asegurado. La siniestralidad evoluciona en el tiempo por lo que es posible que a partir de un momento
o sea explicada por factores no tenidos en cuenta anteriormente.

El sistema de tarificacin a posteriori, en oposicin al de la tarificacin a priori, parte de una


prima inicial para cada unidad de riesgo, individuo
o grupo, que se modifica de acuerdo a la experiencia
individual o colectiva para dar lugar a las primas de
los perodos sucesivos. En un sentido amplio, la expresin experience-rating se aplica a todo problema
de actualizacin de tarifas mediante la incorporacin de nueva informacin.
La justificacin de estos sistemas est en que
dentro de cada clase de riesgo existe heterogeneidad
debida a la influencia de ciertos factores de riesgo
no considerados (conocidos o desconocidos) o a la
incorrecta agrupacin de las clases de los s considerados. La heterogeneidad queda recogida por la siniestralidad de los perodos sucesivos. Al considerar
la experiencia propia de cada pliza obtenemos un
mayor grado de equidad en las primas de ejercicios
posteriores. Incorporamos la informacin evolutiva
mediante un sistema de bonificaciones y penaliza24

ciones (sistema bonus-malus).

Una vez recopilados los datos, el paso bsico es


la seleccin de las variables de tarifa que influyen
por un lado en el nmero de siniestros, N , y, por
otro, la seleccin de las variables de tarifa que influyen en la cuanta de un siniestro, X. El conjunto
de factores de riesgo que explican ambas variables
no tienen por qu coincidir. Su seleccin, hasta la
formacin de los grupos de tarifa, se realiza mediante mtodos estadsticos de anlisis multivariante de
seleccin de predictores (ver [8]).
Experiencia de siniestralidad
El objetivo es clasificar las plizas segn el riesgo que incorporan, por lo que la variable aleatoria
que recoge la siniestralidad (coste total, S, nmero de siniestros, N , o cuanta de un siniestro, X)
es la variable dependiente. El nmero de siniestros,
N , es una variable discreta numrica que toma valores en los naturales. Dependiendo de la metodologa
estadstica utilizada, a veces es tratada como cuantitativa, y a veces como categrica ordinal.

ARTCULOS DE APLICACIN

carteras de seguros (n 1 104 ) es usual trabajar con


Los factores potenciales de riesgo, F = datos agregados. En este caso, los pesos se corres(f1 , f2 , . . . , fP ), son los predictores, mediante alguno ponden con el nmero de plizas para el nmero
de ellos (variables de tarifa) explicamos la estructu- medio de siniestros y el coste total medio, y con el
ra de riesgo. Son caractersticas medibles que ob- nmero de siniestros para la cuanta media por siservamos y que tienen una posible relacin de causa niestro. Para agregar los n datos consideramos que
con la siniestralidad objeto de estudio. Es necesario todos los factores son categricos (discretizando de
que tengan una definicin y que puedan ser repre- una manera adecuada a los continuos (ver [8])) y
construimos una tabla cruzada de todos ellos. Pasentados a travs de variables.
samos a tener tantas observaciones diferentes, m,
En general el conjunto de factores de riesgo es
como el producto del nmero de clases de todos los
de tipo mixto (mezcla de variables cuantitativas y
factores menos las combinaciones de celdas vacas.
cualitativas), y es importante disponer de los datos
En el tratamiento del nmero de siniestros con
en sus escalas originales. En ocasiones nos encondatos agregados (o en general ponderados) tenemos
tramos predictores continuos discretizados de antedos posiblidades ([15]). Una es la de trabajar dimano (por ejemplo la edad del conductor en interrectamente con la variable aleatoria nmero total
valos de edad). Esto implica una prdida de inforde siniestros por celda (o combinacin), Nu para
macin al pasar a una escala de medida menor. Reu = 1, . . . , m y otra ms habitual es trabajar con la
sulta imposible obtener los datos originales, cuantifrecuencia de siniestralidad. La frecuencia de siniestativos, de los ya codificados como discretizaciones,
tralidad se obtiene dividiendo la variable aleatoria
pues no sabemos qu valor tom la variable dentro
nmero total de siniestros por celda, Nu , por el nde cada grupo, slo sabemos entre qu valores osu
mero de expuestos o plizas de dicha celda, eu : N
eu
cil. En este caso no somos capaces de deshacer la
para u = 1, . . . , m. La ponderacin, wu , de la freagrupacin original para realizar otra que proporcuencia de siniestralidad de cada celda es wu = eu .
cione mejores resultados.
En el tratamiento de las cuantas de los siniesEl pequeo esfuerzo que representa para una entros con datos agregados tambin tenemos las dos
tidad aseguradora la correcta gestin inicial de daposibilidades anteriores: trabajar directamente con
tos (aparte de la gestin obligada para la ESA4 que
la variable aleatoria coste total de los siniestros por
requiere UNESPA5 ) supone una mejora significaticelda, Su para u = 1, . . . , m; o trabajar con la cuanva en el largo y costoso proceso de tarificacin que
ta media por celda construida dividiendo la variaha de servir a largo plazo para la obtencin de mayoble aleatoria coste total de los siniestros por celda,
res beneficios. El mercado espaol es competitivo y
Su , por el nmero de siniestros de dicha celda, nu :
ello implica un reto para las compaas que confan Su
para u = 1, . . . , m. La ponderacin de la cuanta
en mtodos simples de tarificacin que no tienen en nu
media de cada celda es wu = nu .
cuenta la composicin de sus carteras.
Podemos realizar dos procesos de seleccin de
Datos ponderados:
predictores diferentes, uno para el nmero de siniesCuando nos centramos en un perodo de obser- tros y otro para las cuantas de dichos siniestros. Los
vacin pueden haber plizas que no han estado en conjuntos de variables de tarifa as obtenidos puevigor durante el perodo completo porque se han den o no coincidir. Como resultado de la tarificacin
incorporado a lo largo del perodo o porque han obtenemos una prediccin para el nmero esperado
vencido a lo largo del mismo y no han renovado. de siniestros por pliza y una para la cuanta espePara reflejar este hecho una posibilidad es extrapo- rada de un siniestro, cuyo producto nos proporciona
lar el resultado de siniestralidad a todo el perodo, la prima pura (1).
3.2. Modelos de prediccin
y otra es ponderar la siniestralidad segn el tanto
por uno de perodo en que la pliza ha estado viva
Los primeros artculos sobre modelos estadsticon respecto al tiempo total ([5]).
cos en el seguro del automvil se centran en el nPor otro lado, debido al gran volumen de las mero de siniestros prestando menos atencin a las
Factores de riesgo

4 Estadstica
5 Unin

sectorial del Seguro de Automviles.


Espaola de Entidades Aseguradoras y Reaseguradoras.

25

ARTCULOS DE APLICACIN

cuantas. Histricamente el debate principal ha estado basado en si se deba utilizar un modelo aditivo
o uno multiplicativo para establecer la relacin entre el nmero medio de siniestros y los factores de
riesgo. Los dos modelos son casos particulares del
MLG: el modelo aditivo clsico de funcin de enlace
identidad y de error Normal ([28], [29], [?]), es decir,
el modelo clsico de regresin; y el modelo multiplicativo, de funcin de enlace logartmica, combinado
con una distribucin de Poisson ([38]). En [38] encontramos al MLG presentado como una extensin
del modelo clsico de regresin lineal, y como la formalizacin probabilstica motivada en los inicios por
el modelo de Bailey y Simons ([2],[3]) entre otros.
El modelo de prediccin ms sencillo es el modelo clsico de regresin lineal por mnimos cuadrados
ordinarios. Pero diversas limitaciones de este modelo (las deficiencias de ajuste en muchas situaciones
reales, la restriccin a respuestas gausianas o anlogas) motivan a buscar modelos ms generales que
permitan seleccionar la funcin de prediccin de una
familia ms amplia que la de las funciones lineales,
permitiendo alguna no linealidad. En este apartado
nos detenemos en dos formas importantes de introducir esta no linealidad correspondientes a los MLG
y a la RBD.
Ambos modelos de prediccin son extensiones en
direcciones distintas del modelo de mnimos cuadrados ordinarios, y estn contenidos en la clase mucho ms grande de los modelos no lineales. Fijada
una clase, encontramos el elemento de ella ms adecuado a unos datos concretos de acuerdo con algn
criterio de proximidad, como mnimos cuadrados o
mxima verosimilitud. Los modelos ms sencillos
son ms robustos, mientras que cuando se permite
una familia grande existe el peligro de caer en la
sobreparametrizacin.
Los Modelos Lineales Generalizados ([31],
[20]) han sido muy aplicados en tarificacin ([26],
[15], [7], [8]).
Cuando tarificamos respecto de la cuanta de
los siniestros es apropiado utilizar una distribucin
Gamma o una Gaussiana Inversa preferiblemente
a una Normal ya que estas distribuciones no toman valores negativos y tienen asimetra positiva;
y cuando tarificamos respecto del nmero de siniestros es apropiado utilizar una distribucin de Poisson, una Binomial o una Binomial Negativa. Vase
[31] pp. 337, 400 y 413-414 para un estudio deta26

llado sobre la funcin de enlace y la distribucin de


error ptimas para unos datos determinados y una
seleccin de predictores concreta. Los datos empleados en la referencia anterior son datos actuariales de
cuantas de siniestros extraidos de [1] referentes a la
cobertura de daos propios, estos mismos datos se
han empleado en [11] con RBD.
En general, el MLG ms apropiado para unos
datos es el que proporciona una menor desvianza
la medida que en estos modelos generaliza la suma de cuadrados residual. Las diferentes maneras
de reducirla son ([32]): variar la funcin de enlace,
variar la distribucin del error, y/o variar las variables de tarifa incluidas en el modelo. Lo usual,
aunque no ptimo, es fijar una funcin de enlace y
una distribucin del error y a posteriori realizar la
seleccin de variables de tarifa mediante un proceso
de seleccin de predictores haciendo uso del estadstico de test F basado en desvianzas ([15], [34],
[38]). Los programas informticos que ofrecen las
consultoras a las entidades aseguradoras suelen implementar nicamente y de manera cerrada el MLG
de distribucin del error Gamma para las cuantas
y de Poisson para el nmero de siniestros, pudiendo elegir entre el link identidad para componer una
tarifa aditiva y el logartmico para una multiplicativa. El MLG resultante permite cubrir la fase de
seleccin de variables de tarifa y tambin el clculo
de la prima pura (1). Esto no ocurre si la tcnica
estadstica utilizada para la seleccin de variables
de tarifa se basa por ejemplo en anlisis cluster o
anlisis discriminante (ver [8]).
La Regresin Basada en Distancias fue propuesta por Cuadras en [16]. Detalles y aportaciones
posteriores pueden verse en [17], [18], [8] y [12].
La RBD es una extensin del modelo clsico de
regresin: la informacin aportada por las variables
de tarifa queda reflejada en una matriz de distancias, intuitivamente la respuesta se proyecta en el
espacio eucldeo obtenido mediante escalado multidimensional mtrico de esta distancia. Con predictores cuantitativos y mtrica l2 se obtiene como
caso particular el modelo de mnimos cuadrados ordinarios.
Un resumen del procedimiento es como sigue:
partimos de una respuesta continua, y, centrada, y
un conjunto de predictores F (que pueden ser de
tipo mixto), mediante una mtrica eucldea ([14],
[24]) calculamos la matriz de distancias al cuadra-

ARTCULOS DE APLICACIN

do, 2 , y la de productos escalares G = 12 J2 J,


donde J es la matriz de centrado J = In n1 1n 1Tn .
Una descomposicin XXT = G (que existe por la
condicin eucldea) da una configuracin eucldea
centrada X, sobre la que aplicamos mnimos cuab = Hy donde
drados ordinarios. La prediccin, y
T
1
H = X(X X) XT y, puede obtenerse directamente sin explicitar X como H = G+ G siendo G+
la pseudo-inversa de Moore-Penrose de G ([21]).
Calculamos la prediccin para un nuevo individuo
{n + 1} haciendo uso de la frmula de interpolacin
de Gower ([22], [25]) y obtenemos la frmula de prebn+1 = 12 (g d)G+ y, donde g es el vector
diccin y
fila que contiene la diagonal de G y d es el vector
fila que contiene las distancias del nuevo individuo
al resto, d = (d2n+1,1 , . . . , d2n+1,n )T . En el caso general de predictores de tipo mixto podemos utilizar
el coeficiente de similaridad de Gower ([23], [24]).
Hemos construido implcitamente, mediante la
distancia, una funcin no lineal X = (F) que relaciona las variables observadas F con los predictores
eucldeos latentes X.
Esta no linealidad hace que la seleccin de variables de tarifa sea ms complicada que en el modelo
clsico, pues no es aplicable el test F usual. En [12]
proponemos una solucin adaptando un mtodo de
bootstrap no paramtrico para la estimacin de los
p-valores de un estadstico F generalizado. Al igual
que el MLG, la RBD permite cubrir todas las fases
de la tarificacin hasta la estimacin de las primas
puras.
4. Tarificacin del seguro del automvil en
Espaa en funcin de las coberturas
El seguro obligatorio del automvil cubre la responsabilidad civil a terceros respecto a los daos
personales y materiales ocasionados a terceras personas como consecuencia de un hecho de la circulacin. Ambas coberturas tienen frecuencia de siniestralidad y cuanta media de un siniestro muy
diferentes, por lo que diferenciamos la informacin
con el objetivo de calcular la esperanza del coste
total por pliza, (1) por separado. Por el mismo
motivo tratamos cada cobertura adicional al seguro
obligatorio del automvil hasta llegar a un todo riesgo (responsabilidad civil suplementaria, daos propios, rotura de lunas, incendio, robo, ...) tambin
por separado. Las primas puras totales por pliza
las calculamos como la suma aritmtica de las pri-

mas puras correspondientes a cada cobertura ([26]).


Si denotamos por c al nmero esperado de siniestros y por mc a la cuanta esperada de un siniestro
respecto a la cobertura c (siendo c: daos materiales, daos personales, daos propios, etc), la prima
pura total es:
PT =

c m c .

(2)

En el proceso de tarificacin realizamos la seleccin de variables de tarifa por separado para cada
cobertura y adems, dentro de cada cobertura, seleccionamos el conjunto de predictores respecto del
nmero de siniestros y respecto de la cuanta de
un siniestro. Los conjuntos de variables de tarifa
pueden o no coincidir. Como resultado obtenemos
una prediccin para el nmero esperado de siniestros por pliza y una para la cuanta esperada de
un siniestro para cada cobertura, lo que nos permite calcular la prima pura total (2). El estudio de
tarificacin puede llevarse a cabo con los datos de
la cartera o haciendo uso de las estadsticas basadas
en datos sectoriales.
En el seguro del automvil, y dependiendo de la
cobertura, los factores tenidos en cuenta son:
- Factores relativos al vehculo asegurado: valor,
antigedad, categora, clase, tipo, marca, modelo,
nmero de plazas, potencia, peso, o relacin potencia / peso, color, etc
- Factores relativos al conductor : edad, sexo, antigedad del carnet, estado civil, profesin, nmero
de hijos, posibilidad de conductores ocasionales, resultado de la experiencia en el pasado, etc
- Factores relativos a la circulacin: zona de circulacin, uso del vehculo, kilmetros anuales, etc
En la prctica, la calidad del ajuste, tanto si utilizamos el MLG o la RBD depende de la cobertura
y de si analizamos el nmero o las cuantas de los
siniestros. Por ejemplo, para la cobertura de daos
materiales es usual obtener un buen ajuste cuando
analizamos el nmero de siniestros con predictores
como la edad del conductor, la antigedad del carnet, la potencia del vehculo,... En cambio, cuando
analizamos las cuantas de los siniestros en la cobertura de daos personales es difcil obtener un buen
ajuste ya que las cuantas dependen en gran medida
de elementos que la entidad aseguradora no puede
controlar a priori.
27

ARTCULOS DE APLICACIN

4.1. Escenario actual del seguro del au- da una de las garantas contempladas, por ao de
tomvil en Espaa
estadstica y tipo de vehculo. La informacin de
Para una correcta tarificacin del seguro del au- detalle se divide en dos grandes bloques: por un latomvil debemos tener presentes las peculariedades do todo lo referente a responsabilidad civil, y por
que dicho seguro tiene en Espaa. En los ltimos otro, daos propios, incendio, lunas, robo, ocupanaos han habido cambios gracias a la utilizacin a tes, retirada de carnet y defensa Jurdica. Adems
nivel sectorial de las nuevas tecnologas de la in- se recogen aparte los casos especiales de flotas y
formtica y de las telecomunicaciones por parte de mercancas peligrosas. Como novedad se incorpora
UNESPA y gracias al servicio transaccional pres- informacin sobre el segundo conductor.
Con el fin de actualizar la informacin, en esta
tado por TIREA6 . En unos aos los servicios han
estadstica
se han modificado algunas de las varia7
crecido de forma importante (1994: CICOS , 2002:
bles
de
tarifa
utilizadas histricamente. Por ejem8
9
SDM , 2000: SINCO , 2001: ESA,...). Nos referimos
plo,
la
situacin
del riesgo se mide por la provincia
a [9] para un mayor detalle.
de la pliza y no por el lugar de ocurrencia del siLa Estadstica sectorial del Seguro de Au- niestro. Tambin se han actualizado las categoras
tomviles, ESA
y usos de los vehculos, y adicionalmente se utiliUNESPA ha realizado estadsticas comunes en za la informacin tcnica de cada vehculo aportapapel hasta 1997. Estas estadsticas han permitido a da por el cdigo de Base SIETE10 . El cdigo base
las entidades aseguradoras disponer de informacin SIETE incluye codificadas las principales caracteestadstica detallada a nivel sectorial. Actualmente, rsticas tcnicas de todos los vehculos susceptibles
la ESA, desde el ao 2001, ha retomado el anlisis de ser asegurados en Espaa y radica en Centro Zaestadstico. El servicio ESA est compuesto por una ragoza. Concretamente, las variables de tarifa por
base de datos con el total de expuestos y siniestros las que se pueden obtener resultados son: la edad,
aportados por las entidades aseguradoras colabora- la antigedad del carnet y el sexo del conductor, la
doras. En esta nueva estadstica slo las entidades provincia y la antigedad de la pliza, el tipo (y sus
aseguradoras que colaboran de forma activa tienen subcategoras), el uso, la antigedad y el valor del
acceso a los resultados agregados de las explotacio- vehculo.
nes estadsticas, cosa que implica un mayor grado
El servicio ESA (que funciona desde el ao 2001,
de compromiso por parte de las entidades asegu- y por lo tanto es un servicio bastante reciente) era
radoras y una mayor validez en los resultados. Las un servicio totalmente necesario para llenar el vaco
entidades aseguradoras no participantes reciben tan de informacin tcnica del riesgo elemental produslo un documento-resumen con informacin breve cido en el Sector Asegurador desde la ltima elay genrica.
boracin de la Estadstica Comn de Automviles
Dada la magnitud de las nuevas tecnologas, las del ao 1997. De cara a la tarificacin es importante
consultas de las estadsticas descriptivas resultantes resaltar que en la ESA las variables de tarifa utilizade la explotacin se realizan de forma on-line, exis- das y sus clases han sido actualizadas. A diferencia
tiendo la posibilidad de descargarlas en ficheros de de las estadsticas comunes anteriores que incluan
tipo Excel. Es posible solicitar dos tipos de explota- informes actuariales, los resultados de la ESA son
cin: explotacin global, con el total de datos carga- meramente descriptivos, pero permiten a las entidados por la totalidad de las entidades aseguradoras des aseguradoras descargar las consultas en ficheros
colaboradoras, y explotacin individual, para cada con los que realizar sus propios estudios.
una de las entidades aseguradoras participantes. De
Respecto a las garantas correspondientes a la
cada explotacin, se puede obtener un resumen eje- responsabilidad civil obligatoria en que se puede
cutivo, o un informe con informacin de detalle. El desglosar la estadstica, stas son: responsabilidad
resumen ejecutivo proporciona un resumen para ca- civil de daos materiales, responsabilidad civil de
6 Tecnologas

de la Informacin y Redes para las Entidades Aseguradoras.


Informtico de Compensacin de Siniestros.
8 Servicio de gestin de Siniestros de Daos Materiales.
9 Fichero histrico de SINiestralidad de COnductores.
10 Sistema Informativo de Especificaciones Tcnicas.
7 Centro

28

ARTCULOS DE APLICACIN

daos corporales, responsabilidad civil total y, como


novedad en las dos ltimas estadsticas, responsabilidad civil de siniestros tramitados por el sistema
CICOS y que son acreedores.

yecto MTM2006-09920/ que tiene de ttulo Anlisis


Multivariante No Lineal: Tcnicas No Paramtricas
y Basadas en Distancias y del que es investigador
principal el Dr. Pedro Delicado Useros del Departamento de Estadstica e Investigacin Operativa de
5. Aportaciones recientes y perspectivas
la Universidad Politcnica de Catalua. Agradezco
de futuro
las sugerencias de mis compaeros Ma Merc Cla- En el apartado 3.1 hemos visto que es habi- ramunt y Josep Fortiana.
tual trabajar con datos ponderados, por lo que para
Referencias
completar la aplicabilidad de la RBD en la tarificacin construimos la versin heteroscedstica del [1] Baxter L.A., Coutts S. M., and Ross G.A.F.
modelo de prediccin y adaptamos a este caso la
(1980). Applications of Linear Models in Motor
metodologa bootstrap de seleccin de predictores
Insurance. Transactions of the 21st Internatioincluido el estadstico de test que se desarrolla para
nal Congress of Actuaries, 2, 11-29.
el caso homocedstico en [12]. Parte de estos resul[2] Bailey R.A., and Simon L.J. (1960). Two stutados se han presentado ya en el XXIX Congreso
dies in automobile insurance ratemaking. ActuaNacional de Estadstica e investigacin Operativa
rial Studies in Non-Life Insurance Bulletin, 1:4,
celebrado en Tenerife en mayo de 2006 ([11]). En
192-217.
este trabajo se presenta la formulacin y una aplicacin con los datos de [1] referentes a cuantas de [3] Bailey R.A. (1963). Insurance rates with minimum bias. Proceedings of the Casualty Actuarial
siniestros para la cobertura de daos propios. ObSociety, 50, 4-11.
tenemos mejores resultados de ajuste con la RBD
que con el MLG. Como era de esperar para esta [4] Boj E., Claramunt M. M., and Fortiana J.
(2000). Una alternativa en la seleccin de los
cobertura, las variables de tarifa resultantes hacen
factores de riesgo a utilizar en el clculo de prireferencia a caractersticas del vehculo.
mas. Anales del Instituto de Actuarios Espao- Otro grupo de desarrollos se refiere a probleles, Tercera poca 6, 11-35.
mas numricos o computacionales de la RBD. Dentro de este mbito hemos presentado el trabajo Im- [5] Boj E., Claramunt M.M., and Fortiana J.
plementing PLS for distance-based regression ([10])
(2001). Weighted metric scaling applied to autoen el que adaptamos los Mnimos Cuadrados Parciamobile insurance data when the exposure base
les a la RBD con aplicacin carteras de seguros del
is not the unit. Proceedings of the Fifth Internamercado Espaol moderadamente grandes, n 104 .
tional congress on Insurance: Mathematics and
Economics. Penn State University.
- Por otro lado, fijado un conjunto de predictores, obtenemos una mayor flexibilidad si selecciona- [6] Boj E., Claramunt M.M., and Fortiana J.
mos de forma adaptativa la distancia de una familia
(2001). Herramientas estadsticas para el estude mtricas eucldeas indexadas por un hiperpardio de perfiles de riesgo. Anales del Instituto de
metro . De este modo el ajuste del modelo resulActuarios Espaoles, Tercera poca 7, 59-89.
tante es ptimo dentro de una familia de mtricas
dada. Unos primeros resultados pueden encontrarse [7] Boj E., Claramunt M.M., Fortiana J., and Vidieen [21].
lla A. (2002). The use of distance-based regres- Finalmente, una extensin de la RBD es la
sion and generalised linear models in the rate
RBD-MLG, que consiste en incorporar una funcin
making process. An empirical study. Mathemade enlace que relacione la esperanza de la respuesta
tics Preprint Series, Institut de Matemtica de
con el predictor lineal, en este caso una combinacin
la Universitat de Barcelona 305.
lineal de los predictores euclideos X.
[8] Boj E., Claramunt M.M., and Fortiana J.
(2004). Anlisis multivariante aplicado a la seAgradecimientos
leccin de factores de riesgo en la tarificacin.
Este trabajo est financiado, en parte, por el
Cuadernos de la Fundacin MAPFRE Estudios,
Ministerio de Ciencia y Tecnologa y FEDER, pro88.
29

ARTCULOS DE APLICACIN

[9] Boj E., Claramunt M.M., Fortiana J., and Ve- [19] de Wit G.W. (1986). Risk Theory, a Tool for
gas A. (2005a). Bases de datos y estadsticas del
Management. In: M. Goovaerts et al. eds., Inseguro de automviles en Espaa: influencia en
surance and Risk Theory. Reidel. Dordrechtel clculo de primas. Estadstica Espaola, 47,
Boston, MA, 7-17.
539-566.
[20] Dobson A.J. (2001). An Introduction to Ge[10] Boj E., Claramunt M.M., Gran A., and
neralized Linear Models. Second Edition. ChapFortiana J. (2005b). Implementing PLS for
man & Hall. London.
Distance-Based Regression: Computational is[21] Esteve A. (2003). Distancias estadsticas y resues. PLS AND RELATED METHODS. Prolaciones de dependencia entre conjuntos de vaceedings of the PLS05 International Symporiables. Tesis Doctoral. Universidad de Barcelosium, 153-158.
na.
[11] Boj E., Claramunt M.M., and Fortiana J.
[22] Gower J.C. (1966). Some distance properties of
(2006). Regresin basada en distancias en prelatent root and vector methods used in multivasencia de heteroscedasticidad. XXIX Congreso
riate analysis, Biometrika, 53, 325-338.
Nacional de Estadstica e investigacin Opera[23] Gower J.C. (1971). A general coefficient of sitiva, 279-280, Mayo de 2006, Tenerife.
milarity and some of its properties, Biometrics,
[12] Boj E., Claramunt M.M., and Fortiana J.
27, 857-874.
(2007). Selection of Predictors in DistanceBased Regression. Communications in Statistics [24] Gower J.C., and Legendre P. (1986). Metric
Simulation and Computation, 36:1, (to apand Euclidean Properties of Dissimilarity Coefpear).
ficients. Journal of Classification, 3, 5-48.
[13] Booth P., Chadburn R., Cooper D., Haber- [25] Gower J.C., and Hand D.J. (1996). Biplots.
man S., and James D. (1999). Modern Actuarial
London: Chapman and Hall.
Theory and Practice. Chapman & Hall. Boca
[26] Haberman S., and Renshaw A.E. (1996). GeRaton (California).
neralized Linear Models and Actuarial Science.
[14] Borg I., and Groenen P. (2005). Modern mulThe Statistician, 45:4, 407-436.
tidimensional scaling: theory and applications.
[27] Heras A., Vilar J.L., and Gil J.A. (2002).
Second Edition. Springer-Verlag. New York.
Asymptotic fairness of Bonus-Malus System and
[15] Brockman M.J., and Wright T.S. (1992). Staoptimal scales of premiums. The Geneva Papers
tistical Motor Rating: Making Effective Use of
on Risk and Insurance Theory, 27, 61-82.
your Data. Journal of the Institute of Actuaries,
[28] Lemaire J. (1977). Selection procedures of re119:3, 457-543.
gression analysis applied to automobile insu[16] Cuadras C.M. (1989). Distance Analysis in
rance. Mitteilungen der Vereinigung SchweizeDiscrimination and Classification using both
rischer Versicherungs-Mathematiker, 77:2, 143Continuous and Categorical Variables. In: Dod160.
ge, Y. (ed.), Recent Developments in Statistical
Data Analysis and Inference. Elsevier Science [29] Lemaire J. (1979). Selection procedures of
regression analysis applied to automobile insuPublisher, North-Holland, Amsterdam, 459-474.
rance. Part II: Sample Inquiry and Underwriting Applications. Mitteilungen der Vereinigung
[17] Cuadras C.M., and Arenas C. (1990). A
Schweizerischer
Versicherungs-Mathematiker,
distance-based model for prediction with mixed
79:1,
65-72.
data. Communications in Statistics Theory
and Methods, 19, 2261-2279.

[30] Lemaire J. (1995). Bonus-malus system in automobile insurance. Kluwer-Nijhof Publishing.


[18] Cuadras C.M., Arenas A., and Fortiana J.
Boston, MA.
(1996). Some Computational Aspects of a
Distance-Based Model for prediction. Commu- [31] McCullagh P., and Nelder J.A. (1989). Generanications in Statistics Simulation and Compulized Linear Models. Second Edition. Chapman
tation, 25, 593-609.
& Hall. London.
30

ARTCULOS DE APLICACIN

[32] Millenhall S.J. (1999). A systematic relationship between minimum bias and generalized li[36] Vegas A. (1993). Fundamentos tcnicos del sisnear models. Proceedings of the Casualty Actuatema Bonus-Malus. Previsin y Seguro, 22, 141rial Society, 86, 393-487.
167.
[33] Morillo I. (2001). Sistemas de Bonus-Malus:
Comparaciones y alternativas. Tesis Doctoral. [37] Vilar J.L., Gil J.A., and Heras A. (2004). Estudio de la estructura de una cartera de plizas
Universidad de Barcelona.
y de la eficiencia de un sistema Bonus-Malus.
[34] Stroinski K.J., and Currie I.D. (1989). SelecCuadernos de la Fundacin MAPFRE Estudios,
tion of Variables for Motor Insurance Rating.
84.
Insurance: Mathematics and Economics, 8, 3546.
[35] van Eeghen J., Greup E.K., and Nijssen J.A.
(1983). Rate Making. Survey of Actuarial Science, 2, Nationale-Nederlanden N. V. Rotterdam.

[38] Zehnwirth B. (1994). Ratemaking: from Bailey


and Simon (1960) to Generalised Linear Regression Models. Casualty Actuarial Society Winter
Forum, 615-659.

31

Вам также может понравиться