Вы находитесь на странице: 1из 19

Tema.4. Medidas de posicin.

Medidas de
posicin individual, centiles. Medidas de
posicin grupal. Concepto de tendencia
central. Media, mediana y moda.
Propiedades. Resistencia y robustez.
Medidas robustas de la tendencia central.

Medidas de posicin individual: centiles


Los centiles dividen la distribucin (ordenada) de datos en 100
partes. Cada parte contiene 1/100 de las puntuaciones.

El Centil 60, por ejemplo, es aquella puntuacin que deja por


debajo de s el 60% de los datos. El Centil 15 es aquella
puntuacin que deja por debajo de s el 15% de los datos.

Los centiles son cuantiles que dividen la distribucin en 100


partes. Hay otros cuantiles. Uno de ellos es la mediana, que
divide la distribucin en dos partes (Mediana=Centil 50)

Otros cuantiles son los deciles (Decil 1=Centil 10) y los cuartiles
(Cuartil 1=Centil 25, Cuartil 2= Mediana, Cuartil 3=Centil 75)

Medidas de posicin individual: centiles


Clculo de centiles

Centil k:

Mediana (Centil 50):

Posicin de Orden = ( N 1)

k
100

Posicin de Orden = ( N 1)

50
100

NOTA: el clculo lo veremos con datos individuales, y no con datos


agrupados

Medidas de posicin grupal.


Concepto de tendencia central.
Nos indican un valor representativo del grueso de los datos, de
la referencia de los mismos un valor central.

Ejemplo: con las calificaciones 4,7,5,6,5,4,5,5,5,6,5,4,4,


es claro que (a ojo) estn en torno a cinco, que podra ser
tomado como ndice de tendencia central.

Veremos primero los 3 ndices de tendencia central ms comunes (moda,


media y mediana). Despus veremos otros ndices que han sido propuestos.

Media aritmtica
Frmula:

Simplemente se trata de sumar todos los valores y dicha


cantidad se divide por el nmero de valores que tengamos.
Si tenemos los datos: 4,6,5,3,7

La media ser (4+6+5+3+7)/5=4

Nota: se pueden emplear medias aritmticas ponderadas.


Pensemos que hay 2 datos, uno (5) pesa 06 y el otro (6) pesa 04.
Entonces, la media ser (5*06+6*04)/(06+04)=54

Propiedades de la Media aritmtica


-La suma de diferencias (de todos los valores) respecto a la
media es siempre 0

-Si sumamos una constante a cada uno de los valores, la nueva


media aritmtica resultante ser la original ms la constante.

-Si multiplicamos cada uno de los valores por una constante, la


nueva media aritmtica ser la original por la constante.
-Minimiza la suma de diferencias en trminos cuadrticos.

Mediana
La Mediana (Mdn o Md) se define como el valor que tiene la
propiedad de que el nmero de observaciones menores que l
es igual al nmero de observaciones mayores que l.

Por ejemplo, en la secuencia (ordenada) 3,4,5,6,7,8,9


la mediana ser 6

En la secuencia (ordenada) 2,3,4,6,7,9


la mediana ser 5 (la media aritmtica entre los dos valores
centrales; observad que n es par; en el ejemplo de arriba era
impar)

Propiedades de la mediana
-No utiliza todos los elementos
-Se puede calcular con datos ordinales
-Se ve menos afectada por datos atpicos que la media
aritmtica.
-Minimiza la suma de diferencias en valor absoluto
(recordad que la media aritmtica minimizaba la suma de
diferencias en trminos cuadrticos)

Ejemplo uso de la mediana


Los 9 empleados de una nueva empresa viven al
lado de la Nacional 340 en diferentes kilmetros:
3

Km 1

5 6

Nm. Emp.

1
26

Dado que todos viajan en coche, y sabiendo que quieres minimizar el coste en
gasolina, en qu lugar pondras la empresa para minimizar tal coste?

La moda
Se define como Moda (Mo) aquel valor de la variable al que
corresponde mayor frecuencia.

En el conjunto de datos: 4,5,6,6,3,6,4,5 la Mo=6

Propiedades:
-No es necesariamente nica (puede haber varias modas)
-Se puede calcular con datos en escala nominal
-En su clculo no intervienen todos los elementos

Cul elegir?

Moda

Mediana

Media

Resistencia y robustez
Estadsticos resistentes: Son aquellos que no se ven
influidos (o solo ligeramente) por pequeos cambios
en los datos.

Evidentemente, la media es un estadstico muy poco


resistente a cambios en los datos, dado que se ve
influida por todos y cada uno de ellos.
La mediana, en cambio, es un estadstico altamente
resistente.

Estadsticos (Estimadores) robustos (ESTADSTICA


INFERENCIAL): Son aquellos estadsticos
(estimadores) que funcionan bien para varios tipos
distintos de distribuciones tericas, aunque pueden no
ser el mejor estimador para ningn tipo concreto de
distribucin. Es decir, son el mejor compromiso.

La media no es un estimador robusto.


La mediana es un estimador ms robusto
que la media, si bien hay otros estimadores
ms robustos que veremos en el punto
siguiente del temario.

Medidas robustas de tendencia central


1. Medias Recortadas
Consiste en calcular la media aritmtica sobre un subconjunto central
del conjunto de datos, no considerndose una determinada proporcin p
por cada extremo. (p se expresa normalmente como porcentaje).

Por ejemplo, una media recortada al 40% en una secuencia de 10 datos


implica no tener en cuenta ni los 4 valores menores ni los 4 valores
mayores.

Observar que la media recortada al 0% es la media aritmtica.

A la media recortada al 25% se la denomina centrimedia.

Medidas robustas de tendencia central


1. Medias Recortadas (cont)
Calcula la media recortada al 5% de los siguientes datos:
3, 4, 4, 5, 5, 6, 7, 8, 9, 11

El valor debe ser 6.11

Calcula la media recortada al 10% de los datos anteriores (da 6)

Calcula la centrimedia (da 5.8)

Medidas robustas de tendencia central


2. Media Winsorizada
Es anlogo a las medias recortadas excepto en que las puntuaciones
eliminadas, ya no lo son sino que se sustituyen por los valores menor y
mayor que quedan para el cmputo de la media winsorizada.
As, en la media recortada a nivel 2 implicara eliminar las dos
puntuaciones mayores y las 2 menores:
3, 4, 4, 5, 5, 6, 7, 8, 9, 11
Y quedan los datos: 4, 5, 5, 6, 7, 8 y se calcula la media de los mismos

En la media winsorizada, los datos 3 y 4 (los dos menores) y el 9 y 11


(los dos mayores) se sustituyen por 4 y 8 respectivamente. Es decir,
4, 4, 4, 5, 5, 6, 7, 8, 8, 8 y se calcula la media de los mismos, que ser la
media winsorizada a nivel 2 (debe de dar 5.9)

Medidas robustas de tendencia central


3. Otros tipos de media en la que se recortan datos
En muchas ocasiones lo que se hace es emplear un valor mnimo y uno
mximo ms all del cual se eliminan los datos que sobrepasen tales
valores.

Por ejemplo, en experimentos de tiempo de reaccin para discriminar


palabras/pseudopalabras se pueden eliminar datos menores de 200 ms
y mayores de 1500 ms. (Menos de 200 ms es demasiado rpido; ms de
1500 ms es demasiado lento.)

De esta manera, si todos los datos estn en el rango 200-1500 ms no se


elimina ningn dato

Medidas robustas de tendencia central


4. Trimedia
Es un ndice de tendencia central que consiste en calcular una media
aritmtica ponderada de tres medidas, la Mediana (con peso doble) y el
primer y tercer cuartil.

Pensemos que en un conjunto de datos, el primer cuartil es 51, la


mediana es 55 y el tercer cuartil es 63. La trimedia es:

Medidas robustas de tendencia central


5. Otras medidas robustas
El estimador-M de Huber, el estimador biponderado de Tukey, el estimador
M-redescendente de Hampel y el estimador en onda de Andrew. Estos
estimadores se diferencian entre s por el tipo de ponderacin aplicada sobre
los datos.
Por ejemplo, en el Estimador-M de Huber (Estimador M de posicin): Las
puntuaciones tpicas que sean menores que una constante, reciben un peso
de 1. Los casos que tienen los mayores valores absolutos tienen pesos tanto
ms pequeos cuanto mayor es su distancia respecto a cero. La constante es
1.339.
Clculo: lo da el SPSS.

Вам также может понравиться