Вы находитесь на странице: 1из 36

CALCULO PRINCIPALES PARMETROS DE

POSICIN Y DISPERSIN

MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE POSICION
1.1 MEDIDAS
DE CENTRALIZACIN

MEDIA
MEDIANA
MODA

1.2 MEDIDAS DE
POSICIN
PROPIAMENTE DICHAS

QUARTILES
DECILES
CENTITLES

Medidas de tendencia central


Medidas de Posicin: son aquellos valores numricos que nos
permiten o bien dar alguna medida de tendencia central, dividiendo
el recorrido de la variable en dos, o bien fragmentar la cantidad de
datos en partes iguales. Las ms usuales son la media, la mediana,
la moda, los cuartiles, quintiles, deciles y percentiles. Pueden ser
de dos tipos: de tendencia central o de tipismo.
Medidas de Dispersin: se llaman medidas de dispersin aquellas
que permiten retratar la distancia de los valores de la variable a un
cierto valor central, o que permiten identificar la concentracin de
los datos en un cierto sector del recorrido de la variable. Se trata de
coeficientes para variables cuantitativas. Las ms usuales son el
desvo estndar y la varianza.

La Media
medias de los diferentes conjuntos. 3) Es posible hallar la media
de La idea de media o promedio (tambin llamada media
aritmtica) formaliza el concepto intuitivo de punto de equilibrio
de las observaciones. Es decir, es el punto medio del recorrido
de la variable segn la cantidad de valores obtenidos.
Ese valor tiene varias propiedades importantes. 1) Si se suma la
distancia de todos los valores respecto de la media, esa suma
da cero. 2) Si se toman una cantidad cualesquiera de conjuntos
de valores, cada uno con su respectiva media, la media del
conjunto general es igual a la suma de cada una de las un
conjunto de valores de una variable a partir de tomar la distancia
de las observaciones a un valor cualquiera (pertenezca o no al
recorrido de la variable) 4) si a un conjunto de observaciones de
una variable se le realiza una operacin matemtica usando un
valor constante, entonces la media del nuevo grupo de valores
as obtenidos es igual a la aplicacin de la misma operacin
matemtica usando ese valor constante sobre la media original.

El clculo de la Media
Dado un conjunto de observaciones
la media se representa mediante
y se obtiene dividiendo la suma de todos los
datos por el nmero de ellos, es decir:

La interpretacin de la media como centro (o punto de equilibrio) de los datos se


apoya en una propiedad que afirma que la suma de las desviaciones

de un conjunto de observaciones a su media es igual a cero; es decir, puede


probarse que

La media aritmtica de un conjunto de datos es el cociente entre la suma


de todos los datos y el nmero de estos.
Ejemplo: las notas de Alberto el ao pasado fueron:
5, 6, 4, 7, 8, 4, 6
La nota media de Juan es:

Hay 7 datos
que suman 40

5 6 4 7 8 4 6 40

5,7
Nota media =
7
7

Clculo de la media aritmtica cuando los datos se repiten.


1. Se multiplican los datos por sus frecuencias absolutas respectivas, y
se suman.
2. El resultado se divide por el total de datos.
Ejemplo. Las notas de un grupo de alumnos fueron:
Notas Frecuencia Notas x
absoluta F. absoluta
3
5
15
5
8
40
6
10
60
7
2
14
Total
25
129

Datos por frecuencias

Media

129
5,1
25

Total de datos

Mediana
La mediana, a diferencia de la media no busca el valor central del recorrido
de la variable segn la cantidad de observaciones, sino que busca
determinar el valor que tiene aquella observacin que divide la cantidad
de observaciones en dos mitades iguales. Por lo tanto es necesario atender
a la ordenacin de los datos, y debido a ello, este clculo depende de la
posicin relativa de los valores obtenidos. Es necesario, antes que nada,
ordenar los datos de menor a mayor (o viceversa).

en caso que N sea impar

La mediana de un conjunto de datos es un valor del mismo tal que el nmero de


datos menores que l es igual al nmero de datos mayores que l.

Ejemplo:

Los pesos, en kilogramos, de 7 jugadores de un


equipo de ftbol son: 72, 65, 71, 56, 59, 63, 72

1. Ordenamos los
56, 59, 63, 65, 71, 72, 72
datos:
2. El dato que queda en el centro es
La mediana vale 65.
65.
Caso:

Si el nmero de datos fuese par, la mediana es la


media aritmtica de los dos valores centrales.

Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana63 65
64
es:
2

Moda
La moda, es aquel dato, aquel valor de la
variable que ms se repite; es decir, aquel
valor de la variable (que puede no ser un
nico valor) con una frecuencia mayor.

La moda de un conjunto de datos es el dato que ms se repite.


Ejemplo.

Una zapatera ha vendido en una semana los zapatos


que se reflejan en la tabla:

N de calzado
N de personas

38
16

El nmero de zapato ms
vendido, el dato con mayor
frecuencia absoluta, es el 41.

39
21

40
30

41
35

42
29

43
18

44
10

45
7

Lo compran 35 personas
La moda es 41.

Cuartil, Quintiles, Deciles,


Percentiles
La mediana, como vimos, separa en dos mitades el conjunto
ordenado de observaciones.
Podemos a su vez subdividir cada mitad en dos, de tal manera que
resulten cuatro partes iguales. Cada una de esas divisiones se
conoce como Cuartil y lo simbolizaremos mediante la letra Q
agregando un subndice segn a cual de los cuatro cuartiles nos
estemos refiriendo.
Se llama primer cuartil (Q1) a la mediana de la mitad que contiene los
datos ms pequeos. Este cuartil, corresponde al menor valor que
supera o que deja por debajo de l a la cuarta parte de los datos.
Se llama tercer cuartil (Q3) a la mediana de la mitad formada por las
observaciones ms grandes. El tercer cuartil es el menor valor que
supera o que deja por debajo de l a las tres cuartas partes de las
observaciones.
Con esta terminologa, la mediana es el segundo cuartil (Q2) y el
cuarto cuartil (Q4) coincide con el valor que toma el ltimo dato, luego
de ordenados.

Cuartiles
DATOS ORDENADOS

25%

25%
MIN

Q1

25%
Q2

25%
Q3

MAX

~
X
Son 3 valores que dividen al conjunto de datos ordenados en forma
ascendente en 4 partes iguales. Primer (Q1), segundo (Q2) y tercer (Q3)
cuartil. A cada uno de ellos corresponde 25 % de los datos.

Uso de los cuartiles


Para indicar el porcentaje igual o menor que el valor de un
cuartil.
Para construir la curva endmica
Para describir el 50% central de las observaciones
Elaboracin de grafico de cajas

Medidas de dispersin
Rango o amplitud: la diferencia entre el
valor mximo y mnimo
Mximo

Mnimo

Rango

M1

100

100

M2

80

20

60

Datos

media

mediana

Rango

M3

0 5 5 5 10

10

M4

0 1 5 9 10

10

M3

20

100

60

70

M4

60

20

80

60

30

Media
M3

50

60

M4

50

60

mediana

10

20

30

40

50

60

70

80

90

100

Media Geomtrica
La media geomtrica es la raz
ensima del producto de todos
los valores de la serie.
Media Armnica
La media armnica se define
como el recproco de la media
aritmtica de los recprocos de
los valores.
y reacomodando la frmula se
tiene:

Medidas de Dispersin
El desvo estndar
Es posible identificar conjuntos de datos que a pesar de ser
muy distintos en trminos de valores absolutos, poseen la
misma media. Una medida diferencial para identificar esos
conjuntos de datos es la concentracin o dispersin
alrededor de la media.
Una manera de evitar que los distintos signos se compensen
es elevarlas al cuadrado, de manera que todas las
desviaciones sean positivas. La raz cuadrada del promedio
de estas cantidades recibe el nombre de desvo estndar, o
desviacin tpica y es representada por la siguiente frmula:

A mayor valor del coeficiente del desvo estndar, mayor dispersin de los datos con
respecto a su media. Es un valor que representa los promedios de todas las
diferencias individuales de las observaciones respecto a un punto de referencia
comn, que es la media aritmtica. Se entiende entonces que cuando este valor es
ms pequeo, las diferencias de los valores respecto a la media, es decir, los desvos,
son menores y, por lo tanto, el grupo de observaciones es ms homogneo que si el
valor de la desviacin estndar fuera ms grande. O sea que a menor dispersin
mayor homogeneidad y a mayor dispersin, menor homogeneidad.
La Varianza
El cuadrado de la desviacin estndar recibe el nombre de varianza y se representa
por
.
La suma de los cuadrados de los desvos de la totalidad de las
observaciones, respecto de la media aritmtica de la distribucin, es menor que la
suma de los cuadrados de los desvos respecto de cualquier otro valor que no sea la
media aritmtica.
Si observamos, veremos que la varianza no es ms que el desvo estndar al
cuadrado. Precisamente la manera de simbolizarla es.
Por lo mismo, el desvo estndar puede definirse como la raz cuadrada de la varianza

8 cms.

Aqu tenemos 9 rectngulos cuya altura es de 8 centmetros (y todos


tienen la misma base).
Existe alguna variacin respecto de su altura entre estos rectngulos?
Cul es el promedio de la altura de estos rectngulos?
8+8+8+8+8+8+8+8+8
9

72
=8
9

10 cms
6 cms
8 cms.

El quinto rectngulo y el octavo rectngulo en un acto de rebelda


cambiaron su altura. El quinto rectngulo, ahora de color rojo, mide 10
centmetros, y el octavo rectngulo, de color azul, mide 6 centmetros?
Cul es el nuevo promedio de estos 9 rectngulos?
8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8
9

72
=8
9

... el mismo promedio! Pero... ha habido variacin?

10 cms
6 cms
8 cms.

El rectngulo rojo tiene +2 centmetros sobre el promedio, y el


rectngulo azul tiene 2 centmetros bajo el promedio. Los otros
rectngulos tienen cero diferencia respecto del promedio.
Si sumamos estas diferencias de la altura respecto del promedio,
tenemos
0+0+0+0+2+0+02+0 =0
Este valor nos parece indicar que no ha habido variabilidad! Y sin
embargo, ante nuestros ojos, sabemos que hay variacin.

10 cms
6 cms
8 cms.

Una forma de eliminar los signos menos de aquellas diferencias que


sean negativas, esto es de aquellos mediciones que estn bajo el
promedio, es elevar al cuadrado todas las diferencias, y luego sumar...
02 + 02 + 02 + 02 + 22 + 02 + 02 + ( 2)2 + 02 = 8
Y este resultado repartirlo entre todos los rectngulos, es decir lo
dividimos por el nmero de rectngulos que es 9
02 + 02 + 02 + 02 + 22 + 02 + 02 + ( 2)2 + 02 =
9

8
9

= 0,89

10 cms
6 cms
8 cms.

Se dice entonces que la varianza fue de 0,89


Observemos que las unidades involucradas en el clculo de la varianza
estn al cuadrado. En rigor la varianza es de 0,89 centmetros cuadrados.
De manera que se define

0,89 0,943
La raz cuadrada de la varianza se llama desviacin estndar

10 cms
6 cms
8 cms.

Que la desviacin estndar haya sido de 0,943 significa que en promedio la


altura de los rectngulos variaron (ya sea aumentando, ya sea
disminuyendo) en 0,943 centmetros.
Es claro que esta situacin es en promedio, puesto que sabemos que
los causantes de la variacin fueron los rectngulos quinto y octavo.
Esta variacin hace repartir la culpa a todos los dems rectngulos
que se portaron bien.
La desviacin estndar mide la dispersin de los datos respecto del
promedio

10 cms
8 cms.
8 cms.8 cms.
8 cms.
8 cms.
7 cms.
6 cms
4 cms

Cul es la varianza y la desviacin estndar de las alturas de los rectngulos?


En primer lugar debemos calcular el promedio
8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8
= 7,44
9
Luego debemos calcular la varianza

10 cms
8 cms.

8 cms.

8 cms.

8 cms.

7 cms.

4 cms

0,56

-3,44

0,56

0,56

2,56

0,56 -0,44

8 cms.
6 cms

-1,44
0,56

7,44
Promedio
0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562 22,2224
=
9
9
Este es el valor de la varianza

= 2,469

10 cms
8 cms.

8 cms.

8 cms.

8 cms.

4 cms

7 cms.

8 cms.
6 cms

7,44
Promedio
Si la varianza fue de 2,469, entonces la desviacin estndar es de...

2, 469 1,57
Lo que significa que, en promedio, los rectngulos se desviaron ms o
menos (ms arriba o ms abajo) en 1,57 centmetros.

Para entender la varianza necesariamente debe saber:


Sumar
Restar
Multiplicar
Dividir
Potencia de orden 2
Raz cuadrada
Y es claro que esto no es suficiente (salvo que queramos que aprenda de
memoria los clculos). Necesitamos estimular su imaginacin para que
vea la variabilidad existente en la naturaleza.
Entregue una lista de fenmenos en que un mismo atributo tenga
variabilidad si se mide este atributo a un nmero de individuos u objetos.

Coeficiente de Variacin Pearson


Medida de variabilidad relativa: se usa para comparar la
variabilidad entre dos o mas muestras medidas en las mismas
unidades o no

s
CV % : *100
x
Si el coeficiente es:
<10% poca dispersin
10-33% aceptable
34-50% alta dispersin
>50% muy alta

Poblacin
( parmetros: X; DS)

Muestra
x

(estimadores: x ,s )

DEFINICIONES

Un Parmetro es una caracterstica numrica de la poblacin


(se representan con letras griegas)
Un Estimador a una caracterstica numrica de la muestra
( se representan con letras latinas)

Porque se usa la media junto con la desviacin


estndar en el anlisis de datos
Se requiere expresar una medida que represente
a todos los datos (media) pero al mismo tiempo
se desea expresar la variacin de los mismos
respecto a esa medida de tendencia central