You are on page 1of 12

Parmetros y estadsticos

Parmetro: Es una cantidad numrica calculada sobre una


poblacin y resume los valores que esta toma en algn atributo
Intenta resumir toda la informacin que hay en la poblacin en unos pocos
nmeros (parmetros). La altura media de los sujetos

Estadstico: Es una cantidad numrica calculada sobre una


muestra que resume su informacin sobre algn aspecto

Si un estadstico se usa para aproximar un parmetro tambin se le suele


llamar estimador

Normalmente nos interesa conocer un parmetro, pero por la dificultad que


conlleva estudiar a *TODA* la poblacin, calculamos un estimador sobre
una muestra y confiamos en que sean prximos.

Tipos de estadsticos
Posicin
Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
Entre ellos cabe destacar: Cuantiles, percentiles, cuartiles, deciles,...
Centralizacin
Indican valores con respecto a los que los datos parecen agruparse.
Entre ellos cabe destacar: Media, mediana y moda
Dispersin
Indican la mayor o menor concentracin de los datos con respecto a
las medidas de centralizacin.
Entre ellos : Desviacin tpica, coeficiente de variacin, rango, varianza
Forma
Dan una idea de cmo se distribuyen los datos
Entre ellos: Asimetra, Apuntamiento o curtosis

1
Estadsticos de posicin
Se define el cuantil de orden a como un valor de la variable por
debajo del cual se encuentra una frecuencia acumulada a.
Casos particulares son los percentiles, cuartiles, deciles, quintiles,...

2
Percentiles y cuantiles
Percentil de orden k = cuantil de orden k/100
. La mediana se corresponde con el percentil 50

El percentil de orden 15 deja por debajo al 15% de las observaciones.


Por encima queda el 85%
Cuartiles: Dividen a la muestra en 4 grupos con frecuencias
similares.
Primer cuartil = Percentil 25 = Cuantil 0,25

Segundo cuartil = Percentil 50 = Cuantil 0,5= mediana

Tercer cuartil = Percentil 75 = Cuantil 0,75

Ejemplos
El 5% de los recin nacidos tiene un peso demasiado bajo. Qu
peso se considera demasiado bajo?
Percentil 5 o cuantil 0,05

Qu peso es superado slo por el 25% de los individuos?


Percentil 75 o cuantil 0,75

El colesterol se distribuye simtricamente en la poblacin. Se


considera patolgico los valores extremos. El 90% de los individuos
son normales Entre qu valores se encuentran los individuos
normales?
Entre el percentil 5 y el 95

3
Qu peso no llega a alcanzar el 25%
de los individuos?
Primer cuartil = Percentil 25= 60 Kg
Qu peso es superado por el 25% de
los individuos?
Tercer cuartil = Percentil 75 = 80 Kg
Entre qu valores se encuentra el
50% de los individuos con un peso
ms normal?
Entre el primer y tercer cuartil = entre 100
60 y 80 kg.
Este intervalo coincide con los individuos 90

que ocupan la parte central de la muestra. 80

Los diagramas de caja sintetizan esta


informacin. 70

Estadsticos 60

PESO
Percentiles 25 60,00 50

50 70,00
75 80,00 40

Ejemplos Estadsticos

Nmero de aos de escolarizacin


N Vlidos 1508
Nmero de aos de escolarizacin Perdidos 0
Media 12,90
Porcentaje Mediana 12,00
Frecuencia Porcentaje acumulado Moda 12
3 5 ,3 ,3 Percentiles 10 9,00
20 11,00
4 5 ,3 ,7
25 12,00
5 6 ,4 1,1 30 12,00
6 12 ,8 1,9 40 12,00
7 25 1,7 3,5 50 12,00
60 13,00
8 68 4,5 8,0
70 14,00
9 56 3,7 11,7 75 15,00
10 73 4,8 16,6 80 16,00
11 85 5,6 22,2 20%? 90 16,00
12 461 30,6 52,8
13 130 8,6 61,4
14 175 11,6 73,0
15 73 4,8 77,9
16 194 12,9 90,7 90%?
17 43 2,9 93,6
18 45 3,0 96,6
19 22 1,5 98,0
20 30 2,0 100,0
Total 1508 100,0

4
Medidas de centralizacin
Media (Mean) Es la media aritmtica (promedio) de los valores
de una variable. Suma de los valores dividido por el tamao
muestral.
La media es un promedio aritmtico: de 2,2,3,7 es (2+2+3+7)/4=3,5
Conveniente cuando los datos se concentran simtricamente con
respecto a ese valor. Muy sensible a valores extremos.
Se puede considerar como el centro de gravedad de los datos
Mediana (median) Es un valor que divide a las observaciones
en dos grupos con el mismo nmero de individuos (percentil 50). Si
el nmero de datos es par, se elige la media de los dos datos
centrales.
Mediana de 1,2,4,5,6,6,8 es 5
Es conveniente cuando los datos son asimtricos. No es sensible a
valores extremos.
Ejemplo: Mediana de 1,2,4,5,6,6,800 es 5. La media es 117,7!
Moda (mode) Es el/los valor/es donde la distribucin de
frecuencia alcanza su mximo.

Las formulas
Media (Para datos sin agrupar: x1, x2, ..., xn )

x=
x
i i

n
Media (Para agrupados u organizados en tablas)
Variable fr. fr. ac.

xn = N
L0 L1 x1 n1 N1
i i i
L1 L2 x2 n2 N2
x= i
... n n
Lk-1 Lk xk nk Nk
n

Cuartil de orden (Para agrupados u organizados en tablas)


Siendo i es el menor intervalo que tiene frecuencia acumulada
superior a n
n N i 1
C = Li 1 + ( Li Li 1 )
ni

5
Altura mediana

Ejemplo con variables agrupadas


La media, en teste caso, se desplaza hacia los valores extremos. No
coincide con la mediana. Es un punto donde el histograma estara
en equilibrio si tuviese masa.
Peso Marca N %
40 50 45 5 5
50 60 55 10 15
60 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
100 130 115 3 58
Total 58

Para calcular la media


es necesario elegir un
punto representante
del intervalo: La
marca de clase.

6
n N i 1 0,5 58 Ni 1
C = Li 1 + ( Li Li 1 ) Mediana = C0,5 = Li 1 + ( Li Li 1 )
ni ni
0,5 58 15 )
= 60 + (70 60) = 66,6
21
Peso Marca N %
40 50 45 5 5
50 60 55 10 15
60 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
0,5 58 15 )
100 130 115 3 58 C0,5 = 60 + (70 60) = 66,6
58 21

Variabilidad o Dispersin
La variabilidad de en los valores de un cualquier atributo que
evaluemos est presente siempre en la naturaleza y en cualquier
fenmeno social, su origen en ciencias sociales, es siempre mltiple.
EJEMPLO: Los estudiantes de Sociologa reciben diferentes
calificaciones en la asignatura (variabilidad). A qu puede deberse?
Diferencias individuales en el conocimiento de la materia.
Podra haber otras razones (fuentes de variabilidad)? . Supongamos
que todos los alumnos poseen el mismo nivel de conocimiento. Las
notas seran las mismas en todos? Seguramente No.

Dormir poco el da del examen, el croissant estaba envenenado...


Diferencias individuales en la habilidad para hacer un examen.
El examen no es una medida perfecta del conocimiento.
Variabilidad por error de medida.
En alguna pregunta difcil, se duda entre varias opciones, y al
azar se elige la mala.
Variabilidad por azar, aleatoriedad.

7
Medidas de Dispersin
Miden el grado de dispersin (variabilidad) de los datos,
independientemente de su causa.
Amplitud o Rango (range):
Es la diferencia entre las observacines
extremas.
Es muy sensible a valores extremos.
EJEMPLO: 2,1,4,3,8,4.
El rango es 8-1=7.
25% 25% 25%
Rango intercuartlico
(interquartile range):
Es la distancia entre el primer y tercer
cuartil.
Parecida al rango, pero elimina las
observaciones ms extremas inferiores y
superiores, hacindose menos sensible a
valores extremos.
Rango intercuartlico = P75 - P25

Variabilidad o Dispersin
Varianza S2 (Variance): Mide el promedio de las desviaciones
(al cuadrado) de las observaciones con respecto a la media.

1
S2 =
n i
( xi x ) 2

Es sensible a valores extremos (alejados de la media).

Sus unidades son el cuadrado de las de la variable.

El llamado coeficiente de inercia (mayor o menor dispersin de


los valores) influye en sus valores. Como la razn fsica de porqu
un patinador gira a diferente velocidad cuando extiende o recoge sus
brazos
Por estos inconvenientes se utiliza la Desviacin tpica

8
Desviacin tpica
Desviacin tpica (standard deviation). Es la raz cuadrada de la
varianza
x 2 x + 2

S = S2 50
x x +

Tiene las misma dimensionalidad


40
(unidades) que la variable. La
distribucin (normal o gaussiana)
30
viene determinada por la media y
la desviacin tpica.
20

A una distancia de una desv. tpica


de la media tendremos 68% 10
Desv. tp. = 568,43
observaciones. Media = 2023
0 N = 407,00
A una distancia de dos desv. tpica 50

90

1.

1.

2.

2.

2.

3.
de la media tendremos 95%
30

70

10

50

90

30
0

0
observaciones. Peso recin nacidos en partos gemelares

Centrado en la media y a una


desviacin tpica de distancia
tenemos ms de la mitad de las
observaciones

A dos desviaciones tpicas las


tenemos a casi todas

9
Coeficiente de variacin
Es la razn entre la desviacin tpica y la media.
Mide la desviacin tpica en forma de qu tamao tiene con
respecto a la media o desviacin por unidad de media
S
CV =
x
Tambin se la denomina Variabilidad relativa
Es frecuente mostrarla en porcentajes.
EJEMPLO: Si la media es 80 y la desviacin tpica 20 entonces
CV=20/80=0,25=25% (variabilidad relativa)
Es una cantidad adimensional. Interesante para comparar la
variabilidad de diferentes variables.
EJEMPLO: Si el peso tiene CV=30% y la altura tiene CV=10%, los
individuos presentan ms dispersin en peso que en altura.
No debe usarse cuando la variable presenta valores negativos o
donde el valor 0 sea una cantidad fijada arbitrariamente

Asimetra o sesgo
Una distribucin es simtrica
si la mitad izquierda de su
distribucin es la imagen
especular de su mitad
derecha.
En las distribuciones
simtricas media y mediana
coinciden. Si slo hay una
moda tambin coincide
La asimetra es positiva o
negativa en funcin de a qu
lado se encuentra la cola de la
distribucin
La media tiende a desplazarse
hacia las valores extremos
(colas). Discrepancias entre
las medidas de centralizacin
indican la asimetra.

10
Estadsticos de Asimetra
Basados en diferencia entre estadsticos de tendencia central, se utilizan:
Por diferencias intercuartlicas 1 y 2 cuartiles y 2 y 3.

Basados en desviaciones con signo respecto a la media. En este se


basa SPSS.
En funcin del signo del estadstico diremos que la asimetra es
positiva o negativa. Distribucin simtrica la que tiene asimetra nula.

Apuntamiento o curtosis
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una
distribucin con respecto a la distribucin normal o gaussiana, que es
adimensional.
Las series que representan los siguientes grficos poseen la misma
media y desviacin tpica, pero con diferente grado de apuntamiento.
160 400 300

140
300

200
120

200
100

100
80
100
Frecuencia

Frecuencia
Frecuencia

60

0 0
40 3 27 37 47 57 67 77 87 97 108 27 37 45 53 61 69 77 85 93
45 48 51 54 57 60 63 66 69 72 75 78 81 84 16 32 42 52 62 72 82 92 102 138 32 41 49 57 65 73 81 89 99

Platicrtica Leptocrtica Mesocrtica

Se denomina:
Platicrtica: curtosis < 0
Mesocrtica: curtosis = 0
Leptocrtica: curtosis > 0

11
Salida de Estadsticos del SPSS
El SPSS nos permite sacar todos estos estadsticos en una sola orden:
En el men Analizar Estadsticos descriptivos Descriptivos
y con todas las opciones activas nos muestra la tabla siguiente:
Descriptivos para Nmero de hijos

Estadstico Error tp.


Media 1,90 ,045 Los diagramas de caja
Intervalo de Lmite
confianza para la inferior
1,81 resumen gran parte de
media al 95% Lmite
superior 1,99
esta informacin
Media recortada al 5%
1,75

Mediana 2,00
Varianza 3,114
Desv. tp. 1,765
Mnimo 0
Mximo 8
Rango 8
Amplitud intercuartil
3,00

Asimetra 1,034 ,063


Curtosis 1,060 ,126

12