Академический Документы
Профессиональный Документы
Культура Документы
TRANSPARENCIAS DE CLASES
UNIDAD I
ESTADÍSTICA DESCRIPTIVA
Facultad de Economía y
Administración
UNIVERSIDAD NACIONAL
DEL COMAHUE
ESTADÍSTICA - EST. DESCRIPTIVA : DISTRIB DE FRECUENCIA
Distribuciones de Frecuencia
CONTENIDOS:
• Muestra y población;
• Unidad estadística
í
• Variables estadísticas;
• Tipo
po de variables;
a ab es;
• Ejemplos.
Ejemplos
Población (Universo):
Una población estadística es una colección bien
definida de objetos, personas, cosas, etc. que se
pretende estudiar.
La definición debe ser espacio-temporal, es decir,
que al definir la población debemos tener en
cuenta:
• Que: Qué vamos a estudiar (el objeto, cosa,
persona, etc.)
• Donde: La ubicación geográfica de la
población
• Cuando: ubicación temporal de la población.
Ejemplos
• Todos los menores de 18 años de una región en
un momento dado;
• Todos los individuos que se recibieron en la
Facultad de Ingeniería en la Universidad del
Comahue durante el periodo 2000-2010;
• El volumen total de petróleo producido en un
cierto yacimiento durante
d un periodo
d ;
Unidad Estadística
Es la persona,
persona objeto,
objeto elemento en cuyo estudio
estamos interesados. El conjunto completo de todas
las unidades estadísticas conforma la población. La
unidad estadística también puede ser una unidad de
tiempo,
p longitud,
g área, etc.
Variables Estadísticas
Es cualquier característica que puede variar de una
unidad estadística a otra en la población.
población Obtenidas por
medición o por observación de la característica bajo
estudio.
Tipos
p de Variables
Cualitativas:
No admiten valores numéricos sino que
representan atributos o categorías observados
en las unidades estadísticas. Ej: sexo, raza,
profesión, etc.
Cuantitativas:
adquieren valores numéricos obtenidos por
medición o por observación de las unidades
estadísticas.
Población
Es el conjunto
de todos los
individuos que
poseen
información
sobre el
fenómeno que Muestra
se estudia. Es un
subconjunto de
elementos
pertenecientes
a una
población.
Variables:
Características que se observan
en las unidades estadísticas.
Unidad
E
Estadística
dí i
Cada individuo,
Cualitativas animal o cosa al
que se le mide u
Cuantitativas discretas observa
b una o más
á
Cuantitativas continuas características
Ejemplo:
En un estudio
E t di ded ausentismo,
ti se selecciona
l i una
muestra aleatoria de 60 empleados de la cadena de
hipermercados XX y para cada uno de ellos se observa
la cantidad de días ausentes el año pasado.
Ejemplo:
Serie Simple
2,3 2,5 2,6
2,1
,
2,4
2,8
x1 x2 x3 x4 x5 x6
Distribuciones de Frecuencias Unidimensionales
• Permiten organizar los datos construyendo tablas
de frecuencias unidimensionales.
• Permite visualizar la forma de la distribución de
una variable mediante la representación gráfica
de los valores obtenidos en una muestra de
tamaño adecuado (generalmente, no menor de
50 unidades);
UNIVERSIDAD NACIONAL DEL COMAHUE
Departamento de Estadística - Prof. Luis Arenas 8
ESTADÍSTICA - EST. DESCRIPTIVA: DISTRIB DE FRECUENCIA
Definición
Frecuencia absoluta (fi) es la cantidad de veces
que se observa el valor xi de la variable.
variable
Construcción de la Tabla
Luego de recolectados los datos armar una tabla de
frecuencias con las siguientes columnas:
• En la segunda
g columna las frecuencias absolutas
de cada valor de la variable.
2 1 0.0167
Contar las
ocurrencias de cada
3 2 0.0333
valor de la variable
4 2 0.0333
5 4 0 0667
0.0667
6 6 0.1000
7 9 0.1500
8 11 0.1833
9 10 0.1667
10 7 0.1167 En cada valor dividir la
11 4
frecuencia absoluta por
0.0667
el tamaño de la
12 2 0.0333
muestra
13 1 0.0167
14 1 0.0167
Representación
ió de
d Frecuencias
i Simples
Si l
Definición
• La frecuencia relativa expresada como porcentaje
recibe el nombre de frecuencia relativa porcentual
(hi%).
Definiciones:
Cant. de fi hi hi% Fi Hi H i%
faltas
70
F = 60
60
50
40
30
20
10
F =0
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Interpretación
Cant. de fi hi hi% Fi Hi H i%
faltas
f3:
h6 %:
%
F(i) Di
Diagrama E
Escalonado
l d
70
60
50
40
30
20
10
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Interpretación
Cant. de fi hi hi% Fi Hi H i%
faltas
F7:
H6 %:
F7- F4:
100- H6 %:
Diagrama Escalonado
F((i)
70
F = 60
60
50
40
30
20
10
F =0
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
70
F = 60
60
50
40
30
20
10
F =0
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
77 58 53 68 59 76 76 69 71 65 70 166 51 64 52 65 92 62 76 61
119 61 65 66 54 50 63 58 39 101 71 75 79 52 68 64 56 69 88 65
54 80 63 78 85 54 73 49 54 75 82 56 74 102 64 65 66 73 75 57
68 71 71 788 9
97 60 6
64 6
64 522 80 62 66 55 566 500 500 500 63 69 69
61 55 53 60 56 59 62 53 57 57 70 56 84 69 88 56 103 50 52 55
55 63 47 45 62 53 52 57 64 59 84 79 55 67 76 62 83 96 75 65
78 69 68 55 67 52 47 45 68 44 62 87 56 50 83 53 64 62 90 85
66 52 53 54 64 55 55 59 70 88 57 47 47 55 48 54 69 59 58 57
51 54 53 59 56 59 63 66 96 53 76 54 61 82 62 71 60 66 81 68
80 43 82 63 70 56 60 58 76 50 88 89 59 51 62 74 83 81 90 79
Davis, C. (1990) Body image and weight preoccupation: A comparison between exercising
and non-exercising women. Appetite, 15, 13–21 .
Etapa 1:
Luego de recolectados los datos, identifique el valor
máximo y el valor mínimo obtenidos en la muestra.
Calcule a continuación la diferencia entre ellos,
denominada rango:
Rango = Valor máximo - Valor mínimo
Etapa 2:
Determine la amplitud de los intervalos (clases), de
forma tal de obtener entre 5 y 20 clases de igual ancho.
Puede usarse la regla:
Rango
R
Amplitud Mín = A m =
20
Rango
Amplitud Máx = A M =
5
AM + Am
Amplitud =
2
Otra regla general es:
Cantidad de clases ≈ cantidad de obse
observacio
vaciones
Etapa 3:
Determine los límites de cada clase, de forma tal que el
mínimo valor observado quede incluido en la primera clase
y el máximo valor observado quede en la última clase.
clase
Etapa 4:
Clasifique los datos por comparación con los límites
de clase obtenidos en el punto anterior y calcule las
frecuencias absolutas y relativas. Construya la tabla
de frecuencias.
Intervalos o
Frecuencia Frecuencia
Clases de la
absoluta relativa
variable
Etapa 5:
Ejemplo:
6,3; 6,8; 7,7; 9,4; 8,8; 7,6; 7,5; 7,9; 7,9; 4,6; 9,8;
5,2; 9,2; 8,1; 8,1; 8,2; 8,6; 9,2; 8,2; 7,7; 8,7; 7,7; 8,1;
8,1; 8,3; 8,4; 8,7; 7,7; 7,8; 7,6; 7,8; 7; 4; 7; 7; 7,4;
6,7; 6,6; 6; 6,1;
Etapa 1
Intervalo Punto
fi hi hi% Fi Hi Hi%
de clase medio
4 - 5 4,5
, 2 0,05 5 2 0,05 5
14
Frecuencia Frecuencia 0,35
absoluta relativa
12 0,30
10 0,25
8 0,20
6 0,15
4 0 10
0,10
2 0,05
0 0
3 4 5 6 7 8 9 10
Ojiva
45
40
35
30
25
20
15
10
5
0
2 3 4 5 6 7 8 9 10 11 12
Interpretación
I t
Intervalo
l Punto
fi hi hi% Fi Hi Hi%
de clase medio
4 - 5 4,5 2 0,05
, 5 2 0,05 5
f3:
Frecuencia
14 absoluta
12
10
8
6
4
2
0
3 4 5 6 7 8 9 10
UNIVERSIDAD NACIONAL DEL COMAHUE 28
Departamento de Estadística - Prof. Luis Arenas
PROBABILIDAD Y ESTADÍSTICA - EST. DESCRIPTIVA: DISTRIB DE FRECUENCIA
Interpretación
I t
Intervalo
l Punto
fi hi hi% Fi Hi Hi%
de clase medio
4 - 5 4,5 2 0,05
, 5 2 0,05 5
h5%:
Frecuencia
14 absoluta
12
10
8
6
4
2
0
3 4 5 6 7 8 9 10
UNIVERSIDAD NACIONAL DEL COMAHUE 29
Departamento de Estadística - Prof. Luis Arenas
PROBABILIDAD Y ESTADÍSTICA - EST. DESCRIPTIVA: DISTRIB DE FRECUENCIA
Interpretación
Intervalo Punto
fi hi hi% Fi Hi Hi%
de clase medio
9 - 10 95
9,5 4 01
0,1 10 40 1 100
F3:
Ojiva
45
40
35
30
25
20
15
10
5
0
2 3 4 5 6 7 8 9 10 11 12
Interpretación
Intervalo Punto
fi hi hi% Fi Hi Hi%
de clase medio
9 - 10 95
9,5 4 01
0,1 10 40 1 100
F5-F2:
Ojiva
45
40
35
30
25
20
15
10
5
0
2 3 4 5 6 7 8 9 10 11 12
Interpretación
Intervalo Punto
fi hi hi% Fi Hi Hi%
de clase medio
9 - 10 95
9,5 4 01
0,1 10 40 1 100
100- H3%:
Ojiva
45
40
35
30
25
20
15
10
5
0
2 3 4 5 6 7 8 9 10 11 12
CONTENIDOS:
Forma: simétrica,
simétrica asimétrica,
asimétrica otras.
otras
Centro: valor aproximado que
Aspecto deja mitad de los datos por debajo
General y mitad por encima.
Aspecto
General
Desviaciones
Desviaciones
Tipo normal:
Simétrico y en forma
de campana.
p
Asimétrico a la derecha
(positivo)
Asimétrico a la
Izquierda (negativo)
Centro de la Distribución
Valor aproximado que deja mitad de los datos por
debajo y mitad por encima.
Tipo
p normal:
Simétrico y en forma
de campana.
Centro
Asimétrico a la derecha
(positivo)
Centro
Asimétrico a la
Izquierda (negativo)
Centro
UNIVERSIDAD NACIONAL DEL COMAHUE
Departamento de Estadística - Prof. Luis Arenas 36
ESTADÍSTICA – DESCRIPCIÓN DE DISTRIBUCIONES A PARTIR DE LA GRÁFICA
Dispersión
Valor mínimo y valor máximo sin contar desviaciones.
Aspecto
p
General
Desviaciones
Desviaciones
mínimo máximo
Dispersión
Ejemplo
El siguiente histograma presenta la distribución de
los porcentajes de residentes mayores de 65 años en
los 50 estados de EE UU en 1996.
16
14
12
10
No. of obs.
0
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
X: porcentaje de mayores de 65 años
16
14
12
10
No. of obs.
0
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
X: porcentaje de mayores de 65 años
Medidas de Posición
Las medidas de posición ayudan a caracterizar un conjunto
de datos pues proporcionan la localización de la
distribución de frecuencia o el conjunto de datos, sobre el
eje de las abscisas (eje x).
Mínimo Media
Máximo Modo
Cuartiles Mediana
Percentiles
Medidas de Medidas de
posición tendencia central
L media
La di
Se calcula como:
x=
( x1 + x2 + .... + xn )
n
Que se simboliza como: n
∑ xi
i =1
M ( x) = x =
n
Ejemplo:
Serie Simple
2,3 2,1 2,5
2,4 2,6
2,8
x=
(2,1 + 2,3 + 2,4 + 2,6 + 2,5 + 2,8)
= 2,45
6
∑x .f i i
x= i =1
n
d d
donde:
m: cantidad de valores diferentes observados
n: tamaño de la muestra
fi: frecuencia del i-ésimo valor
x f h h% F H H%
2 1 0.0167 1.67 1 0.0167 1.67
3 2 0.0333 3.33 3 0.0500 5.00
4 2 0.0333 3.33 5 0.0833 8.33
5 4 0 0667
0.0667 6 67
6.67 9 0 1500
0.1500 15 00
15.00
6 6 0.1000 10.00 15 0.2500 25.00
7 9 0.1500 15.00 24 0.4000 40.00
8 11 0.1833 18.33 35 0.5833 58.33
9 10 0 1667
0.1667 16 67
16.67 45 0 7500
0.7500 75 00
75.00
10 7 0.1167 11.67 52 0.8667 86.67
11 4 0.0667 6.67 56 0.9334 93.34
12 2 0.0333 3.33 58 0.9667 96.67
13 1 0 0167
0.0167 1 67
1.67 59 0 9834
0.9834 98 34
98.34
14 1 0.0167 1.67 60 1.0000 100.00
m
∑ x .f i i
2 ⋅ 1 + 3 ⋅ 2 + ..... + 14 ⋅ 1 478
x= i =1
= = = 7 ,97
n 60 60
Interpretación
El año pasado los 60 empleados tuvieron en promedio 8
días ausentes.
La Media
Cuando la distribución de la variable está organizada
en una tabla de frecuencias con intervalos la expresión
de cálculo de la media es:
m
∑ xim . fi
i =1
M ( x) = x =
n
donde:
m: cantidad de clases o intervalos
n: tamaño de la muestra
Intervalo Punto
fi hi hi% Fi Hi
de clase medio Hi%
5 - 6 55
5,5 3 0 075
0,075 75
7,5 5 0 125
0,125 12 5
12,5
7- 8 7,5 11 ,
0,275 ,
27,5 23 ,
0,575 57,5
6
∑ x im . f i
302
i =1
x = = = 7 , 55
n 40
La mediana
Es el valor que supera a no más de la mitad de las
observaciones y a la vez es superado por no más de la
mitad de las observaciones. Conceptualmente es el
valor que deja por debajo el 50% de los datos y por
encima el otro 50%.
Con los
C l datos
d t ordenados
d d ded mayor a menor se calcula
l l
como:
Mna = x( n2+1 ) Si n es impar
x⎛ n ⎞ + x⎛ n ⎞
⎜ ⎟ ⎜ +1 ⎟
⎝2⎠ ⎝2 ⎠ Si n es par
Mna =
2 muestra
2,5 2,3
2,1
Ejemplo: 2,4 2,6
2,8
x (3 ) + x (4 ) 2 . 4 + 2 . 5
Mna = = = 2 . 45
2 2
UNIVERSIDAD NACIONAL DEL COMAHUE
Departamento de Estadística - Prof. Luis Arenas 46
ESTADÍSTICA - EST. DESCRIPTIVA: MEDIDAS DE POSICIÓN
La Mediana (DSA)
Para calcular la mediana , p
primero se encuentra el orden de
la mediana: n
2
Graficamente
Se traza una proyección desde el orden de la mediana
hasta
h t ell diagrama
di escalonado
l d y ded allí
llí all eje
j X.
X El valor
l ded
resultante es la mediana de la distribución.
F(i)
n
n
2
Mna
x1 x2 x3 .x4 . . . x.m
Fi
n
= 30
2
Mna = 8
UNIVERSIDAD NACIONAL DEL COMAHUE
Departamento de Estadística - Prof. Luis Arenas 47
ESTADÍSTICA - EST. DESCRIPTIVA: MEDIDAS DE POSICIÓN
x f h h% F H H%
2 1 0.0167
0 0167 1.67
1 67 1 0.0167
0 0167 1.67
1 67
3 2 0.0333 3.33 3 0.0500 5.00
4 2 0.0333 3.33 5 0.0833 8.33
5 4 0.0667 6.67 9 0.1500 15.00
6 6 0.1000 10.00 15 0.2500 25.00
7 9 0.1500 15.00 24 0.4000 40.00
8 11 0.1833 18.33 35 0.5833 58.33
9 10 0.1667 16.67 45 0.7500 75.00
10 7 0.1167 11.67 52 0.8667 86.67
11 4 0.0667 6.67 56 0.9334 93.34
12 2 0.0333 3.33 58 0.9667 96.67
13 1 0.0167 1.67 59 0.9834 98.34
14 1 0.0167 1.67 60 1.0000 100.00
60 1 100
UNIVERSIDAD NACIONAL DEL COMAHUE
Departamento de Estadística - Prof. Luis Arenas 48
ESTADÍSTICA - EST. DESCRIPTIVA: MEDIDAS DE POSICIÓN
La Mediana F(i )
n
n
2 Mna
LI LS
Se calcula el orden de la mediana (n/2) y luego se busca
una frecuencia acumulada F que sea mayor o igual a n/2.
El intervalo al que corresponde esa F contiene a la
Mediana.
La fórmula de cálculo de la Mediana es:
n − Fi −1
Mna = LI + 2 ⋅a
fi
donde:
LI: Límite inferior del intervalo que contiene a la mediana
Ejemplo
n − Fi −1
Mna = LI + 2 ⋅a
fi
Ojiva
45
40
35
30
25
n
= 20 20
2 15
10
5
0
2 3 4 5 6 7 8 9 10 11 12
20 − 12
Mna ∈ [7 ; 8 ) Mna = 7 + ⋅ 1 = 7 , 72
11
Interpretación:
El 50% de los 40 alumnos tiene un promedio inferior
a 7,72 puntos; el otro 50% supera ese valor.
Cuartiles
Hayy dos cuartiles: el inferior
f o Cuartil 1 y el superior
p
o Cuartil 3.
Cuartil 1
Es el valor que supera a no más de la cuarta parte de
l observaciones
las b i y a la
l vez es superadod por no más de
d
las tres cuartas partes de las observaciones.
Conceptualmente es el valor que deja por debajo el
25% de los datos y por encima el otro 75%.
Con los datos ordenados de menor a mayor se
calcula como:
x⎛ n ⎞ + x⎛ n ⎞
⎜ ⎟ ⎜ +1 ⎟
Q1 = ⎝4⎠ ⎝4 ⎠
Si n es múltiplo de 4
2
Datos ordenados: 2,1 2,2 2,3 2,4 2,5 2,6 2,8 2,9
Para n = 8
x ( 2 ) + x (3 ) 2 , 2 + 2 ,3
Q1 = = = 2 , 25
2 2
Cuartil 3
Es el valor que supera a no más de las tres cuartas
partes de las observaciones y su vez es superado por
no más de la cuarta parte de las observaciones.
Conceptualmente es el valor que deja por debajo el
75% de los datos y por encima el otro 25%.
Con los datos ordenados de menor a mayor se calcula
como:
x⎛ 3n ⎞ + x⎛ 3 n ⎞
⎜ ⎟ ⎜ +1 ⎟ Si n es múltiplo de 4
Q3 = ⎝ 4 ⎠ ⎝ 4 ⎠
2
Ejemplo:
muestra
2,9 2,2
2,1 2,3
2,5
2,4 2,6
2,8
,
Datos ordenados:
Para n = 8
x (6 ) + x (7 ) 2 , 6 + 2 ,8
Q3 = = = 2 .7
2 2
UNIVERSIDAD NACIONAL DEL COMAHUE
Departamento de Estadística - Prof. Luis Arenas 52
ESTADÍSTICA - EST. DESCRIPTIVA: MEDIDAS DE POSICIÓN
Cuartiles (DSA)
• El primer Cuartil (Q1) es el valor que deja por debajo el
25% de los datos y por encima el otro 75%.
• El tercer Cuartil (Q3) es el valor que deja por debajo el 75%
de los datos y por encima el otro 25%.
Valores de la Frecuencia
Frecuencia
variable absoluta
b l
absoluta
Acumulada
Q1 F mayor o igual que el
orden del cuartil 1
Fi
n
Para hallar Q1 graficamente
se traza una pproyección
y desde
el orden del cuartil 1 hasta el
n
diagrama escalonado y de allí al
4
eje X. El valor de resultante es
el Q1 de los datos. Q1
x1 x2 x3 x4 . . . xm
33n
1) Se encuentra el orden del Cuartil 3:
4
2) Se busca una frecuencia acumulada F que sea mayor o igual
el orden del cuartil 3. El valor de la variable al que corresponde
esa frecuencia acumulada F es Q3.
Valores de la Frecuencia
Frecuencia
variable absoluta
absoluta
Acumulada
Q3 F mayor
y o igual
g que
q el
orden del cuartil 3
Cálculo de Q3:
3n
1) Calculo el orden del Cuartil 3: = 45
4
2) Busco el menor Fi ≥ 45 , Fi = 45 ⇒ Q3 = 9
x f h h% F H H%
2 1 0.0167
0 0167 1.67
1 67 1 0.0167
0 0167 1.67
1 67
3 2 0.0333 3.33 3 0.0500 5.00
4 2 0.0333 3.33 5 0.0833 8.33
5 4 0.0667 6.67 9 0.1500 15.00
6 6 0.1000 10.00 15 0.2500 25.00
7 9 0.1500 15.00 24 0.4000 40.00
8 11 0.1833 18.33 35 0.5833 58.33
9 10 0.1667 16.67 45 0.7500 75.00
10 7 0.1167 11.67 52 0.8667 86.67
11 4 0.0667 6.67 56 0.9334 93.34
12 2 0.0333 3.33 58 0.9667 96.67
13 1 0.0167 1.67 59 0.9834 98.34
14 1 0.0167 1.67 60 1.0000 100.00
60 1 100
UNIVERSIDAD NACIONAL DEL COMAHUE
Departamento de Estadística - Prof. Luis Arenas 55
ESTADÍSTICA - EST. DESCRIPTIVA: MEDIDAS DE POSICIÓN
Fi
3n
= 45
4
n
= 15
4
Q1 = 6 Q3 = 9
Interpretación:
Q1:El año pasado el 25 % de los 60 empleados del
hipermercado XX faltó 6 días o menos, el 75%
restante faltó más de 6 días.
Q3:El año pasado el 75 % de los 60 empleados del
hipermercado XX faltó 9 días o menos,
menos el 25%
restante faltó más de 9 días.
Cuartil 1 (DA)
n
1) Se calcula el orden del Cuartil 1:
4
2) Se busca la menor frecuencia acumulada F que sea mayor o
igual al orden del cuartil 1. El intervalo al que corresponde esa
F contiene al Cuartil 1. Q1 ∈ [LI ; LS )
3) La expresión analítica de cálculo de Q1 y el procedimiento
para hallarlo graficamente son: F(i )
n
n −F
i −1
1
Q1 = LI + 4 ⋅ a n
Q1
fi 4
LI LS
Ojiva
45
40
35
30
25
20
15
n
= 10 10
4 5
0
2 3 4 5 6 7 8 9 10 11 12
10 − 5
Q1 = 6 + ⋅ 1 = 6 , 71
7
UNIVERSIDAD NACIONAL DEL COMAHUE
Departamento de Estadística - Prof. Luis Arenas 57
ESTADÍSTICA - EST. DESCRIPTIVA: MEDIDAS DE POSICIÓN
Cuartil 3 (DA)
3n
1) Se calcula el orden del Cuartil 3:
4
2) Se busca la menor frecuencia acumulada F que sea mayor o
igual al orden del Cuartil 3. El intervalo al que corresponde esa
F contiene al Cuartil 3.
F(i )
n
3n
4
3n − F
i −1
Q3
Q3 = LI + 4 ⋅ a
fi
LI LS
Ojiva
45
40
35
3n
= 30 30
Q3 ∈[x− ; x+ )
4 25
20
15
10
5
0
2 3 4 5 6 7 8 9 10 11 12
30 − 23
Q3 = 8 + ⋅ 1 = 8 ,53
13
UNIVERSIDAD NACIONAL DEL COMAHUE
Departamento de Estadística - Prof. Luis Arenas 58
ESTADÍSTICA - EST. DESCRIPTIVA: MEDIDAS DEPOSICIÓN
Intervalo Intercuartílico
El intervalo intercuartílico es el intervalo de valores
de la variable comprendido entre Q1 y Q3.
50% 25%
25%
Q1 Q3
Ejemplo
En el ejemplo del promedio de los 40 alumnos el
intervalo intercuartílico es: [6,71 ; 8,53]
Interpretación
Aproximadamente el 50% de los alumnos tienen un
promedio entre 6,71 y 8,53 puntos.
El Modo (DSA)
Es el valor de la variable al que le corresponde la
frecuencia máxima. Gráficamente el modo es el valor de
la variable al que le corresponde el bastón más alto.
f(i)
fi−máx
Mdo
x1 x2 x3 x4. . . . .xm
Frecuencia Frecuencia
absoluta relativa
11
10 f i − máx
9 0.15
8
7
6 0.10
5
4
3 0.0
2 5
1
0 0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Md
Mdo
UNIVERSIDAD NACIONAL DEL COMAHUE
Departamento de Estadística - Prof. Luis Arenas 60
ESTADÍSTICA - EST. DESCRIPTIVA: MEDIDAS DE POSICIÓN
f
El Modo (DA)
El modo se encuentra en el fi
intervalo al que le fi−1 fi +1
corresponde máxima
frecuencia (intervalo modal).
Es posible encontrar un valor
aproximado interpolando LI LS
mediante la fórmula: a
f i − f i−1
Md = LI +
Mdo ⋅a
( f i − f i−1 ) + ( f i − f i+1 )
donde:
LI: Límite inferior del intervalo que contienen al Modo
Ejemplo
fi − fi−1
Mdo= LI + ⋅a
( fi − fi−1) + ( fi − fi+1)
Δ 1 = f i − f i −1 =13 −11= 2
Δ 2 = f i − f i + 1 = 13 − 4 = 9
2
Mdo = 8 + ⋅ 1 = 8,18
2+9
Interpretación:
Lo más frecuente es que los 40 alumnos tengan un promedio
entre 8 y 9 puntos (aproximadamente 8,18 puntos).
Mediana
• El fácil de calcular
• No se ve afectada por valores extremos,
extremos pero sí por
la cantidad de valores extremos
Modo
• Es la medida de tendencia central menos utilizada
• No siempre existe y cuando existe puede haber más
de un modo
• En conjuntos pequeños no tiene utilidad como
medida de tendencia central.
central
• Es fácil de calcular.
• Se puede usar tanto para variable cualitativa como
para variable cuantitativa. La media y Mna solo se
pueden calcular en variable cuantitativa.
cuantitativa
Simétrica
x ≅ Mna ≅ Mdo
Asimétrica
a la
derecha
Asimétrica
a la
izquierda
x
• Puede obtenerse una idea preliminar de la variabilidad
de una variable a partir de la observación del
histograma.
• Las denominadas medidas numéricas de dispersión o
variabilidad, proveen una estimación cuantitativa, más
precisa
precisa.
1. Rango
( )
R = max x j − min
i xj ( ) ∀j = 1...n
muestra
2,5 2,1
2,3 R = 2,8 − 2,1 = 0,7
2,4 2,8 2,6
2. Rango Intercuartílico
Es la diferencia entre el tercer cuartil Q3 y el primer
cuartil Q1 .
RI = Q 3 − Q1
El Rango Intercuartílico es confiable aún en presencia
de valores atípicos .
El cálculo del Rango Intercuartílico da un valor, no
confundir con Intervalo Intercuartílico que son los
valores entre Q1 y Q3.
Va iancia
Variancia
Se calcula a partir de la suma de los desvíos de las
observaciones respecto de la media elevados al
cuadrado y dividida por el tamaño de la muestra.
x j − x = −1.15
x k − x = 2.85
xi = 6 x k = 10
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
x = 7.15
n
∑ ( xi − x ) 2
[
V ( x ) = M (x − x ) = S 2 ( x ) =
2
] i =1
n
UNIVERSIDAD NACIONAL DEL COMAHUE
Departamento de Estadística - Prof. Luis Arenas 68
ESTADÍSTICA - EST. DESCRIPTIVA: MEDIDAS DE DISPERSIÓN
3. Desvío Estándar
Es la medida de dispersión más utilizada.
utilizada
En su cálculo intervienen todas las observaciones.
variable
i bl y su media
di
n
∑ i
( x − x ) 2
s ( x) = i =1
n
La fórmula de cálculo es:
n
∑ xi
2
s( x) = − x
i =1 2
n
Propiedades
• S(x) > 0
• S(k) = 0 para k constante
• S(x ± k) = S(x) para k constante
• S(k.x) = k.S(x) para k constante
• S(a.x ± b) = a.S(x) para a y b constantes
• Regla empírica (se verá con distribuciones de frecuencia)
donde:
n
m: cantidad de valores diferentes de la variable
n: tamaño de la muestra
fi: frecuencia de aparición del i-ésimo valor
xi: cada uno de los m diferentes valores que asume la
variable
x: media muestral m
∑ ( xi f i )
2
⎡ (4 ⋅ 1 + 9 ⋅ 1 + ..... + 196 ⋅ 1) ⎤
S (x) = ⎢ − 7,97 2 ⎥
⎣ 60 ⎦
⎡ 4162 ⎤
S ( x) = ⎢⎣ 60 − 7 ,97 2 ⎥ = 2 , 4287
⎦
donde: n
m: cantidad de intervalos de la tabla de frecuencias
xim: punto medio de cada clase
S ( x) = i =1
− x2
n
Ejemplo: Para los datos correspondientes a las
calificaciones de 40 alumnos de una carrera
universitaria.
2346
S ( x) = − 7 ,55 2 = 1, 2835
40
68%
x − s (x) x x + s (x)
95%
x
x − 2 ⋅ s ( x) x + 2 ⋅ s( x)
99,7%
x − 3 ⋅ s ( x) x x + 3 ⋅ s( x)
Ejemplo
Frecuencia Frecuencia
absoluta relativa
11
10
9 0.15
8
7
6 0.10
5
4
3 0.05
2
1
0 0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
n = 60 x = 7,97 S ( x) = 2,4287
Diagrama de Caja
Es una representación de los datos que pretende resumir
gráficamente las características mas sobresalientes de los
mismos. Se puede utilizar el Diagrama de Caja para
comparar distintos conjuntos de datos respecto a:
• localización • posición
medidas de:
• variabilidad • dispersión
• asimetría dada por la gráfica
Bigote Bigote
g
Caja
Izquierdo Derecho
Mínimo Máximo
Mínimo Máximo
Rango Intercuartílico
Rango
Tipo normal:
Simétrico y en forma de
campana.
Asimétrico a la derecha
(positivo)
Asimétrico a la Izquierda
(negativo)
Ejemplo
Para investigar el efecto que tiene el procedimiento
en la elaboración de hormigón se comparan tres
métodos de fabricación y se observa la resistencia a
la fractura de los hormigones obtenidos (en kg
fuerza).
fuerza)
• Qué tipo de simetría/asimetría presentan las
distribuciones. Justifique su respuesta.
• Ordene las distribuciones de menor a mayor según
su dispersión.
• Ordene los métodos de mayor a menor de acuerdo
a la resistencia a la fractura obtenida (posición).
x y
y
x1 y1
x2 y2 yj
... ...
xj yj
... ...
xn yn xj x
Ejemplo
A una muestra de 8 alumnos de 1er año de una
carrera se les estudia simultáneamente:
X: cantidad de materias cursadas
Y: cantidad de materias aprobadas
Se obtiene la siguiente serie simple bidimensional
X Y
3 0 3
2 1
2 2 2
3 1
3 3 1
4 2
4 1 0
1 1 0 1 2 3 4 5
Covariancia
∑ ( x − x ).( y
i i − y) ∑ x .y i i
C ( x, y ) =
Cov i =1
= i =1
− x. y
n n
Signo de la Covariancia
(x −x )> 0
y
(y −y )>0
y
(y −y )< 0
x x
(x −x )< 0
Interpretación de la Covariancia
(x y) > 0 ⇒ relación directa entre las variables
• Cov (x, variables.
• Cov (x, y) < 0 ⇒ relación inversa entre las variables.
• Cov (x, y) = 0 ⇒ no existe relación lineal entre las
variables.
II
I
M(x)
II
I
Cov (x,
(x y) = 0 M( )
M(y)
IV
III
I M(x)
II
M(y)
M(x)
Ejemplo
Calcular
a u a e interpretar
p a la a covariancia
o a a a pa para
a las
a variables
a ab X
e Y en un estudio realizado a 10 estudiantes donde:
X: Tiempo de estudio para un examen (en horas)
Y: Calificación obtenida (en puntos)
X Y X.Y
5 8 40
n
3
2
4
2
12
4
∑ xi 49
i =1
x= = = 4,9
6 7 42 n 10
10 9 90
n
3
4
2
4
6
16
∑ yi 50
i =1
y= = =5
5 5 25 n 10
8 7 56
3 2 6
49 50 297 Totales
n
∑ xi . yi 297
i =1
Cov ( x, y ) = − x. y = − 4,9 ⋅ 5 = 5,2
n 10
Hay una relación directa entre
Cov(X,Y)=5,2 > 0 el tiempo de estudio y la
calificación obtenida