Академический Документы
Профессиональный Документы
Культура Документы
Estadstica y Probabilidades
UNIDAD II
MEDIDAS RESUMEN
En esta etapa nos ocuparemos del clculo y estudio de los estadgrafos.
Tabla N 1
b)
Estadgrafos de Dispersin: Nos indican como estn dispersos los datos con
respecto a algn estadgrafo de posicin. Miden el grado de variabilidad de los
datos alrededor de alguna medida de tendencia central, por esta razn, se les
denomina tambin estadgrafos de variabilidad. Ejemplos: rango, la desviacin
media, varianza, desviacin tpica, coeficiente de variacin, rango intercuartlico,
etc.
1.
MEDIA ( x )
Llamada tambin media aritmtica o promedio aritmtico es un estadgrafo que
localiza el centro de la distribucin en base a su centro de gravedad y se
obtiene a partir de las siguientes frmulas.
27
Estadstica y probabilidades
TECSUP - PFR
datos
muestrales, entonces:
x
i 1
xn
i i
i 1
x xi hi
i 1
Donde:
k : nmero de clases
Media Ponderada:
k
x P
i 1
k
i i
P
i 1
Siendo
pesos
P1 , P2 ,..., Pk
asociados
las
variables
x1 , x2 ,..., xk
respectivamente.
Media global:
Si una muestra de tamao n se particiona en k submuestras y x1 , x 2 ,..., x k
son
las
medias
de
las
submuestras
de
tamaos
n1 , n 2 ,..., n k
respectivamente.
k
Entonces:
particionada.
i 1
ni xi
n
Ejemplos:
28
TECSUP - PFR
Estadstica y Probabilidades
x1 9 ,
x2 5 ,
x3 3 ,
x4 10 ,
x5 8
5
xi
x x2 x3 x 4 x5 9 5 3 10 8
x i 1 1
7
5
5
5
Intervalos
de clase
[10, 26
ni
[26, 42
12
[42, 58
[58, 74
[74, 90
[90, 106
Total
30
xini
1356
i
x 1
45, 2
n
30
x xihi 45,15
i 1
Media ponderada:
Tabla N 3
Notas
Pesos
xi
Pi
xi Pi
05
13
1
3
5
39
44
Ex. Parcial
Ex. Final
k
xiPi
44
x i 1
11
k
4
Pi
i 1
29
Estadstica y probabilidades
TECSUP - PFR
Media Global:
Si una muestra de tamao 60 se divide en 5 sub-muestras de tamaos 8, 18,
12, 9, 13 con medias 15, 14, 12, 8,11 respectivamente. Entonces, la media
global ser:
xini
8 * 15 18 * 14 12 * 12 9 * 8 13 * 11 731
i
x 1
12,18
n
60
60
2.
MEDIANA
(Xm)
Xm
x n 1
; si n es impar
1
( xn xn 2 )
2 2
2
; si n es par
x2 6
x3 9
x 4 10
x5 14
como n es impar ( n = 5 )
X m x 5 1 x3 9
2
30
TECSUP - PFR
Estadstica y Probabilidades
x 2 10
x3 17
x 4 21 x5 29
x 6 43
como n es par ( n = 6 ) Xm 19
N m 1
X m Lm Wm 2
nm
donde:
Lm
N m 1 ni
i 1
nm
Wm
Wm Lm 1 Lm
n
total de datos ( 2 0,5) o super por primera vez a la mitad.
Clase mediana=
[ Lm , Lm 1 ;
X m [ Lm , Lm 1
Ejemplo:
31
Estadstica y probabilidades
TECSUP - PFR
Tabla N 4
Velocidades en
Km/h
[10, 26
[26, 42
[42, 58
[58, 74
[74, 90
[90, 106
Total
ni
Ni
Hi
4
12
7
4
2
1
30
4
16
23
27
29
30
0,133
0,533
0,766
0,899
0,966
1
n 30
15
2
2
Lm 26
n = 12
Wm 16
nm 12
N m 1 4
30
2 4
Xm 26 16
40, 67
12
Ni
30
25
20
15
10
5
10
26
32
42
58
74
90
106
Ii
TECSUP - PFR
Estadstica y Probabilidades
X 3500;
x1 1000,
x2 1000,
x3 1000,
x 4 1000,
x5 1000,
x 6 16 000
X m = 1000
En este caso, la mediana es la ms representativa en el sentido que localiza
mejor que la media el centro de los datos bajo consideracin.
Existe un valor extremo bastante discrepante o exagerado ( x6 16 000).
2.3 USOS DE LA MEDIA ARITMTICA
Estadstica y probabilidades
TECSUP - PFR
3.
MODA ( M o )
La moda es un valor de la variable que tiene la ms alta frecuencia, esto es, es el
valor ms frecuente de la distribucin.
Si la distribucin de frecuencias tiene un solo mximo (mximo absoluto), se dice
que la distribucin es unimodal; en cambio si tiene ms de un mximo (mximos
relativos), se dice que la distribucin es multimodal.
Si todas las frecuencias son iguales se dice que la distribucin no tiene moda y se
trata de una distribucin uniforme.
a)
34
TECSUP - PFR
Estadstica y Probabilidades
1
M o Li Wi
1 2
Ii
ni
[12,5
20,5
[20,5
28,5
[28,5 36,5
22
[36,5 44,5
26
[44,5 52,5
20
[52,5 60,5
12
[60,5 68,5
[68,5
76,5
TOTALES
35
Estadstica y probabilidades
TECSUP - PFR
1 =
26 -22 = 4
2 =
26 -20 = 6
1
4
Mo 36,5 W
36,5 8
39,7
4 6
1
2
ni
Ii
4.
CUARTILES (QI)
Son medidas de posicin que dividen en cuatro partes iguales al conjunto de
valores ordenados en una distribucin de frecuencias. Estas medidas son: el
primer Cuartil Q1, el segundo Cuartil Q2 y el tercer Cuartil Q3
25%
Q1
Q2
25%
Q3
75%
Las frmulas para calcular los cuartiles se derivan de la frmula utilizada para
calcular la mediana y los pasos para el clculo son los mismos:
Para el primer cuartil: Para el tercer cuartil:
N i 1
Q1 Li Wi 4
ni
3n
N i 1
Q3 Li Wi 4
ni
Ejemplo
A partir de la siguiente tabla determinar el 25% inferior y el 25% superior.
36
TECSUP - PFR
Estadstica y Probabilidades
Tabla N 6
Altura en pulgadas
ni
Ni
Hi
[60, 63
0,05
[63, 66
18
23
0,23
[66, 69
42
65
0,65
[69, 72
27
92
0,92
[72, 75
100
TOTALES
Luego:
100
4 23
Q1 66 3
66,14
42
Clculo de Q3 :
3n 3x100
Luego:
3x100
4 65
Q3 69 3
70,11
27
5.
DECILES ( DI )
Son medidas de posicin que dividen en 10 puntos iguales al conjunto de los
valores ordenados de una distribucin de frecuencias. Estas medidas son: el
primer decil D1, el segundo decil D2 y as sucesivamente hasta el noveno decil D9.
El primer decil distribuye al lado izquierdo el 10% de los datos y al otro lado el
90%, es decir, ocupa la posicin n/10.
En igual forma para los dems deciles hasta el noveno decil 9n/10 que deja a la
izquierda el 90% de los datos y a la derecha el 10%.
37
Estadstica y probabilidades
TECSUP - PFR
30%
D1
D2
D3
D4
D5
10%
D6
D7
D8
D9
90%
rn
N i 1
Dr Li Wi 10
ni
Donde:
Dr = el decil buscado.
Li = lmite inferior del intervalo donde se halla el decil buscado
r = indica el decil. Por ejemplo si queremos el tercer decil r = 3.
rn
indica la situacin del decil, es decir, la clase donde est el decil
10
Los dems signos: n , Ni-1 , Wi , ni tienen los mismos significados que para
el caso de la mediana.
Ejemplo
Se presenta la distribucin de frecuencias de los puntajes obtenidos por 250
alumnos en una prueba de rendimiento de Fsica. Determinar qu puntajes
deben tener los que se hallen en el 20% inferior y cules puntajes los que
se encuentren en el dcimo superior.
38
TECSUP - PFR
Estadstica y Probabilidades
Tabla N 7
Intervalos
40; 45
45; 50
50; 55
55; 60
60; 65
65; 70
70; 75
75; 80
80; 85
85; 90
Totales
ni
Ni
10
14
18
32
25
57
46
103
53
156
37
193
29
222
18
240
10
250
250
CARACTERSTICAS DE DISPERSIN
Las dos siguientes series de datos:
39
Estadstica y probabilidades
TECSUP - PFR
MEDIDAS DE DISPERSIN
Varianza ( S x2 V( x ) )
Se define:
V( x )
n
2
( xi x)
i 1
2
n
Sx k
( xi x) 2 ni
i 1
, datos no clasifcados
, datos clasificados
V( x )
n x
2
i i
i 1
x ; datos clasificados
Desviacin Tpica
S x
S x V( x )
Una idea sencilla del significado de la desviacin tpica se obtiene cuando se
comparan dos series de la misma naturaleza: la que posee una desviacin
tpica ms alta es la ms dispersa.
C.V .
Sx
x
40
TECSUP - PFR
Estadstica y Probabilidades
Rango interdeclico = D9 D1
Rango intercuartlico = Q3 Q1
Por ejemplo, a partir de la tabla N8, tenemos:
Rango intercuartil = 74,26 60.97 = 13,99
Rango interdeclico = 80,83 53,06 = 27,77
7.
GRFICAS DE CAJA
Los histogramas transmiten impresiones un tanto generales sobre un conjunto
de datos, mientras que un resumen nico tal como la media o la desviacin
estndar se enfoca en slo un aspecto de los datos. En aos recientes, se ha
utilizado con xito un resumen grfico llamado grfica de caja para describir
varias de las caractersticas ms prominentes de un conjunto de datos. Estas
caractersticas incluyen 1) el centro, 2) la dispersin, 3) el grado y naturaleza de
cualquier alejamiento de la simetra y 4) la identificacin de las observaciones
extremas o apartadas inusualmente alejadas del cuerpo principal de los datos.
Como incluso un solo valor extremo puede afectar drsticamente los valores de x y s, una grfica de caja est basada en medidas resistentes a la presencia de
unos cuantos valores apartados, la mediana y una medida de variabilidad
llamada dispersin de los cuartos.
Se ordenan las observaciones de la ms pequea a la ms grande y se separa la
mitad ms pequea de la ms grande; se incluye la mediana Xm en ambas
mitades si n es impar. En tal caso el cuarto inferior es la mediana de la mitad
ms pequea y el cuarto superior es la mediana de la mitad ms grande. Una
medida de dispersin que es resistente a los valores apartados es la dispersin
de los cuartos fs o tambin conocido como rango intercuartilico, dada por:
fs = cuarto superior cuarto inferior
41
Estadstica y probabilidades
TECSUP - PFR
Ejemplo
Se utiliz ultrasonido para reunir los datos de corrosin adjuntos de la placa de
piso de un tanque elevado utilizado para almacenar petrleo crudo (Statistical
Analysis of UT Corro- sion Data from Floor Plates of a Crude Oil Aboveground
Storage Tank, Materials Eval; 1994: 846-849); cada observacin es la
profundidad de picadura ms grande en la placa, ex- presada en milsimas de
pulgada.
40 52 55 60 70 75 85 85 90 90 92 94 94 95 98 100 115 125 125
El resumen de cinco nmeros es como sigue:
xi ms pequea = 40
xi ms grande = 125
cuarto inferior = 72.5
cuarto superior = 96.5
Mediana = Xm = 90
La figura muestra la grfica de caja resultante. El lado derecho de la caja est
mucho ms cerca a la mediana que el izquierdo, lo que indica una asimetra
sustancial en la mitad derecha de los datos. El ancho de la caja (fs) tambin es
razonablemente grande con respecto al rango de datos (distancia entre las
puntas de los bigotes).
8.
ASIMETRA
Es la deformacin horizontal de las curvas de frecuencias.
Cuando la curva est inclinada o alargada hacia la derecha se denomina
asimetra a la derecha o asimetra positiva (Fig.2). Observamos que la media
aritmtica queda hacia el lado ms largo (el derecho) y que x X m M o .
Cuando la curva est inclinada o alargada al lado izquierdo se denomina
asimetra a la izquierda o negativa (Fig.3). Notamos que la media aritmtica est
del lado ms largo (el izquierdo) y que x X m M o .
42
TECSUP - PFR
Estadstica y Probabilidades
En la Fig. 4 observamos que la curva est igualmente inclinada a los dos lados
por eso se llama curva simtrica. En este caso: x X m M o
Fig. 1
Fig. 2
Mo Md x
Fig. 3
x Md Mo
x
Md
Mo
AS1
Media Moda
desviacin estndar
AS1
x Mo
Sx
Notar que el valor del Primer coeficiente de Asimetra de Pearson nos indica el
tipo de asimetra que tendr la curva.
Ejemplo:
Considerando la tabla del Problema 1, calcular: la varianza, la desviacin tpica,
el coeficiente de variacin, el rango, el rango intercuartil, el rango interdeclico y
con ayuda del primer coeficiente de Pearson indicar que tipo de asimetra
presenta a la curva.
Tabla N 9
Ii
10; 26
26; 42
42; 58
58; 74
74; 90
90;106
Total
ni
xi
xi X 2 ni
xi.ni
ni xi2
18
2959,36
72
1296
12
34
1505,28
408
13872
50
161,28
350
17500
66
1730,56
264
17424
82
2708,48
164
13448
98
2787,84
98
9604
11852,8
1356
73144
30
43
Estadstica y probabilidades
V(x)
TECSUP - PFR
11852,8
395,09
30
Sx
V(x)
395,09 19,88
19,88
C.V.
0, 44
45, 2
X
e l(A) 105 10 95
30
4 4
Q1 26 16
30, 67
12
90
4 16
Q3 42 16
56,86
7
30
10 0
D1 10 16
22
4
270
10 23
D9 58 16
74
4
RID D9 D1 74 22 52
AS1
1356
45, 2
30
8
M0 26 16
35,85
8 5
Sx
AS1
73144
45, 22 395,09
30
X Mo
Sx
45, 2 35,85
0, 47
19,88
44
TECSUP - PFR
Estadstica y Probabilidades
8.2
13.8 74.1 85.3
94.8 94.9 95.5 95.8
103.7 106.0 113.5
88.0
95.9
90.2
96.6
91.5
96.7
92.4
98.1
fs = 6.5
1.5fs = 9.75
3fs = 19.50
45
92.9 93.6
99.0
Estadstica y probabilidades
TECSUP - PFR
Por lo tanto, cualquier observacin menor que 90.2 - 9.75 = 80.45 o mayor
que 96.7 + 9.75 = 106.45 es un valor apartado. Hay un valor apartado en el
extremo superior de la muestra y cuatro en el extremo inferior. Debido a que
90.2 - 19.5 = 70.7, las tres observaciones 5.3, 8.2 y 13.8 son valores
apartados extremos; los otros dos son moderados. Los bigotes se extienden
a 85.3 y 106.0, las observaciones ms extremas que no son valores
apartados. La grfica de caja resultante aparece en la figura. Existe una gran
cantidad de asimetra negativa en la mitad media de la muestra as como
tambin en toda la muestra.
5,50
6,75
2,65
7,60
6,25
3,78
4,90
5,21
2,51
6,20
3,87
1,52
1,38
5,92
6,90
4,56
2,46
5,84
4,72
8,80
7,40
7,86
9,45
4,71
6,25
8,79
7,41
5,92
9,65
4,79
2,45
5,33
8,64
3,90
3,24
3,10
6,43
3,75
5,15
6,77
5,62
3,49
3,81
9,20
1,20
4,04
2,50
6,43
1,58
a)
b)
c)
2.
46
TECSUP - PFR
Estadstica y Probabilidades
Mtodo A:
Mtodo B:
1,34
1,30
1,33
1,26
1,32
1,30
1,34
1,33
1,31
1,24
Compuesto
A
B
C
D
E
F
G
a)
b)
c)
4.
N2
16,8
17,1
33,6
25,4
27,9
14,3
35,2
O2
19,2
39,0
57,3
28,2
26,1
45,8
53,5
5.
6.
81.47
64.90
70.88
86.02
77.25
76.76
84.21
84.92
90.23
78.01
88.05
73.37
87.09
57.41
85.43
74.76
86.51
86.37
76.15
88.64
84.71
66.05
83.91
a)
47
56.02
Estadstica y probabilidades
b)
7.
TECSUP - PFR
8.
9.
510
460
475
420
490
480
450
435
485
470
465
500
455
435
Nmero de
trabajadores
15
600 , 900
900 , 1400
1400 , 1700
1700 , 2100
2100 , 2400
24
29
38
24
2400 , 2600
20
Tabla N 8
48
TECSUP - PFR
Estadstica y Probabilidades
b)
11. El ingreso per cpita anual de un pas es de 9000 dlares. El sector obrero
1
que constituye el 60% de la poblacin percibe 5 del ingreso total. Calcular
el ingreso per cpita del sector no obrero.
12. La distribucin siguiente corresponde a las lecturas con un contador Geiger
del nmero de partculas emitidas por una sustancia radiactiva en 100
intervalos sucesivos de 40 segundos:
Nmero de partculas
Frecuencia
5-9
10-14
15-19
20-24
25-29
30-34
35-39
a)
b)
c)
d)
e)
1
10
37
36
13
2
1
49
Estadstica y probabilidades
TECSUP - PFR
50