Вы находитесь на странице: 1из 28

Estadstica 2

1. Medidas de tendencia
central en datos agrupados
1.1 Datos agrupados
Los datos se encuentran clasificados dentro de intervalos o
clases, por lo cual resulta imposible conocer sus valores
precisos.
Edad (aos) Frecuencia
[8 11] 16
[12 15] 12
[16 19] 10
[20 23] 7
[24 27] 4
Ejemplo: La tabla adjunta representa las edades de los
participantes en un grupo deportivo, agrupadas en intervalos.
1. Medidas de tendencia
central en datos agrupados
1.1 Datos agrupados
Cada intervalo puede ser representado por un solo valor,
llamado marca de clase, que corresponde al promedio entre
los extremos del intervalo.
Edad (aos) Frecuencia Marca de clase
[8 11] 16 9,5
[12 15] 12 13,5
[16 19] 10 17,5
[20 23] 7 21,5
[24 27] 4 25,5
En el ejemplo, la marca de clase de cada intervalo es
1. Medidas de tendencia
central en datos agrupados
1.1 Datos agrupados
El intervalo modal (o clase modal) corresponde al intervalo que
tiene la mayor frecuencia. En este caso, es [8 11]. Esto NO
significa que en ese intervalo se encuentre la moda de la muestra.
El intervalo donde se encuentra la mediana se determina
ubicando la posicin central, de acuerdo a las frecuencias
acumuladas.
Edad (aos) Frecuencia Frecuencia acumulada
[8 11] 16 16
[12 15] 12 28
[16 19] 10 38
[20 23] 7 45
[24 27] 4 49
Como hay 49 datos en total, la mediana se encuentra en la
posicin 25. Luego, el intervalo donde se encuentra la
mediana es [12 15].
Posicin 17 a
posicin 28
1. Medidas de tendencia
central en datos agrupados
1.1 Datos agrupados
El promedio obtenido a partir de la marca de clase se determina
utilizando la frecuencia y la marca de clase de cada intervalo.
Edad (aos) Frecuencia Marca de clase
Frecuencia Marca de
clase
[8 11] 16 9,5 152
[12 15] 12 13,5 162
[16 19] 10 17,5 175
[20 23] 7 21,5 150,5
[24 27] 4 25,5 102
Total 49 741,5
Promedio = = 15,132 aos
741,5
49
Este resultado es un valor aproximado del valor real, a falta de
mayor precisin en los datos.
2.1 Cuantiles
2. Medidas de posicin
Se denomina cuantil al valor bajo el cual se encuentra un cierto
porcentaje de los datos, cuando estos estn ordenados de menor a
mayor, de acuerdo a la columna de frecuencia porcentual acumulada.
Los percentiles dividen a la muestra en 100 partes iguales, con 1%
de los datos cada una. Por ejemplo, el percentil 35 corresponde al
valor bajo el cual se encuentra el 35% de los datos.
Los deciles dividen a la muestra en 10 partes iguales, con 10% de
los datos cada una. Por ejemplo, el decil 6 corresponde al valor bajo
el cual se encuentra el 60% de los datos.
Los cuartiles dividen a la muestra en 4 partes iguales, con 25% de
los datos cada una. Por ejemplo, el cuartil 3 corresponde al valor bajo
el cual se encuentra el 75% de los datos.
La mediana de una muestra corresponde al percentil 50, al decil 5 y
al cuartil 2.
2.1 Cuantiles
2. Medidas de posicin
Puntaje Frecuencia
5 6
10 2
15 6
20 14
25 12
Ejemplo: La tabla adjunta representa los puntajes de un
grupo de alumnos en una prueba
Frecuencia porcentual
Frecuencia porcentual
acumulada
15% de 0% a 15%
5% de 15% a 20%
15% de 20% a 35%
35% de 35% a 70%
30% de 70% a 100%
El cuartil 1 (25%) es 15, ya que 20% <
25% < 35%
El decil 8 (80%) es 25, ya que 70% < 80%
< 100%
El percentil 45 (45%) es 20, ya que 35% <
45% < 70%
3.1 Rango de un conjunto de datos
3. Medidas de dispersin
Puntaje Frecuencia
5 6
10 2
15 6
20 14
25 12
Ejemplo:
Corresponde a la diferencia entre el valor mximo y el valor
mnimo de un grupo de datos.
En caso de datos agrupados, corresponde a la diferencia entre
el lmite superior del intervalo final y el lmite inferior del
intervalo inicial.
Edad (aos) Frecuencia
[8 11] 16
[12 15] 12
[16 19] 10
[20 23] 7
[24 27] 4
El rango es (25 5) = 20
puntos
El rango es (27 8) = 19
aos
3.2 Varianza de un conjunto de datos
3. Medidas de dispersin
Ejemplo: Sea el conjunto {3,
5, 10}
Es el promedio de los cuadrados de las diferencias entre los
datos y el promedio del conjunto.
El promedio del conjunto es 6
3
18
3
10 5 3
= =
+ +
= x
Los cuadrados de las diferencias entre los datos y el
promedio son (3 6) = ( 3) = 9 , (5 6) = ( 1)
= 1 y (10 6) = 4 = 16
El promedio de estos valores es
3
26
3
16 1 9

2
=
+ +
=
Luego, la varianza del conjunto {3, 5, 10} es 8,666...
3
26

2
= =
3.3 Desviacin estndar de un conjunto de datos
3. Medidas de dispersin
Ejemplo: Sea el conjunto {3, 5, 10}
La varianza del conjunto {3, 5, 10} es
3
26

2
=
Luego, la desviacin estndar del conjunto {3, 5, 10}
es
2,944
3
26

2
~ = =
Corresponde a la medida del grado de dispersin de los datos
con respecto al valor promedio. Se calcula como la raz
cuadrada de la varianza del conjunto.
3. Medidas de dispersin
Ejemplo: Se determin que la desviacin estndar del
conjunto del ejemplo (mostrado a continuacin) era
aproximadamente 2,944.
3 5 10
Si es la medida de la dispersin de los datos, los siguientes
conjuntos deberan tener mayor o menor desviacin estndar
que el ejemplo?
3 4 10
3 6 10
3 8 10
Desviacin estndar
3,091
14 16 21
Desviacin estndar
2,867
Desviacin estndar
2,944
Desviacin estndar
2,944
3.3 Desviacin estndar de un conjunto de datos
4.1 Distribuciones estadsticas
4. Distribucin normal
Cuando una muestra estadstica no agrupada es muy grande,
y la variable estadstica es continua, es mucho ms
conveniente representar la distribucin de frecuencias relativas
mediante una funcin de densidad.
2 8
Frecuencia
relativa
X
Ejemplo: El siguiente grfico muestra la funcin de densidad
de una variable estadstica continua X que puede tomar
valores entre 2 y 8.
El rea total encerrada por cualquier distribucin es 1. Esto
significa que en su rango se encuentra el 100% de los datos.
4.1 Distribuciones estadsticas
4. Distribucin normal
El rea que se encuentra bajo cualquier porcin de la curva
representa el porcentaje de los datos que se encuentra en dicho
intervalo, es decir, la probabilidad P de que la variable tome algn
valor dentro de l.
Ejemplo: A continuacin
se indica el rea de
ciertas secciones de la
curva anterior.
Se puede interpretar como:
2 8
Frecuencia
relativa
X
5 7
0,
3
0,
6
0,
1
El 30% de los datos es menor o igual que 5, o sea, P(X 5) = 0,3
El 60% de los datos est entre 5 y 7, o sea, P(5 X 7) = 0,6
El 10% de los datos es mayor o igual que 7, o sea, P(X 7) = 0,1
4.2 Distribucin normal tipificada
4. Distribucin normal
Es una distribucin estadstica cuya funcin de densidad es simtrica
con respecto al eje Y, y cuya forma se denomina campana de
Gauss.
X
0 1 3 2 1 2 3
34,1
%
34,1
%
13,6
%
13,6
%
2,1% 2,1%
El promedio, la moda y la mediana de la distribucin son 0, y su
desviacin estndar es 1. Esto le da la condicin de tipificada.
Tericamente X puede tomar cualquier valor real, sin embargo, el
99,6% de los datos se encuentra entre 3 y 3, distribuyndose como
indica el grfico.
4.2 Distribucin normal tipificada
4. Distribucin normal
Ejemplo: La probabilidad de que el valor de X
sea menor que 1,5 corresponde al valor del
rea ], 1,5], que segn la tabla es 0,933.
Las reas por intervalo son muy difciles de
calcular, por lo cual existe una tabla donde se
indican sus valores aproximados. Aqu se
presenta parte de ella.
a rea ], a]
3,0 0,001
2,5 0,006
2,0 0,023
1,5 0,067
1,0 0,159
0,5 0,309
0,0 0,500
0,5 0,691
1,0 0,841
1,5 0,933
2,0 0,977
2,5 0,994
3,0 0,999
X
0 1,5
Es decir, el 93,3% de los datos es menor o
igual que 1,5, que significa que P(X 1,5) =
0,933.
4.2 Distribucin normal tipificada
4. Distribucin normal
Propiedades:
P(X a) = 1 P(X a) (ya que el rea total bajo la curva es 1)
Si se conoce P(X a) y P(X b), con a > b, entonces:
P(X a) = P(X a) (ya que la curva es simtrica)
X
0 a a
P(b X a) = P(X a) P(X b) (por descomposicin de reas)
4.3 Distribucin normal no tipificada
4. Distribucin normal
En la vida cotidiana existen muchos parmetros estadsticos que al ser
graficados con respecto a su frecuencia tienen un comportamiento normal:
estatura, peso, cociente intelectual, presin arterial, etc.
Matemticamente, significa que su grfico tiene igual forma que la
distribucin normal tipificada, pero con distinto promedio y/o desviacin
estndar. Se llaman distribuciones normales no tipificadas.
Si X es una variable con distribucin normal no tipificada de promedio y
desviacin estndar o, entonces al realizar el cambio

la variable Z queda con distribucin normal tipificada (promedio 0 y
desviacin estndar 1) para la cual existen las tablas de reas.


=
X
Z
4.3 Distribucin normal no tipificada
4. Distribucin normal
Ejemplo: El siguiente grfico muestra el resultado de la
medicin de peso de ms de dos millones de recin nacidos
durante ocho aos.
Peso
(gramo
s)
Frecuencia
relativa
3.20
0
2.600 5.00
0
4.40
0
3.80
0
2.000 1.400
Corresponde a una distribucin normal de promedio 3.200
gramos y desviacin estndar de 600 gramos.
600
3.200 Peso
= Z
Luego, al hacer el cambio de variable cada
valor del peso pasa a tener un valor asociado de Z.
4.3 Distribucin normal no tipificada
4. Distribucin normal
Entonces, si se quiere saber qu porcentaje de los recin
nacidos registrados tuvo un peso menor o igual que 3.500
gramos, basta con determinar qu porcentaje de los valores
de Z tiene un valor menor o igual que 0,5.
Ejemplo: Si Peso = 3.500
0,5
600
3.200 3.500
=

= Z
Segn la tabla tipificada, el valor del rea ], 0,5] es 0,691,
lo que significa que el 69,1% de los datos tipificados es menor
o igual que 0,5.
Entonces, para el caso no tipificado, el valor del rea ],
3.500] tambin es 0,691, lo que significa que el 69,1% de los
datos no tipificados es menor o igual que 3.500.
4.3 Distribucin normal no tipificada
4. Distribucin normal
Peso (gramos)
Frecuencia
relativa
3.20
0
2.600 5.00
0
4.400 3.80
0
2.000 1.400
Z
Frecuencia
relativa
0 1 3 2 1 2 3
Distribucin normal
tipificada
600
3.200 Peso
= Z
Promedio = 0
Desviacin estndar = 1
Distribucin normal no tipificada
Promedio = 3.200 gramos
Desviacin estndar = 600
gramos
69,1
%
0,5
69,1
%
3.50
0
5.1 Variable aleatoria
5. Variable aleatoria, funcin de
probabilidad y funcin de distribucin
Un experimento aleatorio es cualquier procedimiento cuyo
resultado no se puede predecir y un evento o suceso es un
resultado especfico dentro de dicho experimento. Una variable
aleatoria es la que asocia un evento con un valor numrico.
Ejemplo: Un experimento aleatorio es lanzar un dado dos veces.
Si ahora se define la variable aleatoria Y como el producto de los
resultados, entonces, para el evento obtener un 2 en el primer
lanzamiento y un 5 en el segundo lanzamiento, el valor de Y es 10.
Es decir, para un mismo evento, distintas variables aleatorias pueden
tener distintos valores.
Si se define la variable aleatoria X como la suma de los resultados,
entonces, para el evento obtener un 2 en el primer lanzamiento y un
5 en el segundo lanzamiento, el valor de X es 7.
5.2 Funcin de probabilidad
5. Variable aleatoria, funcin de
probabilidad y funcin de distribucin
Corresponde a la probabilidad del valor indicado. A cada valor de X en el
dominio le asocia un valor P(X = m) que corresponde a la probabilidad de que
X tome el valor m.
Ejemplo: Sea X una variable aleatoria de funcin de probabilidad
, con a en el conjunto {3, 4, 6}.

Cul es la probabilidad de que X valga 3?
20
11
) P(
a
a X

= =
Si evaluamos la funcin P en X = 3, resulta .
5
2
20
8
20
3 11
3) P( = =

= = X
5
2
Es decir, la probabilidad de que X valga 3 es .
Es importante destacar que, dado que se trata de probabilidades, la
suma de las imgenes de la funcin siempre debe ser 1.
5.2 Funcin de probabilidad
5. Variable aleatoria, funcin de
probabilidad y funcin de distribucin
Ejemplo: Sea X una variable aleatoria de funcin de probabilidad
, con b en el conjunto {3, 5, 7}. Cul debe ser el valor de
m? m
b
b X
2
1
) P(
+
= =
Como P es una funcin de probabilidad, entonces la suma de las imgenes
debe ser 1. Luego, se puede plantear:
P(X = 3) + P(X = 5) + P(X = 7) = 1
m 2
1 3+
+ + = 1
m 2
1 5+
m 2
1 7+
m 2
4
+ + = 1
m 2
6
m 2
8
= 1 m = 9
m 2
18
5.2 Funcin de probabilidad
5. Variable aleatoria, funcin de
probabilidad y funcin de distribucin
Ejemplo: Se tiene una caja con una tarjeta roja, una tarjeta azul y dos
tarjetas verdes, todas del mismo tipo. Se sacan dos tarjetas al azar, una tras
otra y con reposicin, y se define la variable aleatoria X como la cantidad de
tarjetas azules extradas. Cul es valor de P(X = 1)?
P(X = 1) significa la probabilidad de que solo una de las tarjetas extrada
haya sido azul. Las posibles combinaciones son:
Casos totales: (R, R) (R, A) (R, V1) (R, V2) (A, R) (A, A) (A, V1) (A, V2) (V1,
R) (V1, A) (V1, V1) (V1, V2) (V2, R) (V2, A) (V2, V1) (V2, V2)
Casos favorables: (R, A) (A, R) (A, V1) (A, V2) (V1, A) (V2, A)
Luego, Probabilidad (solo una azul) =
8
3
16
6
totales casos
favorables casos
= =
8
3
Por lo tanto, P(X = 1) =
5.3 Funcin de distribucin
5. Variable aleatoria, funcin de
probabilidad y funcin de distribucin
Corresponde a la probabilidad acumulada hasta el valor indicado. A cada
valor de X en el dominio le asocia un valor F(X m) que corresponde a la
probabilidad de que X tome un valor menor o igual que m.
Ejemplo: Sea X una variable aleatoria de funcin de probabilidad
y funcin de distribucin F, con c en el conjunto{2, 4, 6, 8}. Cul es el valor
de F(X 6)?
c
c X
25
24
) P( = =
F(X 6) = P(X = 2) + P(X = 4) + P(X = 6)
El valor de F(X 6) corresponde a la suma de las probabilidades:
25
4
25
6
25
12
+ + =
25
22
=
6 25
24
4 25
24
2 25
24

=
F(X 6)
5.3 Funcin de distribucin
5. Variable aleatoria, funcin de
probabilidad y funcin de distribucin
En general, ocurre que P(X = X
k
) = F(X X
k
) F(X X
k1
)
Ejemplo: Sea X una variable aleatoria de funcin de probabilidad P y funcin
de distribucin , con d en el conjunto {1, 2, 3, 4}.

Cul es el valor de P(X = 3)?
8
3
) F(
+
= s
d
d
d X
Segn la definicin de funcin de distribucin:
P(X = 1) + P(X = 2) + P(X = 3) =
11
9
8 3
3 3
3) F( =
+

= s X
P(X = 1) + P(X = 2) =
5
3
10
6
8 2
2 3
2) F( = =
+

= s X
P(X = 3) = F(X 3) F(X 2) =
55
12
5
3
11
9
=
|
.
|

\
|

Entonces, restando ambas expresiones, resulta:
Pregunta oficial PSU
Sea el conjunto A formado por los elementos a
1
, a
2
, a
3
, a
4
, a
5

y a
6
, con desviacin estndar o y varianza o. Cul de las
siguientes afirmaciones es verdadera?

A) o y o nunca sern iguales.
B) o nunca ser cero.
C) Siempre o > o.
D) Si los elementos de A son nmeros impares consecutivos,
entonces
o = 1.
E) Si los elementos de A son nmeros enteros positivos
distintos entre
s, entonces o es mayor que cero.

Вам также может понравиться