Академический Документы
Профессиональный Документы
Культура Документы
Inferencia Estadistica
Dr. J. E. Caraballo
jose.jcarabal@gmail.com
04/05/16
Estadstica Descriptiva
Objetivos:
1. Conocer tcnicas utilizadas para organizar
datos en
tablas.
2. Aprender a calcular medidas estadsticas
tales como:
- Media aritmtica
- Mediana
- Moda
- Varianza
- Desviacin estndar
- Coeficiente de variacin.
04/05/16
Bosquejo
I. Orden de Datos
II. Medidas de Tendencia Central
(Localizacin)
A. Media Aritmtica
B. Mediana
C. Moda
III. Medidas de Variabilidad (Dispersin)
A. Varianza
B. Desviacin Estndar
C. Coeficiente de Variacin
04/05/16
I. Orden de Datos
Para que los datos recopilados sean tiles,
necesitamos organizarlos de modo que
podamos identificar patrones y nos ayuden a
llegar a conclusiones lgicas.
En el proceso de investigacin cuantitativa
utilizamos la recopilacin de datos para probar
nuestras teoras o hiptesis planteadas.
Esa recopilacin de datos se le conoce como
conjunto de datos.
Es importante que tales datos del conjunto
sean seleccionados de manera que todos los
grupos relevantes estn representados.
04/05/16
04/05/16
# de clases = 2k n
Utlizamos esta frmula cuando no se nos
el nmero
#dice
de clases
= 2 k nde clases.
# de clases = 2 k 25
# de clases = 25 25
32 25
Por lo tanto el # de clases ser 5.
n
(94 + 1) 53
= 8.3 9
5
Una vez determinado el ancho del intervalo,
pasamos a construir la Tabla de Frecuencias,
adjudicando cada observacin en cada clase o
categora.
04/05/16
10
4/25=.
16
4/25=.16
57
62-70
3/25=.
12
7/25=.28
66
71-79
6/25=.
24
13
13/25=.52
75
80-88
8/25=.
32
21
21/25=.84
84
89-97
4/25=.
25
25/25=1.0
93
04/05/16
11
12
13
Histograma de Frecuencia
Absoluta de las Notas de
los Estudiantes
Frecuencia
Absoluta
(# de
estudiantes)
Histograma de Frecuencia
Relativa de las Notas de
los Estudiantes
Frecuencia
Relativa
(% de
estudiantes)
16
Polgono de Frecuencia
Absoluta de las Notas de los
Estudiantes
Polgono de Frecuencia
Relativa de las Notas de
los Estudiantes
04/05/16
19
Frecuencia
Absoluta (#
Est.)
Frec.
Acumulativa
Absoluta
< que
Frec.
Acumulativa
Relativa
< que
53-61
53--- 0
53--- 0.00
62-70
62--- 4
62--- 0.16
71-79
71--- 7
71--- 0.28
80-88
80--- 13
80--- 0.52
89-97
89--- 21
89--- .84
Total
25
98--- 25
98---1.00
04/05/16
20
Ojiva de Frecuencia
Acumulativa Absoluta
Ojiva de Frecuencia
Acumulativa Relativa
04/05/16
23
x
X
n
04/05/16
24
n
25
655 817 455 1927
x
77.08 77.10 77
25
25
La media o promedio se obtiene
sumando
todos los datos y dividiendo entre el nmero
de datos.
04/05/16
25
F PM
x
n
F PM
04/05/16
26
Cont. Medidas de
Tendencia Central
Clases Frecuenc
(Notas
ia
)
Absoluta
(# Est.)
Puntos
Medios
(PM)
(F x PM)
Frecuencia
Acum.
(Frec.
Acum.)
53-61
57
(4)
(57)=228
62-70
66
(3)
(66)=198
71-79
75
(6)
(75)=450
13 (m)
80-88
84
(8)
(84)=672
21 (Mo)
89-97
93
(4)
(93)=372
25
04/05/16
Total
25
= 1920
27
Cont. Medidas de
Tendencia Central
Utilizando la Frmula para calcular la media
aritmtica muestral para datos agrupados,
obtenemos:
F PM
x
n
04/05/16
1920
76.8 77
25
28
04/05/16
29
Cont. Medidas de
Tendencia Central
Mediana para Datos No-Agrupados:
n 1
Por definicin la mediana
es
m%
2
n 1 25 1 26
m%
13
2
2
2
La mediana es el elemento nmero 13 del conjunto de datos.
En este caso la mediana es m%= 78
04/05/16
30
n 1
m%
w Lm%
f m%
Donde:
n=
# de datos
F = suma de todas las frecuencias hasta la clase donde se
encuentra la
mediana pero sin incluirla.
f m=
frecuencia de la clase donde se encuentra la
mediana.
w=
ancho del intervalo
Lm=lmite inferior de la clase donde se encuentra la
mediana.
04/05/16
31
n 1
2 F 1
2
9 69
m
w
m
f m%
6
26
(8)
2
13 8
5
m
9 69
9 69
9 69
6
6
32
04/05/16
33
d1
w LM
M o
d
2
1
Donde:
d1= diferencia entre la frecuencia de la
clase modal y la frecuencia de la clase
anterior
d2=
diferencia entre la frecuencia de la clase
modal y la frecuencia de la clase
siguiente.
w=
ancho del intervalo
04/05/16
34
d1
Mo
w LM
d1 d 2
2
Mo
9 80
2 4
04/05/16
(8 6)
9 80
(8 6) (8 4)
2
9 80 3 80 83
6
35
04/05/16
36
Cont. Medidas de
Variabilidad (Dispersin)
Estas medidas no proporcionan
informacion adicional que nos permite
juzgar la confiabilidad de nuestra medida
de tendencia central.
Por ejemplo; si los datos se encuentran
ampliamente dispersos, la posicin
central es menos representativa de los
datos como un todo.
04/05/16
37
38
Cont. Medidas de
Variabilidad (Dispersin)
A. Rango: es la medida de variabilidad ms sencilla
entre todas las mencionadas; y se define como la
diferencia entre la observacin ms grande y la ms
pequea :
Esta medida de distancia se calcula de la siguiente
manera:
39
Cont. Medidas de
Variabilidad (Dispersin)
En general, se desea una medida de variabilidad
que utilice todas las observaciones y no slo
algunas de ellas; por lo tanto parece razonable
medir la variacin en trminos de las desviaciones
relativas a alguna medida de localizacin,
(generalmente esta medida es la media)
Para el conjunto de datos x1, x2,.,xn
Las diferencias determinan las desviaciones de la
media.
Dado que la suma de estas desviaciones es cero,
se utiliza como medida de variabilidad el
promedio de los cuadrados de tales desviaciones.
04/05/16
40
Cont. Medidas de
Variabilidad (Dispersin)
Para describir la dispersin de una manera
ms amplia y comprehensiva, utilizamos
aquellas medidas que se relacionan con
desviaciones promedio a partir de alguna
medida de tendencia central.
Existen dos medidas de variabilidad que
utilizaremos, y se denominan la varianza y
la desviacin estndar.
Ambas medidas nos dicen la distancia
promedio de cualquier dato en el conjunto a
partir de la media aritmtica de la
distribucin.
04/05/16
41
Cont. Medidas de
Variabilidad (Dispersin)
B. Varianza
La siguiente frmula calcula la Varianza para una
muestra de datos No -Agrupados:
2
(
x
x
)
x2
n 1
(
x
)
Ver
ejemplo:
N
2
04/05/16
42
Cont. Medidas de
Variabilidad (Dispersin)
x x
77
x x
-24
58
77
-19
361
60
77
-17
289
61
77
-16
256
64
77
-13
169
69
77
-8
64
70
77
-7
49
72
77
-5
25
73
77
-4
16
75
77
-2
53
576
=1809
04/05/16
43
Cont. Medidas de
Variabilidad (Dispersin)
x x
77
x x
-2
76
77
-1
78
77
80
77
82
77
25
84
77
49
84
77
49
84
77
49
87
77
10
100
87
77
10
100
75
=387
04/05/16
44
Cont. Medidas de
Variabilidad (Dispersin)
x x
88
77
x x
11
89
77
12
144
91
77
14
196
93
77
16
256
94
77
17
289
121
= 1006
04/05/16
45
Cont. Medidas de
Variabilidad (Dispersin)
En nuestro ejemplo, calculamos la varianza
muestral para datos no-agrupados de la
siguiente manera:
s
2
2
(X
X)
25 1
n-1
3202
2
s
133.41
24
04/05/16
46
Cont. Medidas de
Variabilidad (Dispersin)
Usando nuestro ejemplo, calculamos la
varianza muestral para datos agrupados de
la siguiente manera:
Frec.
Absol
uta
(F)
Puntos
Medios
(PM)
( PM x )
( PM x )
57
77
57-77=20
400
4(400)=16
00
66
77
66-77=11
121
3(121)=36
3
75
77
75-77=-2
6(4)= 24
84
77
84-77=7
49
8(49) =
392
93
77
93-77=16
256
04/05/16
F ( PM x )2
4(256)=10
47
24
Cont. Medidas de
Variabilidad (Dispersin)
s
F PM x
n 1
3403
25 1
3403
s
141.80
24
2
04/05/16
48
Cont. Medidas de
Variabilidad (Dispersin)
Como S2 (Varianza muestral) no tiene las
mismas unidades que los datos, se define
la desviacin estndar como la raz
cuadrada (positiva) de la varianza, a fin de
tener una medida en las mismas unidades
de los datos.
La desviacin estndar es til para
comparar dispersin entre dos poblaciones,
pero tambin lo es para calcular el
porcentaje de la poblacin que puede
localizarse a menos de una distancia
especfica de la media.
04/05/16
49
Cont. Medidas de
Variabilidad (Dispersin)
B. La Desviacin Estndar muestral, es la
Raz Cuadrada de la Varianza muestral.
s s
En nuestro ejemplo:
50
Cont. Medidas de
Variabilidad (Dispersin)
Calculamos la Desviacin Estndar de la
Poblacin de la sigueinte manera:
Es la raz cuadrada de la varianza de la
poblacin.
04/05/16
51
Cont. Medidas de
Variabilidad (Dispersin)
Usos de la Desviacin Estndar:
1. Nos permite determinar con cierto grado de
precisin
(exactitud) donde estn localizados los
valores de una
distribucin de frecuencias con
relacin a la media.
Esto lo podemos hacer utilizando el Teorema de
Chebyshev (Matemtico ruso 18211894) el cul dice
que:
No importa cual sea la forma de la distribucin:
- por lo menos 75% de los valores caen dentro de
2 desviaciones estndar a partir de la media de la
distribucin.
- por lo menos 89% de los valores caen dentro de
3 desviaciones estndar a partir de la media de la
distribucin.
04/05/16
52
Cont. Medidas de
Variabilidad (Dispersin)
Cont. Usos de la Desviacin Estndar
2. Podemos medir an con mayor precisn
el porciento de
datos que caen dentro
de rangos especficos bajo una
curva
simtrica.
Utilizando la Regla Emprica podemos
aproximar la variacin de los datos en una
curva simtrica:
04/05/16
53
La Regla Emprica
La Regla Emprica aproxima la variacin de los datos
de distribuciones que tienen forma de campana.
04/05/16
54
55
Cont. Medidas de
Variabilidad (Dispersin)
Cont. Usos de la Desviacin
Estndar
3. La desviacin estndar es til para
descubrir cun
distantes se encuentra cada
dato a partir de la media de la distribucin.
Para calcular esta distancia utilizamos la
siguiente frmula:
Puntuacin Estndar =
Veamos el siguiente ejemplo:
04/05/16
56
Cont. Medidas de
Variabilidad (Dispersin)
Determine la Puntuacin Estndar(z) para
los siguientes datos:( x= 58; x=75)
xx
58 77
19
PE
1.65
s
11.55
11.55
desviaciones estndar a la izquierda
de la media aritmtica.
xx
75 77
2
PE =
.17
s
11.55
11.55
desviaviones estndar a la izquierda
de la media aritmtica.
04/05/16
57
04/05/16
Chap 3-58
59
D. Dispersion Relativa
Es una medida de dispersin que nos
permite determinar la magnitud de la
desviacin en relacin a la magnitud de la
media.
Es una medida de dispersin relativa que
relaciona la desviacin estndar y la media,
expresando la desviacin estndar como un
porcentaje
s de la media.
CV
100
x
04/05/16
60
SBAXSX
$
5
CCVV
101%
0%
$5101%
0(.5()101)0%
%
Cont. Dispersin
Relativa
Accin A:
Precio promedio el ao pasado
Ambas
= $50
acciones
Desviacin estndar = $5
tienen la
misma
desviaci
n
estndar,
Accin B:
pero la
Precio promedio el ao pasado accin B
= $100
es menos
Desviacin estndar = $5
variable
a suChap 3-61
precio.
62
63
1.3
S
100
100
Una puntuacin de 620 est a 1.3
64
Formas de una
Distribucin
04/05/16
Simtrica
Sesgada Der.
Media = Mediana
65
RESUMEN
1. Conocimos tcnicas utilizadas para
organizar datos en
tablas.
2. Aprendimos a calcular medidas
estadsticas tales como:
- Media aritmtica
- Mediana
- Moda
- Varianza
- Desviacin estndar
- Coeficiente de variacin.
04/05/16
66