Вы находитесь на странице: 1из 58

Estadstica: conceptos bsicos

y definiciones
Docente: Yohana Mora
Asignatura: Modelos Economtricos
Universidad de Ibagu
Semestre: 2013A

Conceptos bsicos. Poblacin y
Muestra
Poblacin:
Coleccin completa de todas
las observaciones de inters
para el observador.
Son demasiado grandes para
ser estudiadas en su
totalidad.
Muestra: Porcin de
la poblacin, ms pequea y
ms manejable, sobre la que
realmente hacemos las
observaciones.
Debe ser representativa y
estar formado por miembros
seleccionados de la
poblacin.

Conceptos bsicos. Parmetro y
Estadstico
Parmetro: Medida
descriptiva de la poblacin
total de todas las
observaciones de inters para
el investigador.

Estadstico: Elemento que
describe una muestra y sirve
como estimador del parmetro
de la poblacin
correspondiente.
Conceptos bsicos. Censo y Encuesta
Censo: listado de una o ms
caractersticas de todos los
elementos de una poblacin.
Encuesta: Listado de una o
ms caractersticas de todos
los elementos de una muestra.
Conceptos bsicos. Variables
Puede ser:
Cuantitativa: Si toma valores numricos.
Ej: ingresos, costos, Edad.
Variable: Caracterstica de la muestra o
poblacin que se est observando.
Continua: Si entre dos valores son posibles
infinitos valores intermedios. Ej: Altura, dosis de
medicamento administrado, Edad, Presin
diastlica.
Discreta: Si toma valores enteros. Ej: Num. de
hijos, Num. Cigarrillos, Num. cumpleaos.
Conceptos bsicos. Variables
Cualitativa: Si sus valores no se pueden asociar
naturalmente a un nmero
Nominal: Si sus valores no se pueden ordenar. Ej:
Sexo, RH, Religin, Nacionalidad, Fumar (Si/No).
Ordinal: Si sus valores se pueden ordenar. Ej:
Mejora a un tratamiento, Grado de Satisfaccin,
Intensidad del dolor, Medallas (oro, plata, bronce).
Es til codificarlas como nmeros para poder
procesarlas con facilidad.
Es conveniente asignar etiquetas a los valores
de las variables para recordar que significan los
cdigos numricos.
Importancia del Muestreo
Menos costosas y demandan menos tiempo para
ser examinadas.

El anlisis muestral implica una distincin entre
las dos principales ramas del anlisis estadstico
(descriptiva e inferencial).

La exactitud de toda estimacin es de enorme
importancia y depende en gran parte de la forma
en que se tom la muestra.
Importancia del Muestreo. Error de
Muestreo
Frecuentemente la muestra resulta no ser
representativa de la poblacin y resulta en
el error de muestreo.

Error de Muestreo: Diferencia entre el
parmetro desconocido de la poblacin y
el estadstico de la muestra utilizado para
calcular el parmetro.

Sesgo Muestral: Tendencia a favorecer
la seleccin de ciertos elementos de la
muestra en lugar de otros. Subjetividad.

Pasos para un Estudio Estadstico
1. Plantear Hiptesis sobre una poblacin
Los fumadores tienen ms ausencias laborales en relacin
a los no fumadores
2. Decidir que datos recoger
Cuales individuos y cuales datos de los mismos?
3. Recoger los datos (muestreo)
De que forma recolecto la informacin?
4. Describir los datos recogidos
Tiempo medio de ausencia de fumadores y no fumadores
% de ausencias por fumadores y sexo
5. Inferir, Concluir sobre la poblacin
En media los fumadores se ausentan 10 das al ao, ms de
lo que en media se ausentan los no fumadores
6. Cuantificar la confianza de la inferencia
Nivel de confianza del 95%
Significacin del contraste: Valor-p= 5%
Tcnicas de Muestreo
1. Aleatorio: Se usa cuando a cada elemento de la
poblacin se le quiere dar la misma oportunidad de
ser elegido en la muestra.
2. Estratificado: Cuando se conoce de antemano
que la poblacin est dividida en estratos, que son
equivalentes a categoras y los cuales por lo general
no son de igual tamao.
3. Por Conglomerados: Se divide en grandes
grupos, luego se elige al azar un cierto nmero de
ellos y todos los elementos de los conglomerados
elegidos forman la muestra.
4. Sistemtico: Cuando los datos de la poblacin
estn ordenados en forma numrica.

Calcular el Tamao de la Muestra



Donde:
-n = Tamao de la muestra.
-N = Tamao de la poblacin.
- =Desviacin estndar de la poblacin, generalmente cuando no se
tiene su valor, suele utilizarse un valor constante de 0,5.
-Z = Valor obtenido mediante niveles de confianza. Es un valor
constante que, si no se tiene su valor, se lo toma en relacin al 95%
de confianza equivale a 1,96.
-e = Lmite aceptable de error muestral que, generalmente cuando
no se tiene su valor, suele utilizarse un valor que vara entre el 1%
(0,01) y 9% (0,09), valor que queda a criterio del encuestador.
o
Z e
N
Z N
n 2 2 2
2 2
) 1 (
o
o
+
=

Medidas de Tendencia Central


Media
Mediana
Moda
Media Ponderada
Media Geomtrica

Los datos se agrupan alrededor de un punto
central denominado medida de la tendencia
central.

a). Media (Aritmtica)
Usualmente llamada promedio.


Media Poblacional:


Media Muestral:

Ej: Se supone una muestra de los ingresos por ventas
mensuales en miles de dlares para 5 meses es de: 56,
67, 52, 45, 67
= (56+67+52+ 45+ 67) /5 = ?

N
Xi
N
i 1 =
E
=
n
xi
X
n
i 1 =
E
=
X
b). Mediana
Corresponde exactamente al dato ubicado en la mitad del
conjunto de observaciones, luego de haberlas ordenado de
menor a mayor.

Si el conjunto de los datos tiene un nmero impar de
observaciones la posicin de la mediana es = (n+1)/2

Ej: los ingresos por ventas mensuales en miles de dlares
para 5 meses

45, 52, 56, 67,67 n=?
Posicin de la mediana = (? +1)/2 =3
45, 52, 56, 67,67

b). Mediana
Si el nmero de observaciones es un nmero par es
necesario promediar los dos valores medios.

Ej: 35,45,52,56, 67,67 n=?

Posicin de la mediana = (n+1)/2= 3,5
Hallar la media de la 3 y la 4 observacin
Mediana= (52+56)/2= 54


Conclusin: En la mitad de los meses (2,5) las
ventas estuvieron por debajo de US$ 54.000, y
en la mitad de los meses los ingresos
excedieron dicha suma.

c). Moda
La observacin modal es la observacin que
ocurre con mayor frecuencia.

Ej: En las observaciones 35,45,52,56,67,67 la
moda es 67, si hubiese otra observacin repetida, el
conjunto de datos es binomial.

-Si todas las observaciones se presentan en igual
frecuencia, el conjunto de datos no tiene moda.

d). Media Ponderada
Se utiliza en casos que quiere darse mayor peso a
algunas observaciones.

Ej: La Prfa. de modelos economtricos quiere
darle el doble de valor al parcial final que a los
dems parciales de la materia.


La media aritmtica es mayor que la media
ponderada porque en el ltimo examen, que tiene
mayor valor en la nota final, al estudiante le fue
peor que en los dems parciales.

=
W
XW
XW
1 , 3 5 / )] 2 * 2 ( ) 1 * 5 , 3 ( ) 1 * 4 ( ) 1 * 4 [( = + + + =
X
W
e). Media Geomtrica
Se utiliza para mostrar una medida precisa de un
cambio porcentual en una serie de nmeros
positivos. Es de amplia aplicacin en los negocios y
en la economa.

Ej: Una aerolnea desea determinar la tasa de
crecimiento promedio en los ingresos con base en
las cifras de 1992-1996. Si la tasa de crecimiento
promedio es menor que el promedio industrial del
10%, se asumir una nueva campaa publicitaria


n
n X X X X
MG ...
3 2 1
=
e). Media Geomtrica
INGRESOS DE LA AEROLNEA
AO INGRESOS
(US $ )
TASA DE
CRECIMIENTO
1992 50.000 ---
1993 55.000 55/50=1,10
1994 66.000 66/55=1,20
1995 60.000 60/66=0,91
1996 78.000 78/60=1,30
Restando 1 para convertirlo en
un incremento anual
porcentual da 0,1179, o un
incremento medio de 11,79%
para el perodo de cinco aos.

n
n X X X X
MG ...
3 2 1
=
4
) 30 , 1 ( ) 91 , 0 ( ) 20 , 1 ( ) 10 , 1 (
= MG
n=4
1179 , 1 = MG
Por qu no usamos la
media Aritmtica?

Cul es la comparacin entre media,
mediana y moda?
Ninguna de las medidas es necesariamente
mejor que las otras. La medida que se
seleccione depende de la naturaleza de los
datos o de la forma como se utilicen los datos.
Est Todo
Claro?
TALLER!
1.









2.
Medidas de Dispersin
Rango
Variacin y desviacin estndar de una
poblacin
Varianza y desviacin estndar de una muestra

Para qu?



Permiten una descripcin ms completa
del conjunto de datos, al medir que tan
dispersos estn los datos alrededor de su
media.
a). Rango
Es la diferencia entre las observaciones ms alta y
la ms baja. Aunque es fcil de calcular, considera
apenas dos de los cientos de observaciones que hay
en el conjunto de datos, el resto se ignoran.
b). Varianza y Desviacin Estndar de
una Poblacin
Varianza: Promedio de las observaciones
respecto a su media elevadas al cuadrado.





Desviacin Estndar: Es la raz cuadrada de la
varianza.

N
i
x
N
i
) (
2
1
2

o

=
E
=
o o
2
=
Ej: Pedrito Prez vende cinco plizas de seguro
diferentes del bal de su Plymouth modelo 1973.
Sus respectivas primas mensuales son de
US$110, US$145, US$125, US$95, US$150.
Cunto es la prima promedio?
=US$125

La varianza se halla:
Restar la media (US$125) a cada una de las
observaciones
Elevando esas diferencias al cuadrado
Hallar el promedio de estas desviaciones al
cuadrado
5
) 125 150 ( ) 125 95 ( ) 125 125 ( ) 125 145 ( ) 125 110 (
2 2 2 2 2
2
+
+ + +
=
o
430
2
=
o
Pero, Qu problemas presenta la varianza?
1. Es un nmero muy grande con respecto a las observaciones,

2. Como las desviaciones son elevadas al cuadrado, la varianza
siempre se expresa en trminos de los datos originales
elevados al cuadrado.
Como se solucionan dichas
complicaciones?
Hallando la desviacin estndar
430 = o
74 , 20 $ US = o
Entre mayor sea la desviacin estndar de la tasa de rendimiento
de una inversin en particular, mayor ser su nivel de riesgo.
Ej: Carlitos es gerente de una firma de inversiones, l est
interesado en la tasa de rendimiento de los ltimos cinco aos de
dos diferentes fondos mutuos.

Y, Qu es
un fondo
mutuo?

Los Fondos Mutuos de Inversin
son personas Jurdicas de
carcter privado creados por una
empresa o grupos de ellas y sus
trabajadores, para fomentar el
ahorro, estimular la inversin e
impulsar el desarrollo del
mercado de capitales para el
crecimiento de la economa del
pas.

Retomando: Carlitos est interesado en la tasa
de rendimiento de los ltimos cinco aos de dos
diferentes fondos mutuos, MEGABUCKS y
DYNAMICS, las tasas de rendimiento del
primero fueron: 12, 10, 13, 9 y 11% ; y del
segundo: 13, 12, 14, 10 y 6%.

Un cliente le pregunta a Carlitos Cul de los dos
debera escoger para invertir?


Cual debera escoger Carlitos para su cliente, si
ambos fondos ofrecen el mismo rendimiento
promedio del 11%?









La inversin ms segura es la que tenga un grado
menor de riesgo.
2
5
) 11 11 ( ) 11 9 ( ) 11 13 ( ) 11 10 ( ) 11 12 (
2 2 2 2 2
2
=
+ + +
=
+
o
Carlitos debe calcular:
MEGABUCKS:
Varianza:

Desviacin estndar:


DYNAMICS:
Varianza:

Desviacin estndar

% 41 , 1 2 =
= o
8
5
) 11 6 ( ) 11 10 ( ) 11 14 ( ) 11 12 ( ) 11 13 (
2 2 2 2 2
2
=
+ + +
=
+
o
% 83 , 2 8 =
= o
MEGABUCKS presenta
menos variacin en sus
rendimientos y ofrece
la misma tasa de
rendimientos que
DYNAMICS.
c). Varianza y Desviacin Estndar de
una Muestra
Varianza de la muestra:


Desviacin estndar de la muestra:
1
) (
2
1
2

E
=

=
n
i
x
x
s
n
i
s
S
2
=
Por qu n-1?
La razn es que generalmente,
una muestra est un poco menos
dispersa que la poblacin de la
cual se tom.
TALLER!
5.
TALLER!
8.
Para que?
El objetivo del anlisis estadstico es reducir el
nivel de incertidumbre en la toma de decisiones,
en ese sentido, la P.H. favorece la toma de
decisiones ms seguras y disminuye la
probabilidad de errores costosos.

Inferencias y/o supuestos acerca de la poblacin.
Planteamiento de la P.H.
Hiptesis Nula (H0): (Verdadero)
Hiptesis Alternativa (H1): (Falso)

Con base en los datos muestrales, H0 es
RECHAZADA o NO RECHAZADA.

El rechazo de Ho es ms significativo que el no
rechazo de Ho, y esto puede ocurrir debido a un
error de muestreo.
16 =
16 =
Ejemplo: Suponiendo una muestra de n
observaciones y con , podra concluirse
que ?.

Quizs no, pues esa pequea diferencia entre . y
.....podra ser estadsticamente insignificante y
puede atribuirse a un simple error de muestreo.

Es decir, la diferencia entre . y . es tan pequea
que resulta ser insuficiente para rechazar Ho.

5 , 16 = X
16 =

X
X

Entonces, Qu tan grande debe ser la diferencia
entre . y . para que sea estadsticamente
significativa, y poder rechazar H0?

Transformar la unidad de medida a valores
correspondientes de Z


si es desconocida, se utiliza s (desviacin estndar
muestral).

La distribucin normal resultante de Z tiene media
cero y desviacin estndar de uno.

X

n
X
Z
/
) (
o

=
o
Los valores de Z son valores crticos que
determinan la zona de rechazo.

La regla emprica dice que 95% de las s en la
distribucin de muestreo estn a 1,96 errores
estndar de la media poblacional desconocida.
- Con un intervalo de confianza de 95%,
- Prueba de dos Colas
Entonces 0,05/2= 0,025, buscando en la tabla de
probabilidades de una normal estandarizada
0,45+0,025= 0,4750, resultando en un Z=1,96.
El 5% restante, del nivel de significancia, est
distribuido entre las dos colas, y representan la zona
de rechazo de H0.
X

Los niveles de significancia ( ) comnmente seleccionados
para pruebas de hiptesis son 10%, 5% y 1%.

Prueba Bilateral:



Prueba Unilateral:



1 - /2 z
/2

0.90 0.05 1.645
0.95 0.025 1.96
0.99 0.005 2.575
1 - z


0.90 0.10 1.28
0.95 0.05 1.645
0.99 0.01 2.33


o
Regla de Decisin:
No se rechaza H0 si los valores Z estn entre
1,96.
Se rechaza si Z < -1,96
Se rechaza si Z > 1,96

Solo 5% de todas las muestras de la distribucin
muestral podran producir un -1,96>Z>1,96, pero si
dicho Z ocurre deber rechazarse H0. Pero si Ho es
verdadera, no es probable que pueda resultar un -
1,96>Z>1,96.

Nivel de Significancia y la
Probabilidad de Error
Error Tipo I: Rechazar una H0 que es verdadera.
El 5% del nivel de significancia ( ), representa
la probabilidad de ocurrencia de un error tipo I.
Error Tipo II: No rechazar una H0 que es Falsa.
Su probabilidad de ocurrencia ( )no es
determinado fcilmente, pues no se puede asumir
que .
05 , 0 = o
|
1 = + | o
Prueba de Dos Colas para
Pasos para realizar una Prueba de Hiptesis:
1. Plantear las Hiptesis
2. Calcular el valor del estadstico de prueba Z
3. Determinar la regla de decisin
4. Interpretar y Concluir

Ejemplo: Un embotellador desea probar la hiptesis
de que la media poblacional de liquido presente en las
botellas es de 16 onzas, a un . Selecciona una
muestra de n=50 botellas, con una media de .
onzas y una desviacin estndar de s=0,866 onzas.

% 5 = o
357 , 16 = X
Paso 1: Formular las Hiptesis
H0:
Ha:



16 =
16 =
Paso 2: Calcular los valores de Z
50
866 , 0
357 , 16
=
=
=
n
s
X
n
X
Z
/
) (
o

=
91 , 2
50 / 866 , 0
) 16 357 , 16 (
=

= Z
Paso 3: Regla de Decisin
No se rechaza H0 si -1,96 Z 1,96
Se rechaza H0 si Z<-1,96 o si Z >1,96


s s
Paso 4: Interpretacin y Conclusin
Se rechaza H0 a un nivel de significancia del 5%,
porque el valor Z calculado se ubica en la zona
de rechazo de la cola derecha.

Ho:
Ha:

16 =
16 =
Si no pudiramos rechazar H0 se concluye: No es
posible rechazar Ho a un ..., entonces la diferencia entre el
valor de la media poblacional y el valor de la media muestral
es estadsticamente insignificante.
% 5 = o
Prueba de Una Cola para
Hay ocasiones en las que la preocupacin se concentra
slo en un extremo u otro, y se realiza una prueba de una
cola.

El ... ya no se divide en 2 porque solo tenemos una cola.

Tanto en la prueba de cola a la izquierda como en la prueba
de cola a la derecha, el signo igual se coloca en la H0, para
darle un valor especfico a la prueba.

En lugar de plantear la hiptesis en trminos
exactos suponemos que es:

% 5 = o
A lo ms
Por lo menos
Ejemplo: El nmero promedio de habitaciones
alquiladas por noche en un hotel es de por lo
menos 212. Es decir, .. Uno de los
funcionarios considera que esta cifra puede estar
sobrestimada. Una muestra de 150 noches
produce una media de 201,3 habitaciones y una
desviacin estndar de 45,5 habitaciones. Si
estos resultados sugieren que el gerente ha
inflado su reporte, ser amonestado
severamente. A un nivel de 1%, Cul es el
destino del Gerente?
212 >
1. Formular las Hiptesis



2. Calcular los valores Z




3. Regla de Decisin
Rechazar H0 si Z < -2,33
No Rechazar Ho si Z >= -2,33





212 :
212 :
<
>

Ha
Ho
La informacin del Gerente es
que mnimo 212 son alquiladas.
% 1
150
5 , 45
3 , 201
=
=
=
=
o
n
s
X
n
X
Z
/
) (
o

=
88 , 2
150 / 5 , 45
) 212 3 , 201 (
=

= Z
4. Interpretacin y Conclusin

El valor Z=2,88 est claramente en la zona de
rechazo. Entonces no se confirma Ho.

Parece que el gerente se ha excedido al estimar su
tasa de ocupacin y aparentemente recibir un
llamado de atencin de la oficina principal.
Ejercicio:
Una encuesta realizada por la ANEC mostr que
los estudiantes de las universidades de la nacin
gastan en promedio ms de US$75 mensuales en
entretenimiento. Si usted puede hallar evidencias
para confirmar esta afirmacin, podra utilizarla
para solicitar a su casa ayuda monetaria
adicional. De los 100 estudiantes que tom de
muestra, usted halla una media de US$80,23 con
una varianza de 2085,75. A un nivel de
significancia de 2%, se encuentra justificacin
para la solicitud?

20.



22.

TALLER!

Вам также может понравиться