Вы находитесь на странице: 1из 39

CONTENIDOS

Distribucin normal

Teorema del lmite central

Nivel de significancia

Taller prctico
Qu es normal, o qu se aparta de la
normalidad?

Para establecer los lmites entre lo habitual y lo


raro, es necesario conocer la distribucin de la
variable en estudio, en individuos normales.

Las frecuencias de escalas de intervalos continuos se


representan grficamente con histogramas.

La suma de las superficies de todas las barras


equivale al 100% de las observaciones.
HISTOGRAMA

Eje horizontal: valores


hallados para una
determinada variable

Eje vertical: nmero


de casos encontrados
para cada valor o
frecuencia de
aparicin

El histograma permite
obtener una primera
impresin visual sobre
la distribucin de los
datos
Distribucin normal

La mayor parte de los fenmenos del comportamiento humano se


comportan de la siguiente manera:

La mayora de las puntuaciones se concentran en el centro de la


distribucin

Tanto en el extremo inferior como en el superior, encontraremos slo


algunos casos

Ejemplo:
Distribucin del coeficiente intelectual de las personas:
Pocas personas presentan dficit o retardo
Pocas personas son genios
La mayora somos personas medianamente inteligentes
La distancia entre la lnea trazada en la media y el punto de
inflexin de la curva es igual a una desviacin estndar

La distribucin queda completamente definida por el


promedio y la desviacin estndar:

El promedio 1 D.E = 68,3% de los casos.


El promedio 2 D.E = 95,4% de los casos.
El promedio 3 D.E = 99.7% de los casos.
Grfica de una distribucin normal y
significado del rea bajo la curva.
Valores de tensin arterial sistlica en una muestra

de 1000 pacientes isqumicos ingresados en UCI.


Histogramas y grficos de probabilidad
normal de los valores de peso y edad en
dos muestras de pacientes .
La importancia de la distribucin normal se debe principalmente a que hay
muchas variables asociadas a fenmenos naturales que siguen el modelo
de la normal

Caracteres morfolgicos de individuos (personas, animales, plantas,...)


de una especie, p.ejm. tallas, pesos, envergaduras, dimetros,
permetros,...

Caracteres fisiolgicos, por ejemplo: efecto de una misma dosis de un


frmaco, o de una misma cantidad de abono.

Caracteres sociolgicos, por ejemplo: consumo de cierto producto por


un mismo grupo de individuos, puntuaciones de examen.

Caracteres psicolgicos, por ejemplo: cociente intelectual, grado de


adaptacin a un medio,...

Errores cometidos al medir ciertas magnitudes.

Valores estadsticos mustrales, por ejemplo : la media.

Otras distribuciones como la binomial o la de Poisson son


aproximaciones normales, ...
Clculos de reas bajo la curva
Probabilidad de Ocurrencia
Supongamos que frente a una determinacin de glucosa en la
sangre tengamos que definir si este valor es normal o no.

Aceptemos que la glucosa sangunea tiene una distribucin


normal con promedio 83 y desviacin estndar 4

Supongamos un paciente con glucosa de 90, para determinar


si es habitual tener ese valor , o superior, debemos conocer la
probabilidad con que esto ocurre
Probabilidad de Ocurrencia
Para calcular el rea bajo la curva, lo cual corresponde a
la probabilidad de ocurrencia, se han construido tablas
de reas de la normal.

Esta tabla se trabajo, con el concepto de


curva normal estandarizada => media = 0 y S
=1

Para poder usar estas tabulaciones es necesario


transformar la variable original en que estn todos los
datos de manera que su promedio y su desviacin
estndar tengan esos valores.
Estandarizacin de las variables

Para calcular probabilidades con variables que siguen una distribucin


normal se usan tablas

Pero sera imposible tener una tabla para cada posible distribucin
normal,

Solamente tenemos la tabla de la distribucin normal estndar.

Necesitaremos, pues, ser capaces de transformar las variables X


"normales" N(,s)

En variables Z que sigan una distribucin normal estndar N(0,1).

Este proceso se llama tipificacin o estandarizacin de la variable.


Puntaje z

La variable transformada se llama variable normal


estndar y se smbolizar por z

Las puntuaciones z son transformaciones que se


hacen a los valores observados, con el propsito de
analizar su distancia respecto a la media en unidades de
desviacin estndar.

z = x promedio
D.E.
Veamos el ejemplo de la glucosa

z = x promedio
D.E. 90 se encuentra a

z = 90 83 = 7 = 1,75 1,75 S del promedio


4 4

Este valor se busca en la Tabla de puntajes z, para determinar la probabilidad


de encontrar glicemias iguales o superior a 90 mg por 100 ml de sangre.

El valor encontrado en la Tabla es 0,0401, lo que significa que es probable que


haya un 4,01% de individuos sanos con valores iguales o superior a 90 mg por 100
ml de sangre.
Veamos otro ejemplo:

Valor observado: 50
Promedio: 60
Desviacin estndar: 10

z = 50 60 = -10 = -1
10 10

Podemos decir que el valor 50 est localizado a una desviacin


estndar por debajo de la media de la distribucin .

El valor 30 estar a tres desviaciones estndar por debajo de la


media.
Tabla 1. reas bajo la curva normal estndar. Los valores de la tabla que no se muestran en negrita representan la
probabilidad de observar un valor menor o igual a z. La cifra entera y el primer decimal de z se buscan en la primera
columna, y el segundo decimal en la cabecera de la tabla.

Segunda cifra decimal del valor de z

z 0.00 .01 .02 .03 .04 .05 .06 .07 .08 .09

0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359

0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753

0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141

0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
Esquema de procedimiento de la
estadstica inferencial.

Inferencia de
los parmetros
RECOLECCION
RECOLECCION
DE Poblacin
LOS DATOS
DE LOS DATOS
CALCULO DE mediante
MEDIANTE
MEDIANTE
UNA UNA
ESTADIGRAFOS
tcnicas o universo
MUESTRA
MUESTRA estadsticas
apropiadas.

La estadstica inferencial puede se utilizada para dos procedimientos:


Probar hiptesis
Para estimar parmetros
Diagrama

Parmetros
Poblacin

Muestra
Estimadores
Qu es una distribucin muestral?

Una distribucin muestral es un conjunto de valores sobre


una estadstica, calculada de todas las muestras posibles de
determinado tamao.

Las distribuciones muestrales de medias, son las ms


comunes

Si calculramos la media de todas las medias de las


muestras posibles, obtendramos el valor de la media
poblacional.

Es ms bien un concepto estadstico para los investigadores;


lo que comnmente se hace es extraer una sola muestra.
En qu consiste la prueba de
hiptesis?

Es una proposicin respecto a uno o varios


parmetros.

Lo que el investigador hace a travs de la prueba de


hiptesis es determinar si la hiptesis es consistente
con los datos obtenidos en la muestra.

Hiptesis consistente => valor aceptable


del parmetro

Hiptesis no es consistente => se rechaza H


CMO PODREMOS SABER S LA HIPTESIS
ES CONSISTENTE O NO LO ES?

Al trabajar con una sola muestra , necesitamos


saber si el estadsgrafo de esta muestra, est
cerca del estadgrafo de la distribucin muestral?
Para ello , nos es til es

Teorema del Lmite central


QU DICE EL T. L. C.?

Es una proposicin de que an en muestras de


tamao moderado ( ms de 100 casos) , la distribucin
de las muestras ser aproximadamente normal.

Especifica que la distribucin muestral tiene una


media igual a la de la poblacin , una varianza igual a la
varianza de la poblacin dividida por el tamao de la
muestra y se distribuye normalmente, donde la
varianza puede estimarse por la desviacin estndar de
la muestra.

PARA QUE SIRVE?

Para hacer estadstica inferencial sobre los


valores de una poblacin
Por lo tanto, podemos decir que el
TLC

Cuanto mayor es el tamao de la muestra , menos es la


variabilidad y por lo tanto ms similar a la media de la
poblacin ser la media obtenida de la muestra

Cuanto menor sea el grado de la variabilidad (/n), ms


ajustada a la media de la poblacin sern las medias
que obtengamos de una muestra.
Qu hace el investigador......

El investigador tiene que evaluar si la


probabilidad de que la media de la muestra est
cerca de la media de la distribucin muestral es
grande o es pequea.

Si es pequea, el investigador dudar de


generalizar a la poblacin y viceversa
Qu se entiende por nivel de
significancia o nivel ?

El nivel alfa () es un nivel de probabilidad de


equivocarse y se fija antes de probar hiptesis
inferenciales.

Y con qu porcentaje tiene confianza el


investigador para generalizar?
El nivel de significancia del 0,01

El nivel de significancia del 0,05

Por lo tanto; el nivel de significancia es un valor


de certeza que fija el investigador a priori
Cmo se relacionan la distribucin muestral y el
nivel de significancia?

La distribucin muestral
El nivel de significancia se tambin se expresa como
expresa en trminos de probabilidad
probabilidad

rea total de esta

0,05 1,0
0,01
Para ver si tenemos o no confianza al generalizar
acudimos a la distribucin muestral ; ya que el nivel
de significancia lo tomamos como un rea bajo la
distribucin muestral.

EL NIVEL DE SIGNIFICANCIA REPRESENTA


AREAS DE RIESGO O CONFIANZA EN LA
DISTRIBUCIN MUESTRAL.
Aplicado el concepto de probabilidad a la distribucin muestral
podemos tomar el rea de sta como 1.

Cualquier rea comprendida entre dos puntos corresponder a la


probabilidad de la distribucin.

Para probar hiptesis inferenciales respecto a la media, el


investigador debe evaluar si es alta o baja la probabilidad de que la
media de la muestra est cerca de la media de la distribucin
muestral.
Si es baja el investigador dudar de generalizar a la poblacin.
Si es alta, el investigador podr hacer generalizaciones.

Es aqu donde entra el nivel de significancia o nivel alfa () => nivel


de probabilidad de equivocarse.
Qu hacemos para ver si nuestra hiptesis sobre la
media poblacional es aceptada o rechazada?

Debemos recordar que:


- La distribucin muestral es una distribucin normal de
puntuaciones z

- Las puntuaciones z son distancias que indican reas


bajo la distribucin normal

- rea de riesgo => rea de rechazo de la hiptesis


rea de confianza => rea de aceptacin de la
hiptesis

- Se habla de una hiptesis acerca del parmetro


Si nos dieran 95 boletos de 100 para la rifa de un automvil
tendramos confianza en que el auto ser nuestro?....

Lo mismo hace el investigador, obtiene una estadstica en una


muestra y analiza que porcentaje tiene de confianza en que
dicha estadstica se acerque al valor de la distribucin muestral
(universo), busca una probabilidad elevada para inferir con
seguridad dicho resultado a la poblacin general.
y con qu porcentaje tiene confianza
el investigador para generalizar?

El nivel de significancia de 0.05, el cual implica que el


investigador tiene el 95% de seguridad para
generalizar sin equivocarse.

El nivel de significancia de 0.01, el cual implica que el


investigador tiene el 99% para generalizar sin temor
a equivocarse y 1% en contra.

No se acepta un nivel de 0.06 (94% a favor de la


generalizacin confiable), ya que se busca hacer
ciencia y no intuicin)
VEAMOS EL PROCEDIMIENTO

1. Establecer una hiptesis acerca del parmetro


poblacional.

2. Definir el nivel de significancia

3. Recolectar los datos en una muestra representativa

4. Estimar la desviacin estndar de la distribucin


muestral de la media

5. Transformar la media de la muestra en una puntuacin


z

6. En la tabla de reas bajo la curva normal, buscar valor


z

7. Comparo la media de mi muestra transformada a


puntuacin z con el valor 1,96. ; si es menor acepto la
hiptesis y si es mayor la rechazo.
Es importante recordar:

Recordar que la distribucin muestral es una


distribucin normal de puntuaciones z, o unidades
de desviacin estndar.

Las puntuaciones z son distancias que indican


reas bajo la distribucin normal. En este caso, reas
de probabilidad.

El rea de riesgo es tomada como el rea de rechazo


de la hiptesis y el rea de confianza es tomada
como el rea de aceptacin de la hiptesis.
MUCHAS
GRACIAS

ALGUNA DUDA? Y

Вам также может понравиться