Вы находитесь на странице: 1из 27

TECNOLOGICO NACIONAL DE MEXICO.

INSTITUTO TECNOLOGICO DE CAMPECHE.

ING. INDUSTRIAL

UNIDAD 1. DISTRIBUCION NORMAL DE


PROBABILIDADES.

“Temas de investigación conceptual”.

ALUMNO: Ramirez Morales José Alvaro.

MATERIA: ESTADÍSTICA INFERENCIAL I.

GRUPO: MI-3.
Noviembre 2017
Competencias específicas a desarrollar.

2
Introducción.
En el siguiente trabajo se presentan diferentes tipos de conceptos junto con
información adicional para que el tema se comprenda con el trabajo se espera que
se pueda comprender un poco más de la estadística inferencial ya que es muy
importante en la vida laboral.

3
Índice
La distribución Normal de probabilidades…………………………………………....4

Conceptos básicos de estadística (población, muestra, estadístico, parámetro) ...9

Los 2 problemas que atiende la Inferencia estadística…………………………........10

Razones del muestreo……………………………………………………………………10

El muestreo aleatorio…………………………………………………………………….10

Métodos de muestreo……………………………………………………………………10

Objetivo del muestreo……………………………………………………………………10

¿Se puede esperar que al analizar una población un Estadístico sea igual al Parámetro.11
correspondiente?

Teorema del Límite Central…………………………………………………………….11

Distribución de muestreo………………………………………………………………..12

Distribución muestral para una media “ 2


” conocida………………………………...13

Distribución de la media muestral con varianza desconocida……………………….16

Distribución muestral para una media, desconocida, la distribución “t” de Student…18

Distribución muestral para una proporción…………………………………………….20

Distribución muestral para una varianza, la distribución (ji o chi cuadrada)……22

Distribuciones muestrales para 2 poblaciones…………………………………………24

Bibliografía…………………………………………………………………………………27

4
La distribución normal de probabilidad: Sin duda, la distribución continua de
probabilidad más importante, por la frecuencia con que se encuentra y por sus
aplicaciones teóricas, es la distribución normal, gaussiana o de Laplace-Gauss.
Fue descubierta y publicada por primera vez en 1733 por De Moivre. A la misma
llegaron, de forma independiente, Laplace (1812) y Gauss (1809), en relación con
la teoría de los errores de observación astronómica y física . Caracteres
fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco.

Caracteres morfológicos de individuos (personas, animales, plantas,...) de una


especie (tallas, pesos, diámetros, perímetros,...).

Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo


grupo de individuos, puntuaciones de examen,

Caracteres fisiológicos, por ejemplo: efecto de una dosis por un mismo fármaco.

Errores cometidos al medir ciertas magnitudes.

Valores estadísticos muestrales, por ejemplo: la media. Y en general cualquier


característica que se obtenga como suma de muchos factores.

Está caracterizada por dos parámetros: la media, μ y la desviación típica, σ.

• Su función de densidad es: (σ 0) σ 2π 1 (μ,σ) ( ) 2 2 2σ ( μ) = = > − − x N P x e


La curva normal adopta un número infinito de formas, determinadas por sus
parámetros μ y σ.

Las 3 razones de su importancia. Muchas variables continuas comunes en el


mundo de los negocios tienen distribuciones que se asemejan estrechamente a la
distribución normal. La distribución normal sirve para acercarse a diversas
distribuciones de probabilidad discreta, como la distribución binomial y la
distribución de Poisson. La distribución normal proporciona la base para la
estadística inferencial clásica por su relación con el teorema de límite central.

5
Características: Tiene forma de campana, es asintótica al eje de las abscisas
(para x = ±∞ )

Los puntos de inflexión tienen como abscisas los valores µ ± σ.

Simétrica con respecto a la media (µ) donde coinciden la mediana (Mn) y la moda
(Mo).

Curva normal: aunque el concepto tiene un uso específico en el terreno de la


estadística. Se llama curva normal a la distribución gaussiana: la distribución de
probabilidad de una variable continua que suele resultar próxima a un fenómeno
real. La utilización de un modelo normal permite asumir que las observaciones
derivan de la sumatoria de causas independientes.

En este marco, sirve para modelar fenómenos sociales y naturales de forma


aproximada a la realidad

Áreas bajo la curva normal: hace mas facil el calculo en proporciones ya que por
medio de la curva miramos qué dato está cerca de la media, que dato llega a la
punta de la curva o ver de qué lado están concentrados los datos ya que como
parte principal es la media porque primero tenemos que ubicar la media que nos
sirve como guía y después se colocan los demás datos en la curva, en lo cual la
curva tiene forma de campana la media, la moda y la mediana de la distribución

6
son iguales. Una aplicación matemática de mucha utilidad que consiste en calcular
el área delimitada entre dos puntos del eje y la de un gráfico.

Distribución Normal estándar


En efecto, todas las distribuciones Normales son lo mismo si usamos las unidades
de me-
dida σ alrededor de su media µ que es el centro. El proceso para cambiar nuestra
distribución
a estas variables se le conoce como estandarización.
Definición 1.1. Si x es una observación de una distribución con media µ y
desviación
estándar σ, el valor estandar de x lo es
z=
x−µ
σ
Este valor estándar también se le conoce como valor-z.
El valor-z nos indica cuantas desviaciones estándares está la observación original
de si
media y en que dirección. Las observaciones mayores que su media toman
valores posıtivos
cuando se estandarizan mientras los valores que son menores a su media toman
valores
negativos.
Ejemplo 1.1. El peso de una bolsa de “papitas” cuya etiqueta indica que es de 9oz
es
aproximadamente Normal con µ = 9.12oz y σ = 0.15oz. El peso estándar es
z=
weight − 9.12
0.15
Por ejemplo una bolsa que pese 9.3oz, su peso estandarizado lo es
z=
9.3 − 9.12
0.15
= 1.2

7
o simplemente 1.2 desviaciones estándar por encima de la media. Similarmente
una bolsa
que pese 8.7oz tiene un peso estandarizado de
z=
8.7 − 9.12
0.15
= −2.8
o 2.8 desviaciones por debajo de la media.
Si las variables originales (antes de aplicar el proceso de estandarización) tenıan
una
distribución normal, el proceso de estandarización no brinda una nueva escala
(común) y
esta distribución sigue siendo una Normal conocida como distribución Normal
estándar.

Modelo de estandarización:

Ajustar algo a un modelo, tipo o patrón; hacer que una cosa sea uniforme. Esta
definición, a su vez, se amplía para referirse a fabricar o comprobar un producto
en serie de acuerdo con un modelo determinado. Cuando se aborda el tema de la
estandarización o también llamada normalización, se está planteando el desarrollo
y la aplicación de normas industriales que permiten la fabricación de grandes
cantidades de partes intercambiables. Uso de la tabla del modelo de distribución
estándar. presenta las soluciones a esta integral para distintos valores de x, hay
varios modelos de tablas de este tipo, así como algoritmos para su cálculo por
ordenador.

8
Uso de la tabla de la distribución normal estándar.

En la tabla podemos leer directamente la probabilidad de valores menores


o iguales que un número positivo.

En la 1ª columna z buscamos el valor de las unidades y las décimas.


En la fila correspondiente al valor de la columna buscamos el valor de las
centésimas.
Basta buscar 0,4 en la columna y 0,05 en la fila. Su intersección nos da la
probabilidad.
Leemos y nos da 0,6736. La probabilidad p ( z ≤ 0,45 ) = 0,6736

9
Conceptos básicos de estadística
Población: Es un conjunto de sujetos o elementos que presentan características
comunes. Sobre esta población se realiza el estudio estadístico con el fin de sacar
conclusiones.

Muestra: Es un subconjunto de casos o individuos de una población. En diversas


aplicaciones interesa que una muestra sea una muestra representativa y para ello
debe escogerse una técnica de muestra adecuada que produzca una muestra
aleatoria adecuada ( se obtiene una muestra sesgada cuyo interés y utilidad es
más limitado dependiendo del grado de sesgo que presente).

Como un subgrupo o subconjunto representativo de la población, extraída


seleccionada por algún método de muestreo. La muestra siempre es una parte de
la población. Si se tiene varias poblaciones, entonces se tendrá varias muestras.
La muestra debe poseer toda la información deseada para tener la posibilidad de
extraerla, esto solo se puede lograr con una buena selección de la muestra y un
trabajo muy cuidadoso y de alta calidad en la recogida de datos.

Estadístico: es una medida cuantitativa, derivada de un conjunto de datos de


una muestra, con el objetivo de estimar o inferir características de una población o
modelo estadístico. Más formalmente un estadístico es una función medible T que,
dada una muestra estadística de valores {\displaystyle
(X_{1},X_{2},...,X_{n})}(((((8888 (X1,X2,…….,X12) les asigna un número,
{\displaystyle T(X_{1},X_{2},...,X_{n})} T(X1,X2,….X12) que sirve para estimar
determinado parámetro de la distribución de la que procede la muestra. Así, por
ejemplo, la media de los valores de una muestra (media muestral) sirve para
estimar la media de la población de la que se ha extraído la misma; la varianza
muestral podría usarse para estimar la varianza poblacional, etc. Esto se
denomina como realizar una estimación puntual.

Parámetro: Es un número que resume la gran cantidad de datos que pueden


derivarse del estudio de una variable estadística. El cálculo de este número está
bien definido, usualmente mediante una fórmula aritmética obtenida a partir de
datos de la población. Los parámetros estadísticos son una consecuencia
inevitable del propósito esencial de la estadística: crear un modelo de la realidad.
El estudio de una gran cantidad de datos individuales de una población puede ser
farragoso e inoperativo, por lo que se hace necesario realizar un resumen que
permita tener una idea global de la población, compararla con otras, comprobar su
ajuste a un modelo ideal.

10
Los 2 problemas que atiende la inferencia estadística: Los dos tipos de
problemas que resuelven las técnicas estadísticas son: estimación y contraste de
hipótesis. En ambos casos se trata de generalizar la información obtenida en una
muestra a una población. Estas técnicas exigen que la muestra sea aleatoria. En
la práctica rara vez se dispone de muestras aleatorias.

Razones de muestreo: Algunas razones que justifican el uso del muestreo son:
1) naturaleza destructiva del proceso de investigación 2) imposibilidad de revisar
todos los elementos de la población. 3) Costo: al obtener los datos de una
pequeña porción del total. 4) tiempo: al considerar solo una parte del total, su
recolección y resumen se hará con mayor rapidez. 5) precisión: las posibilidades
de usar personal mas capacitado y supervisar cuidadosamente el trabajo de
campo y el procesamiento de la información.

El muestreo aleatorio: Es la técnica de muestreo en la que todos los elementos


que forman el universo y que, por lo tanto, están descritos en el marco muestral,
tienen idéntica probabilidad de ser seleccionados para la muestra. Sería algo así
como hacer un sorteo justo entre los individuos del universo: asignamos a cada
persona un boleto con un número correlativo, introducimos los números en una
urna y empezamos a extraer al azar boletos. Todos los individuos que tengan un
número extraído de la urna formarían la muestra.

Métodos de muestreo: Es el proceso por el cual se seleccionan los individuos


que formarán una muestra. Para que se puedan obtener conclusiones fiables para
la población a partir de la muestra, es importante tanto su tamaño como el modo
en que han sido seleccionados los individuos que la componen. El tamaño de la
muestra depende de la precisión que se quiera conseguir en la estimación que se
realice a partir de ella. Para su determinación se requieren técnicas estadísticas
superiores, pero resulta sorprendente cómo, con muestras notablemente
pequeñas, se pueden conseguir resultados suficientemente precisos. Por ejemplo,
con muestras de unos pocos miles de personas se pueden estimar con muchísima
precisión los resultados de unas votaciones en las que participarán decenas de
millones de votantes. Para seleccionar los individuos de la muestra es
fundamental proceder aleatoriamente, es decir, decidir al azar qué individuos de
entre toda la población forman parte de la muestra. Si se procede como si de un
sorteo se tratara, eligiendo directamente de la población sin ningún otro
condicionante, el muestreo se llama aleatorio simple o irrestrictamente aleatorio.

Objetivo del muestreo: El objetivo del muestreo es obtener inferencia sobre una
población de interés, de la forma más eficiente y confiable. (Falta por responder)
Teorema del límite central: o teorema central del límite indica que, en condiciones
muy generales, si Sn es la suma de n variables aleatorias independientes y de

11
varianza no nula pero finita, entonces la función de distribución de Sn «se
aproxima bien» a una distribución normal (también llamada distribución gaussiana,
curva de Gauss o campana de Gauss). Así pues, el teorema asegura que esto
ocurre cuando la suma de estas variables aleatorias e independientes es lo
suficientemente grande. Distribución de muestreo: La distribución muestral es lo
que resulta de considerar todas las muestras posibles que pueden ser tomadas de
una población. Su estudio permite calcular la probabilidad que se tiene, dada una
sola muestra, de acercarse al parámetro de la población. Mediante la distribución
muestral se puede estimar el error para un tamaño de muestra dado.

¿Se puede esperar que al analizar una población un Estadístico


sea igual al Parámetro correspondiente?
no se puede esperar porque el estadístico y el parámetro siempre son diferentes

Teorema del límite central: Si una población tiene media μ y desviación típica σ,
y tomamos muestras de tamaño n (n > 30, ó cualquier tamaño si la población es
"normal"), las medias de estas muestras siguen aproximadamente la distribución:

Consecuencias

1.Permite averiguar la probabilidad de que la media de una muestra


concreta esté en un cierto intervalo.

2.Permite calcular la probabilidad de que la suma de los elementos de una


muestra esté, a priori, en un cierto intervalo.

3.Inferir la media de la población a partir de una muestra.

12
Ejemplos

Las bolsas de sal envasadas por una máquina tienen μ = 500 g y σ = 35 g.


Las bolsas se empaquetaron en cajas de 100 unidades.

1.Calcular la probabilidad de que la media de los pesos de las bolsas de un


paquete sea menor que 495 g.

Distribución de muestreo:

Las distribuciones de muestreo constituyen una pieza importante de estudio por


varias razones. En la mayoría de los casos, la viabilidad de un experimento dicta
el tamaño de la muestra. La distribución de muestreo es la distribución de
probabilidad de una muestra de una población en lugar de toda la población.
En palabras más simples, supongamos que de una determinada población tomas
todas las muestras posibles de tamaño n y calculas una estadística (por ejemplo,
media) de todas las muestras. Si luego preparas una distribución de probabilidad
de esta estadística, obtendrás una distribución de muestreo.

Las propiedades de la distribución de muestreopueden variar dependiendo de


cuán pequeña sea la muestra en comparación con la población. Se supone que la
población se distribuye normalmentecomo generalmente sucede. Si el tamaño de
la muestra es lo suficientemente grande, la distribución de muestreo también
estará cerca de lo normal.

13
Si éste es el caso, entonces la distribución de muestreo puede ser totalmente
determinada por dos valores: la media y la desviación estándar. Estos dos
parámetros son importantes para calcular la distribución de muestreo si se nos da
la distribución normal de toda la población.
Distribución de muestreo de la media y la desviación estándar

La distribución de muestreo de la media se obtiene tomando la estadística bajo


estudio de la muestra como la media. Calcular esto significa tomar todas las
muestras posibles de tamaño n de la población de tamaño N y luego trazar la
distribución de probabilidad. Se puede demostrar que la media de la distribución
de muestreo es, de hecho, la media de la población.
Sin embargo, la desviación estándar es diferente para la distribución de muestreo
en comparación con la población. Si la población es lo suficientemente grande,
esto está dado por:

Donde σ es la desviación estándar de la distribución de la población y σx̄ es la


media de población.

Distribución muestral para una media conocida.

Características: DISTRIBUCIÓN MUESTRAL Una distribución muestral es una


distribución de Probabilidad de una estadística muestral calculada a partir de todas
las muestras posibles de tamaño "n" elegidas al azar de una población
determinada. Generalmente nos interesa conocer una o más de los siguientes
características de la distribución muestral. 1.- Su forma funcional (como aparece
en su representación gráfica). 2.- Su media.

Estadístico de prueba:

Ejemplo de Contraste de hipo´tesis para la media con σ conocida(una cola)

Se desea contrastar con un nivel de significaci´on del 5% la hip´otesis de que la


talla media de los hombres de 18 o m´as an˜os de un pa´ıs es igual o mayor a 175.
14
Suponiendo que la desviaci´on t´ıpica de las tallas en la poblaci´on vale 4,
contraste dicha hip´otesis frente a la alternativa de que es menor, con una muestra
de n=15 hombres seleccionados al azar, cuyas alturas son las del apartado
anterior:

H0 : µ ≥ 175

frente a la alternativa:

H1 : µ < 175 En el modelo normal, el cuantil de orden 0.05 es −z0,05 = −1,64.


Sustituyendo los datos en la expresi´on del estad´ıstico de contraste, tenemos:

zc =

173,47−175 4√15

= −1,48

El valor del estadístico de contraste está en la zona de aceptación. Por lo que no


se puede rechazar la hipótesis nula que establece una talla media igual o mayor a
175 cm. Graficamente la situación es la siguiente:

Uso de la tabla de distribución.

La tabla de la distribución normal presenta los valores de probabilidad para una


variable estándar Z, con media igual a 0 y varianza igual a 1.

Para usar la tabla, siempre debemos estandarizar la variable por medio de la


expresión:

15
Siendo el valor de interés; la media de nuestra variable y su desviación
estándar. Recordemos que y corresponden a parámetros, o sea valores en el
universo, que generalmente no conocemos, por lo que debemos calcular Z usando
los datos de nuestra muestra.

En general, el valor de Z se interpreta como el número de desviaciones estándar


que están comprendidas entre el promedio y un cierto valor de variable x. En otras
palabras, se puede decir que es la diferencia entre un valor de la variable y el
promedio, expresada esta diferencia en cantidad de desviaciones estándar.

Suena abstracto, pero con un ejemplo se podrá entender mejor:

Supongamos un conjunto de personas con edad promedio 25 años y desviación


estándar 3,86. Nuestro valor de interés (x) es 30 años. El valor de Z
correspondiente será:

Este valor de Z nos dice que la edad de 30 años está a 1,29 desviaciones
estándar sobre el promedio.

16
Distribución de la media muestral con varianza desconocida.

Características: En apartados anteriores estudiamos el comportamiento de la


media muestral y vimos que ésta dependía tanto del valor de la media poblacional
, como de la varianza poblacional , parece lógico pensar que si nuestro interés
radica en inferir comportamientos de la población partiendo de la muestra parece
ilógico pensar que conozcamos la varianza . De ahí la importancia de establecer
una distribución para la media muestral que la relacione únicamente con la
poblacional, lo que hará que conocida la muestral concreta podamos aventurar el
comportamiento de la poblacional.

Así tendríamos :

lo que da lugar a :

hemos visto sin demostrar que

conocemos que luego


simplificando tendríamos

expresión que relaciona ambas medias y la varianza muestral con


una distribución conocida

El estadístico de prueba:
Supongamos que se desconoce la desviación típica de las tallas en la población
del ejemplo anterior. Se desea contrastar la hipótesis nula siguiente a un nivel de
significacion del 5%.

H0 : µ ≤ 168

17
frente a la alternativa:

H1 : µ > 168

En este caso es necesario estimar la desviación típica de la población con los


datos de la muestra. Dado el valor muestral de la media X y la cuasi desviación
típica de la muestras, se determina el estadístico de contraste:

tc =

X −µ0 s √n

En este ejemplo el contraste es de una cola, tal que el nivel de significaci´on α que
determina el valor tα es tal que

α = P(tn−1 ≥ tα) Para el nivel de significacion dado, α = 0,05, es necesario


determinar el cuantil en la distribución t de Student con n-1 grados de libertad y el
valor s (cuasidesviacion típica) de la muestra:

Para los datos de la muestra se obtiene que X = 137,47 y s = 7,36. El cuantil en la


distribución t14 es tα = 1,762. De modo que sustituyendo en la expresión del
estadístico de contraste, tenemos:

tc =

173,47−168 7,36 √15

= 2,88

El grafico siguiente muestra la situación que nos lleva a rechazar la hipótesis nula,
dado que el valor del estadístico de contraste cae en la zona de rechazo.

Distribución muestral para una media, desconocida, la


distribución “t” de Student

Características:

supóngase que se toma una muestra de una población normal con media y
varianza . Si es el promedio de las n observaciones que contiene la muestra

aleatoria, entonces la distribución es una distribución normal estándar.


Supóngase que la varianza de la población 2 es desconocida. ¿Qué sucede con

18
la distribución de esta estadística si se reemplaza por s? La
distribución t proporciona la respuesta a esta pregunta.

La media y la varianza de la distribución t son =0y para >2,


respectivamente.

La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia


general de la distribución t es similar a la de la distribución normal estándar:
ambas son simétricas y unimodales, y el valor máximo de la ordenada se alcanza
en la media = 0. Sin embargo, la distribución t tiene colas más amplias que la
normal; esto es, la probabilidad de las colas es mayor que en la distribución
normal. A medida que el número de grados de libertad tiende a infinito, la forma
límite de la distribución t es la distribución normal estándar.

Estadístico de prueba:

Si y s son la media y la desviación estándar de una muestra aleatoria de una

población normal con varianza , desconocida, un intervalo de confianza de


( )100% para es:

donde /2 es el valor t con = n-1 grados de libertad, que deja un área de


/2 a la derecha.

Se hace una distinción entre los casos de conocida y desconocida al


calcular las estimaciones del intervalo de confianza. Se debe enfatizar que para el
primer caso se utiliza el teorema del límite central, mientras que para
desconocida se hace uso de la distribución muestral de la variable aleatoria t. Sin
embargo, el uso de la distribución t se basa en la premisa de que el muestreo se
realiza de una distribución normal. En tanto que la distribución tenga forma
aproximada de campana, los intervalos de confianza se pueden calcular cuando la
varianza se desconoce mediante el uso de la distribución t y se puede esperar
buenos resultados.

Con mucha frecuencia los estadísticos recomiendan que aun cuando la


normalidad no se pueda suponer, con desconocida y n 30, s puede
reemplazar a y se puede utilizar el intervalo de confianza:

19
Por lo general éste se denomina como un intervalo de confianza de muestra
grande. La justificación yace sólo en la presunción de que con una muestra grande
como 30, s estará muy cerca de la real y de esta manera el teorema del límite
central sigue valiendo. Se debe hacer énfasis en que esto es solo una
aproximación y que la calidad de este enfoque mejora a medida que el tamaño de
la muestra crece más.

Ejemplos:

1. El contenido de siete contenedores similares de ácido sulfúrico son 9.8,


10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza
del 95% para la media de todos los contenedores si se supone una
distribución aproximadamente normal.

Solución:

La media muestral y la desviación estándar para los datos dados son:

10 y s= 0.283

En la tabla se encuentra que t0.025=2.447 con 6 grados de libertad, de aquí,


el intervalo de confianza de 95% para es:

20
Distribución muestral para una proporción

APROXIMACIÓN DE LA NORMAL A LA BINOMIAL.

En este caso se estarán calculando probabilidades de experimentos


Binomiales de una forma muy aproximada con la distribución Normal, esto
puede llevarse a cabo si n y p = p(éxito) no es muy cercana a 0 y 1, o
cuando n es pequeño y p tiene un valor muy cercano a ½ ; esto es,

Donde:
x = variable de tipo discreto; solo toma valores enteros
= np = media de la distribución Binomial
= = desviación estándar de la distribución Binomial

Cuando ocurren las condiciones anteriores, la gráfica de la distribución


Binomial, es muy parecida a la distribución Normal, por lo que es adecuado
calcular probabilidades con la Normal en lugar de con la Binomial y de una
forma más rápida.
En resumen, se utiliza la aproximación Normal para evaluar probabilidades
Binomiales siempre que p no esté cercano a 0 o 1. La aproximación es
excelente cuando n es grande y bastante buena para valores pequeños
de n si p está razonablemente cercana a ½. Una posible guía para determinar
cuando puede utilizarse la aproximación Normal es tener en cuenta el cálculo
de npy nq. Sí ambos, np y nq son mayores o iguales a 5, la aproximación será
buena.

características: Existen ocasiones en las cuales no estamos interesados en la


media de la muestra, sino que queremos investigar la proporción de artículos
defectuosos o la proporción de alumnos reprobados en la muestra. La distribución
muestral de proporciones es la adecuada para dar respuesta a estas situaciones.
Esta distribución se genera de igual manera que la distribución muestral de
medias, a excepción de que al extraer las muestras de la población se calcula el
estadístico proporción (p=x/n en donde "x" es el número de éxitos u observaciones
de interés y "n" el tamaño de la muestra) en lugar del estadísitico media.

21
Una población binomial está estrechamente relacionada con la distribución
muestral de proporciones; una población binomial es una colección de éxitos y
fracasos, mientras que una distribución muestral de proporciones contiene las
posibilidades o proporciones de todos los números posibles de éxitos en un
experimento binomial, y como consecuencia de esta relación, las afirmaciones
probabilísticas referentes a la proporción muestral pueden evaluarse usando la
aproximación normal a la binomial, siempre que np 5 y
n(1-p) 5. Cualquier evento se puede convertir en una proporción si se divide el
número obtenido entre el número de intentos.

Distribución muestral para una varianza, la distribución ji o chi


cuadrada.

Características: Los modelos de las distribuciones t, Ji Cuadrado y F son más


complejos que los modelos Binomial y Normal, por lo que es más práctico definir
estas distribuciones de la siguiente manera.

Si una variable es obtenida según la expresión

donde

a) Las puntuaciones z han sido obtenidas de datos que se distribuyen segun el


modelo Normal, y

b) Cada puntuación z es independiente de las otras.

la variable T se distribuirá según el modelo Ji Cuadrado con "k" grados de libertad.

22
Principales características

a) La forma de la distribución es asimétrica positiva, y se acerca a la distribución


Normal como mayor sea el número de grados de libertad (g.l.). Ejemplo con 5 g.l.:

b) Las puntuaciones Ji Cuadrado no pueden tomar valores negativos.

c) La función de distribución de la distribución Ji Cuadrado está tabulada para


algunos valores que son de interés en Estadística Inferencial.

Estadístico de prueba: Esta prueba puede utilizarse incluso con datos


medibles en una escala nominal. La hipótesis nula de la prueba Chi-cuadrado
postula una distribución de probabilidad totalmente especificada como el modelo
matemático de la población que ha generado la muestra.

Para realizar este contraste se disponen los datos en una tabla de frecuencias.
Para cada valor o intervalo de valores se indica la frecuencia absoluta observada o
empírica (Oi). A continuación, y suponiendo que la hipótesis nula es cierta, se
calculan para cada valor o intervalo de valores la frecuencia absoluta que cabría
esperar o frecuencia esperada (Ei=n·pi , donde n es el tamaño de la muestra y pi
la probabilidad del i-ésimo valor o intervalo de valores según la hipótesis nula). El
estadístico de prueba se basa en las diferencias entre la Oi y Ei y se define como:

Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n
es suficientemente grande, es decir, si todas las frecuencias esperadas son
mayores que 5. En la práctica se tolera un máximo del 20% de frecuencias
inferiores a 5.

23
Si existe concordancia perfecta entre las frecuencias observadas y las esperadas
el estadístico tomará un valor igual a 0; por el contrario, si existe una gran
discrepancias entre estas frecuencias el estadístico tomará un valor grande y, en
consecuencia, se rechazará la hipótesis nula. Así pues, la región crítica estará
situada en el extremo superior de la distribución Chi-cuadrado con k-1 grados de
libertad.

Distribución muestral para 2 poblaciones.

Propiedad reproductiva de la distribución normal: Si X1, ..., Xn son n


variables aleatorias independientes, distribuidas según una i = 1, ..., n, entonces la
variable aleatoria:i, a), para (

Y = X1 + ... + Xn

sigue una distribución:

n, a)1 + ... + (

Demostración:

Calculamos la función generatriz de momentos de la variable aleatoria Y, con lo


que:

=etXn ..... EetX1 = Ee t(X1+...+Xn) = EetYgY(t) = E

n)1+ ... + n = (1- t/a)-( 1 ..... (1- t/a)- = (1- t/a)-

n,a).1+...+(que es la función generatriz de momentos de una distribución:

Y teniendo en cuenta la conocida propiedad de la unicidad de la función generatriz


de momentos, resulta que:

n, a)1 + ... + ( Y

.,a) es reproductiva respecto al parámetro (es decir, que la distribución

Proposición:

Si la variable aleatoria X se distribuye según una N(0,1), entonces la variable


aleatoria Y = X2 se distribuye según una .

24
Demostración:

La función de distribución de la variable aleatoria Y en el punto x, para x>0, será:

en donde Fx es la función de distribución de la variable aleatoria X, N(0,1).

Derivando la expresión de la función de distribución, tendremos la función de


densidad; en efecto:

que, como vemos, es la función de densidad de una .

Proposición:

Si X1, ..., Xn son n variables aleatorias independientes y distribuidas según una


N(0,1), entonces la variable aleatoria:

Y = X21 + ... + X2n

sigue una distribución:

La demostración de la presente proposición resulta inmediata, pues basta con


tener en cuenta una proposición anteriormente expuesta y la propiedad
.reproductiva de la distribución gamma respecto al parámetro

,a) se le conoce también( es entero, a la distribución Cuando el parámetro


con el nombre de distribución de Erlang, a la cual nos hemos referido en el
capítulo 8 de nuestro libro, y entonces se relaciona con la distribución de Poisson,
de manera que si el número de sucesos aleatorios e independientes que ocurren
en un intervalo de tiempo es una variable aleatoria de Poisson de parámetro a (es
decir con media de ocurrencia constante a), entonces la variable -ésimo suceso de
Poisson, sigueque representa el tiempo, hasta que ocurra el ,a).(una
distribución

El ejemplo práctico que se plantea en el siguiente anexo de este libro, por lo que
se refiere a la distribución de los cocientes intelectuales de los diferentes
individuos componentes de un colectivo de superdotados, podría (3,1) o similar, si
sepresentar una distribución de probabilidad del tipo observa la anterior figura A-
1.17.

Estadístico de prueba: En un estudio para comparar los pesos promedio de


niños y niñas de sexto grado en una escuela primaria se usará una muestra
aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para niños como para
niñas los pesos siguen una distribución normal. El promedio de los pesos de todos
los niños de sexto grado de esa escuela es de 100 libras y su desviación estándar
es de 14.142, mientras que el promedio de los pesos de todas las niñas del sexto
grado de esa escuela es de 85 libras y su desviación estándar es de 12.247 libras.

25
Si representa el promedio de los pesos de 20 niños y es el promedio de los
pesos de una muestra de 25 niñas, encuentre la probabilidad de que el promedio
de los pesos de los 20 niños sea al menos 20 libras más grande que el de las 25
niñas.

Solución:

Datos:

1= 100 libras

2 = 85 libras

1= 14.142 libras

2= 12.247 libras

n1 = 20 niños

n2 = 25 niñas

=?

Por lo tanto, la probabilidad


de que el promedio de los pesos de la muestra de niños sea al menos 20 libras
más grande que el de la muestra de las niñas es 0.1056.

26
Bibliografía.
http://apaeevml.blogspot.mx/2008/05/area-bajo-la-curva.html?m=1

http://cidecame.uaeh.edu.mx/lcc/mapa/PROYECTO/libro19/51normal_y_normal_e
stnd ar.html

http://www.itchihuahua.edu.mx/academic/industrial/sabaticorita/_private/002APRO
XIMACION%20%20DE%20%20LA%20%20NORMAL%20%20A%20%20LA%20%
20BINOMIAL.htm

http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap03.html

https://www.uv.es/ceaces/tex1t/3%20infemues/t%20muestreo.htm

Leer más: http://www.monografias.com/trabajos91/prueba-hipotesis-medias-


excel-y-winstats/prueba-hipotesis-medias-excel-y-
winstats.shtml#ixzz4ruF4JHv4

Leer más: http://www.monografias.com/trabajos94/distribucion-


muestral/distribucion-muestral.shtml#ixzz4ruBoaMZV

http://www.vitutor.com/estadistica/inferencia/intervalos.html
https://es.m.wikibooks.org/wiki/Tablas_estadísticas/Distribución_normal

https://www.gestiopolis.com/que-es-la-distribucion-normal/

. https://definicion.de/curva-normal/ Área bajo la curva normal

https://diccionarioactual.com/estandarizacion/

27