Академический Документы
Профессиональный Документы
Культура Документы
Los modelos que se revisarán son aplicables unos a variables aleatorias discretas y otros a variables aleatorias
continuas.
Considérese una serie de eventos o ensayos que poseen las siguientes propiedades:
El resultado de cada ensayo puede clasificarse como “E” éxito o “F” fracaso.
La probabilidad de éxito es p y la de fracaso es q=1-p. Ambas pertenecen constantes en cada ensayo.
Cada ensayo es independiente de los demás.
El experimento se realiza un número determinado de veces, por ejemplo n
La variable aleatoria X es igual al número de éxitos en los n ensayos.
Suponga que se realizan n ensayos y que dan lugar a una sucesión de x éxitos y n-x fracasos.
Puesto que los ensayos son independientes la probabilidad de ese resultado será igual al producto de la
probabilidad de éxito o fracaso de cada ensayo
De acuerdo a la definición de la variable aleatoria, no es relevante el orden de éxitos y fracasos, por lo tanto, hay
muchas formas en las que es posible obtener x éxitos y n-x fracasos. El total de formas estará dado por las
permutaciones de los x éxitos y n-x fracasos, como elementos indistinguibles dentro de su clase.
El valor esperado E(X) de una v.a. que se distribuye Binomial es igual al producto de sus parámetros np, resultado
que se verifica a continuación:
15
De modo que la probabilidad de x éxitos en los n ensayos en todos los órdenes posibles se obtiene como el
producto:
Los parámetros que particularizan al modelo son n y p. Se puede verificar fácilmente que esta expresión es
función de probabilidad, ya que P(X=x)≥0 para toda x y por otro lado P X x 1 , como se demuestra
x
inmediatamente
La función de probabilidad para una n dada varía su comportamiento de acuerdo a los valores del parámetro p.
En la tabla y gráficas siguientes se puede apreciar que para n=8 y p=0.5 la función de probabilidad es simétrica,
pero para un valor de p=0.2 presenta asimetría positiva. En forma análoga se observa asimetría negativa para
n=8 y p=0.8
16
Ejemplo 1
Un examen consta de 10 preguntas de opción múltiple, cada pregunta consta de 5 reactivos de los cuales sólo
uno es correcto. Si un estudiante contesta al azar las 10 preguntas ¿Cuál es la probabilidad de que obtenga 3 ó
más aciertos?
Consideré: n=10 y p=0.20
Ejemplo 2
En una fábrica de artículos electrónicos se sabe que el 5% de los componentes de cierto tipo presentan falla.
¿Cuál es la probabilidad de que en una caja con 12 componentes ninguno falle?
Se consideran n=12 y p=0.05
deseada se obtiene:
n<k
17
y su varianza
Las verificaciones de estos resultados resultan demasiado engorrosas y por ello son omitidas. Mayores detalles
se pueden encontrar en N. Johnson y S. Kotz (“Distributions in Statistics. Discrete distributions”).
Ejemplo
Se han desprendido las etiquetas de 10 latas de jugo, todas del mismo tamaño. Se sabe que 5 son de tomate y
5 de piña. Si se eligen al azar 4 latas ¿cuál es la probabilidad de que 3 sean de tomate?
N=10
n=4
k=5
En 1898 Bortkiewicz realizó un curioso estudio con el modelo de Poisson, pues lo utilizó para ajustar la distribución
de soldados de la armada prusiana muertos por patadas de mulas. En nuestro siglo (1910) los notables físicos E.
Rutherford y H. Geiger aplicaron el modelo en la emisión de partículas radioactivas emitidas en intervalos fijos de
tiempo.
Las aplicaciones del modelo Poisson se han diversificado y encontramos ejemplos en Ecología cuantitativa, teoría
de colas, artillería, operación portuaria, etc.
El parámetro que caracteriza a la función es ʎ y tiene la particularidad de que tanto su valor esperado, como su
varianza son iguales al parámetro, esto es E(X)=V(X)= ʎ
18
La varianza V(X)=ʎ se verifica en forma similar al obtener E(X2).
Los supuestos fundamentales requeridos en la aplicación del modelo de Poisson son los siguientes:
Los sucesos que ocurren en un intervalo de tiempo o región del espacio son independientes de los que
ocurren en cualquier otro intervalo o región, independientemente de cómo se elija el intervalo.
La probabilidad de que un suceso se presente es proporcional a la longitud del intervalo o área de la
región.
La probabilidad de que dos o más sucesos ocurran en la misma posición del intervalo o posición en el
espacio es tan pequeños que puede despreciarse.
Se mencionó que Simeon Poisson propuso su modelo como una aproximación de la binomial para el caso en que
n es grande y p es pequeña. A continuación se ilustra esta aproximación en la tabla y gráfica de la función de
probabilidad de una binomial con parámetros n=80 y p=0.02 comparada con una Poisson con parámetro ʎ=1.6.
El valor de ʎ se obtiene como producto de n y p pues tanto el producto, como ʎ coinciden con el valor esperado
de sus funciones de distribución.
A medida que el valor del parámetro ʎ incrementa su valor, la función de probabilidad se desvía a la derecha. Las
tablas y gráficas siguientes ilustran esa propiedad.
19
Ejemplo:
Una compañía de seguros de automóviles ha encontrado, a partir de sus estadísticas de robo, que la probabilidad
de que deba pagar una póliza es 0.003. ¿Cuál es la probabilidad de que tenga que pagar 5 o más siniestros si
tiene 2000 pólizas?
20
Consideramos ʎ como el producto de la probabilidad p por el número de pólizas n, ya que ese producto coincide
con el valor esperado de una Binomial E(X)=np.
np
2000(0.003)
6
Como se trata de una variable continua, su valor esperado E(X) se obtiene con la integral en todo el rango para
el cual la función de densidad es positiva:
21
Para obtener su varianza utilizamos la expresión de V(X) en términos de las esperanzas de X y de X2
Así
Ejemplo:
Se sabe que un auto sufrió una avería y quedó en un tramo de 50 km. de la carretera. ¿Cuál es la probabilidad
de que haya quedado entre el km. 30 y el km. 40?
Se requiere calcular
Estas técnicas tuvieron aplicación inicial en la caracterización de la distribución de los errores en mediciones
astronómicas. Las aplicaciones de la distribución normal en otros campos se deben en gran medida al científico
inglés Adolphe Lambert Quételet, quien la utilizó en Biometría para describir las distribuciones de diversas
medidas antropométricas como la talla del tórax de 5700 soldados escoceses cuya media fue de 40 pulgadas.
La gráfica de esta función presenta la clásica forma acampanada cuyo eje de simetría pasa por su media μ
(parámetro de posicionamiento), y su amplitud depende del parámetro que mide su varianza σ2
22
En esta gráfica se puede observar el
comportamiento de la función para un valor
constante de μ=0 y tres valores de σ2 = 0.5, 1
y 2.
Mediante un sencillo cambio de variable cualquier distribución normal puede ser expresada como una distribución
normal estándar con media μ=0 y σ2 =1. Este procedimiento simplifica notablemente la consulta de probabilidades
en las tablas, incluidas en la mayoría de los textos de estadística.
En una normal estándar el área bajo la curva en el intervalo (-1,1), esto es una desviación estándar en cada lado
de la media, es de 68.2% y en el intervalo (-2,2) el área es de 95.4%.
Ejemplo:
Considérese ahora el uso de tablas de normal estándar para el cálculo de probabilidades. Sea Z una variable
aleatoria que se distribuye normal estándar con μ=0 y σ2 =1. Obtener las probabilidades siguientes
a) P(0≤Z≤1.4)
23
b) P(-1.2≤Z≤1.62)
c) P(1.31≤Z≤2.45)
d) P(Z≥1.82)
a) P(0≤Z≤1.4)
b) P(-1.2≤Z≤1.62)
es 0.3849+0.4474=0.8323
c) c) P(1.31≤Z≤2.45)
0.4929-0.4049=0.088
d) P(Z≥1.82)
0.5-0.4656=0.0344
Como se mencionó, mediante un cambio de variable conocido como estandarización, una variable aleatoria X
con media μ y varianza σ2 se puede hacer equivalente en distribución a una variable Z con media μ=0 y varianza
σ2 =1. El cambio de variable es el siguiente:
24
Ejemplo:
Suponga que la estatura de 1,200 estudiantes de una escuela se distribuye normal con media μ=1.65m y
desviación estándar σ=0.12. ¿Cuántos estudiantes se espera que tengan estatura entre 1.60 y 1.85 m?
es equivalente a
Así aproximadamente 61% de los 1,200 alumnos tienen estatura entre 1.60 y 1.85 m, esto es 732 estudiantes.
¿Cuántos estudiantes se espera tengan estatura de 1.58 o menor?
n
x
Z
n
Se distribuye normal con media 0 y varianza 1. La estadística Z se puede aplicar en la construcción de intervalos
o pruebas de hipótesis sobre μ
Esta estadística Z tiene el inconveniente de depender del parámetro , en general desconocido para el
investigador, pues sólo suele disponer de datos de la muestra de tamaño n.
Donde representa la función gama matemática. Mayores detalles de esta función se encuentran en Theory of
Probability por B. Harris; Addison Wesley.
Para el cálculo de probabilidades se utilizan tablas que fueron publicadas por primera vez por el estadístico inglés
William S. Gosset en 1908, quien firmó con el seudónimo Student lo que dio origen al nombre de la distribución.
La distribución t de Student se aproxima a la normal estándar N(0,1), a medida que se incrementa el parámetro
k de sus grados de libertad. En términos prácticos es indistinto el uso de tablas de N(0,1) y t de Student a partir
de 50 gl.
25
Ejemplos de su aplicación se tratan en pruebas de hipótesis e intervalos de confianza para la media.
Se distribuye Ji Cuadrada con 1 grado de libertad.
k
Si W1,W2,...,Wk se distribuye cada una como Ji Cuadrada con 1 grado de libertad, su suma Y Wi se
i 1
distribuye Ji cuadrada con k grados de libertad. Esto es, la Ji cuadrada es aditiva. La función de densidad asociada
a esta distribución es la siguiente:
El valor esperado de una variable aleatoria Y que se distribuya Ji Cuadrada con k grados de libertad es igual a
sus grados de libertad. E(y)=k
Por otra parte su varianza es igual a 2 veces sus grados de libertad. V(y)=2k
La función de densidad Ji Cuadrada es asimétrica y muy sensible a sus grados de libertad. En la siguiente gráfica
se puede apreciar su comportamiento para diferentes valores de sus grados de libertad.
La distribución Ji Cuadrada tiene muchas y diversas aplicaciones en Estadística, entre ellas el cálculo de pruebas
de hipótesis e intervalos de confianza sobre la varianza de poblaciones normales, tablas de contingencia, pruebas
de bondad de ajuste, estadística no paramétrica.
Ejemplo.
Suponga que un equipo electrónico cuenta con un componente cuyo tiempo de falla es una variable aleatoria
distribuida exponencial negativa con parámetro λ=1000 hrs. ¿Cuál es la probabilidad de que opere al menos 200
horas?
27