Вы находитесь на странице: 1из 23

SEMANA 5

Estadística Aplicada

Todos los derechos de autor son de la exclusiva propiedad de UNIACC o de los otorgantes de sus licencias. No está permitido
copiar, reproducir, reeditar, descargar, publicar, emitir, difundir, poner a disposición del público ni utilizar los contenidos
para fines comerciales de ninguna clase.
Lea esto primero. UNIACC, semana 5

UNIVERSIDAD DE LAS COMUNICACIONES 1


Lea esto primero. UNIACC, semana 5

Modelos probabilísticos: Teoría y


aplicaciones.

Introducción

El conocimiento de la estadística ha dejado de manifiesto que, gracias al


desarrollo matemático, es posible obtener modelos probabilísticos que permiten a
través de una ecuación, que cumple requisitos básicos, generalizar el cálculo de
probabilidades, adecuándolo a problemas de la vida diaria, es así como cerca del
año 1665, el matemático y científico Jakob Bernuolli, presenta el primer modelo
matemático que intenta resolver un problema probabilístico, a partir de dicho
momento comienza el desarrollo de una gran cantidad de distribuciones que sirven
para modelar diferentes problemas de la vida diaria.

En este documento, se verán algunas de dichas distribuciones, las que por su


alcance son de alto impacto en el día a día.

UNIVERSIDAD DE LAS COMUNICACIONES 2


Lea esto primero. UNIACC, semana 5

I. Variables Discretas

a.- Distribución de Bernoulli

En reiteradas ocasiones del día las personas toman decisiones en que la


respuesta es dicotómica, es decir, tiene solo dos alternativas, llámense éxito o
fracaso. Es así como un teólogo matemático llamado Jakob Bernoulli (1672)
postuló la distribución dicotómica y que posteriormente se llamó distribución de
Bernoulli, que es la distribución base de probabilidad discreta; de ella nacen
muchas otras distribuciones, que miden el éxito en un único experimento con dos
posibles resultados y que asume el valor 1 para la probabilidad de éxito p y valor 0
para la probabilidad de fracaso (1- p), a esta última también se le conoce por q.
Así la función de probabilidad o función de cuantía está dada por:

𝑝 𝑠𝑖 𝑥 = 1
𝑓(𝑥, 𝑝) = {𝑞 𝑜 (1 − 𝑝) 𝑠𝑖 𝑥 = 0
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Entonces se está en condiciones de comprobar:

𝐸(𝑋) = 𝑝; 𝑉(𝑋) = 𝑝 ∗ 𝑞

UNIVERSIDAD DE LAS COMUNICACIONES 3


Lea esto primero. UNIACC, semana 5

b.- Distribución binomial

La distribución binomial es una generalización de la distribución de Bernoulli, es


decir un experimento que se repite en reiteradas ocasiones (se repite exactamente
n veces), tiene las siguientes propiedades:

1. Consiste en un número fijo, n, de pruebas idénticas o repeticiones.


2. Cada prueba resulta en uno de dos resultados: éxito, E, o fracaso, F.
3. La probabilidad de éxito en una prueba es igual a algún valor p y es el
mismo en cada una de las pruebas. La probabilidad de fracaso, del mismo
modo es igual a q = (1 – p) en todas las pruebas.
4. Las pruebas son independientes.
5. La variable aleatoria de interés es X, el número de éxitos observado
durante los n ensayos.

Entonces, la función de cuantía de la variable aleatoria X, está dada por:

𝑛 𝑥 𝑛−𝑥
𝑃(𝑋 = 𝑥) = { 𝑥 ) 𝑝 (1 − 𝑝)
( 𝑠𝑖 𝑥 = 1, 2, 3, … , 𝑛
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

𝑛 𝑛!
𝑅𝑒𝑐𝑜𝑟𝑑𝑎𝑟 𝑞𝑢𝑒: ( ) =
𝑥 (𝑛 − 𝑥)! ∗ 𝑥!

La notación de la distribución es:

𝑋~𝐵(𝑛; 𝑝)

Y se lee; X se distribuye binomial con parámetros n y p.

El Entonces, igual que en el caso anterior, se podrá comprobar que:

𝐸(𝑋) = 𝑛𝑝; 𝑉(𝑋) = 𝑛 ∗ 𝑝 ∗ 𝑞 𝑜 𝑒𝑞𝑢𝑖𝑣𝑎𝑙𝑒𝑛𝑡𝑒𝑚𝑒𝑛𝑡𝑒 𝑛 ∗ 𝑝 ∗ (1 − 𝑝)

UNIVERSIDAD DE LAS COMUNICACIONES 4


Lea esto primero. UNIACC, semana 5

Ejemplo:
Si un estudiante que no se preparó para dar un examen que consta de 8
preguntas de verdadero y falso, y lo responde al azar:

1.- ¿Cuál es la probabilidad de que acierte 4?


2.- ¿Cuál es la probabilidad de que acierte dos o menos?
3.- ¿Cuál es la probabilidad de que acierte cinco o más?
4.- ¿Cuánto valen la media y la varianza del número de preguntas acertadas?

La distribución del número de aciertos será una distribución binomial, se repite el


experimento 8 veces, luego los parámetros son n = 8 y p = 1/2, (tiene que
responder una de entre los casos totales que son dos) en consecuencia, las
respuestas son:

1.- La probabilidad de que el alumno acierte a 4 respuestas está dado por:


8 70
𝑃(𝑋 = 4) = ( ) 0,54 0,54 = = 0,273
4 256

Es decir, la probabilidad de acertar 4 respuestas correctas de las 8 es 27,3%.

2.- Que acierte a dos o menos es equivalente a que acierte a cero, o acierte 1, o
acierte 2, matemáticamente es:

P(X≤2): P(X=0) + P(X=1) + P(X=2)

8
𝑃(𝑋 = 0) = ( ) 0,50 0,58 = 0,0039
0
8
𝑃(𝑋 = 1) = ( ) 0,51 0,57 = 0,0313
1
8
𝑃(𝑋 = 2) = ( ) 0,52 0,56 = 0,1094
2

P(X≤2): P(X=0)+P(X=1)+P(X=2)=0,0039+0,0313+0,1094=0,1445

UNIVERSIDAD DE LAS COMUNICACIONES 5


Lea esto primero. UNIACC, semana 5

Es decir, la probabilidad que el alumno acierte a 2 o menos respuestas correctas


es equivalente a decir a lo más dos respuestas correctas y equivale al 14,45%.

3.- La probabilidad que acierte 5 o más es lo mismo que decir que acierte a 5, o
que acierte a 6, o que acierte a 7, o que acierte a 8, y es equivalente a que diga: 1
menos la probabilidad que sea menor o igual a 4.

Esto es: P(X≥5) = 1-P(X<5) = 1-P(X≤4)

Consideraciones que se deben contemplar antes de continuar con los cálculos:


1.- El valor 5 nunca lo va a “tocar”, ya que es menor absoluto.
2.- Es mucho más sencillo calcular P(X<x) a calcular P(X>x), ya que es normal
que la cantidad de repeticiones del experimento, es decir, n sea más alto, además
que las probabilidades de la distribución binomial se encuentran tabuladas en
muchas y es normal encontrar la acumulada, es decir P(X<x).

Retomando:
P(X≥5) = 1-P(X≤4) =1-(P(X=0) + P(X=1) + P(X=2) + P(X=3) + P(X=4))

Excel, ver figura 1, también proporciona el cálculo de la probabilidad, mediante la


función DISTR.BINOM(x;n;p;VERDADERO), donde x cantidad de éxitos, n número
de ensayos y p la probabilidad de éxito, además el verdadero indica si el cálculo a
entregar es acumulado o es el puntual, es decir en este ejemplo se estaría
preguntando por P(X≤4) si se hubiese dejado la sentencia con falso, entregaría
como resultado P(X=4). En este caso, la respuesta es P(X≥5)=1-P(X≤4)=1-
0,6367= 0,3633.

UNIVERSIDAD DE LAS COMUNICACIONES 6


Lea esto primero. UNIACC, semana 5

Fig. 1. DISTR.BINOM(x;n;p; VERDADERO)


Fuente: material elaborado para la asignatura.

4.- Respecto de la media y la varianza, simplemente se aplica la fórmula:


𝐸(𝑋) = 𝑛𝑝; 𝑉(𝑋) = 𝑛 ∗ 𝑝 ∗ (1 − 𝑝)

𝐸(𝑋) = 𝑛𝑝 = 8 ∗ 0,5 = 4; 𝑉(𝑋) = 𝑛 ∗ 𝑝 ∗ (1 − 𝑝) = 8 ∗ 0,5 ∗ 0,5 = 2

c.- Distribución de Poisson:

La distribución de Poisson planteada por Siméon Poisson (1838) se emplea para


describir procesos independientes, es decir, que no tienen memoria, y que ocurren
en un intervalo determinado, el que puede ser un intervalo de tiempo, minutos,
horas, días, meses, etc., o de un lugar determinado de espacio. Es importante
aclarar que la unidad de medición es continua (tiempo, área, volumen), pero la
variable aleatoria es discreta (número de accidentes, número de llamadas).

Algunas aplicaciones son:

1.- Número de fallas en un sistema informático en un día.

UNIVERSIDAD DE LAS COMUNICACIONES 7


Lea esto primero. UNIACC, semana 5

2.- Número de camiones que llega a una bodega en una hora.

3.- Número de abolladuras de una lámina para fabricar filtros.

4.- Llamadas recibidas en un día en un centro de llamados.

La función de probabilidad está dada por:

𝑒 −𝜆 ∗ 𝜆𝑥
𝑃(𝑋 = 𝑥) = { 𝑥! 𝑝𝑎𝑟𝑎 𝑥 = 0, 1, 2, 3, … .
0 𝑒𝑛 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Se lee 𝑋~𝑃(𝜆) es decir:

“X se distribuye Poisson con parámetro (λ) Lamda”

Donde

e equivale a 2,71828 (número e, es la base de logaritmo natural).

𝜆 𝑛ú𝑚𝑒𝑟𝑜 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠 𝑝𝑜𝑟 𝑢𝑛𝑖𝑑𝑎𝑑 𝑑𝑒 𝑡𝑖𝑒𝑚𝑝𝑜 𝑜 𝑒𝑠𝑝𝑎𝑐𝑖𝑜

P(X=x): probabilidad de x éxitos en un tiempo determinado o espacio dado λ.

Entonces, igual que en el caso anterior, se podrá comprobar que:

𝐸(𝑋) = 𝜆; 𝑉(𝑋) = 𝜆

Ejemplo:

Un equipo de fútbol nacional hace un promedio de 2,5 goles por partido. ¿Cuál es
la probabilidad de que haga?:

1.- 4 goles en un partido.


2.- Ningún gol.
3.- Por lo menos 2.

UNIVERSIDAD DE LAS COMUNICACIONES 8


Lea esto primero. UNIACC, semana 5

Se considera entonces:

Sea X número de goles por partido anotados por un equipo:

𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛 (𝜆 = 2,5)

Se obtiene, por lo tanto:

1.
𝑒 −2,5 ∗ 2,54
𝑃(𝑋 = 4) = = 0,1336
4!

La probabilidad de que el equipo de fútbol convierta 4 goles en un partido es


13,36%.

2.
𝑒 −2,5 ∗ 2,50
𝑃(𝑋 = 0) = = 0,082
0!

La probabilidad de que el equipo de fútbol no convierta goles en un partido es


8,21%.

Es importante destacar, además, que Excel también calcula estas probabilidades,


así lo demuestra la figura 2 sobre la tercera pregunta, cuyo resultado es 75,8%

UNIVERSIDAD DE LAS COMUNICACIONES 9


Lea esto primero. UNIACC, semana 5

Fig. 2. DISTR.BINOM(x;n;p;VERDADERO)
Fuente: material elaborado para la asignatura.

d.- Aproximación de binomial a Poisson

Si se analiza con detenimiento la distribución de Poisson, este corresponde a un


caso particular de distribución binomial, particularmente a una distribución binomial
cuyo valor p tiende a 0 (cero) y n tiene de infinito. Y cada experimento es
independiente uno del otro.
Por lo tanto, la distribución de Poisson se puede utilizar como una aproximación a
una distribución binomial cuando n es grande y al mismo tiempo la probabilidad p
es pequeña. Como norma general resulta n * p, que es la esperanza en una
distribución binomial, equivalente a λ y, a su vez, el resultado sea inferior a 7 (la

UNIVERSIDAD DE LAS COMUNICACIONES 10


Lea esto primero. UNIACC, semana 5

mayoría de los autores coinciden con dicho valor, siete, sin embargo, basta con
que n sea lo suficientemente grande y p muy pero muy pequeño).

Ejemplo:

De acuerdo al panorama mundial los expertos piensan que el 3,5% de todas las
pequeñas y medianas empresas quebrará el próximo año. Suponiendo que esta
proyección es correcta, estime la probabilidad de que tres compañías quiebren el
próximo año en una muestra de 100 empresas.

Se considera entonces:
Sea X número de empresas que quiebran,
𝑋~𝐵(100; 0,035)
Al multiplicar n*p resulta 100*0,035= 3,5.

Si se quisiera desarrollar a través de una distribución binomial y calcular por


ejemplo P(X=3) sería:
100
𝑃(𝑋 = 3) = ( ) 0,0353 0,96597 = 0,2188
3
Sin embargo, el cálculo de la combinatoria deja de ser trivial y muchas
calculadoras no son capaces de realizar dicho cálculo.

Aproximando se puede realizar el mismo cálculo:


P(X=3):
𝑒 −3,5 ∗ 3,53
𝑃(𝑋 = 3) = = 0,216
3!

UNIVERSIDAD DE LAS COMUNICACIONES 11


Lea esto primero. UNIACC, semana 5

II. Variables Continuas

a.- Distribución normal

La distribución continua de probabilidad más importante de la estadística es, sin


duda, la distribución normal, su gráfica que se denomina curva normal, tiene forma
de campana y describe aproximadamente muchos fenómenos que ocurren en las
industrias, investigación, naturaleza, etc.

Fig. 3. Distribución normal.


Fuente: material elaborado para la asignatura.

UNIVERSIDAD DE LAS COMUNICACIONES 12


Lea esto primero. UNIACC, semana 5

Abraham de Moivre (1733) desarrolló la gráfica de la curva normal, sin embargo,


fue Karl Friedrich Gauss (1850) quien derivo y encontró la ecuación a partir de un
estudio de errores. Por esta razón la distribución normal, a menudo también es
llamada distribución gaussiana en su honor
.
El aporte de Gauss es tan valioso que se honraba en los billetes de los marcos
alemanes (antes de los euros) como uno de los más trascendentales.

Fig. 4. Antiguo billete de 10 marcos alemán.


Fuente:http://www.delcampe.net/items?language=S&catLists%5B0%5D=10596

La función de densidad de la variable X que se distribuye normal con media µ y


varianza σ2 está dada por:
1 (𝑥−𝜇)2

𝑓(𝑥) = ∗𝑒 2𝜎2 𝑝𝑎𝑟𝑎 − ∞ < 𝑥 < ∞
√2𝜋𝜎 2

La notación de la distribución es:


𝑥~𝑁(𝜇; 𝜎 2 )
Y se lee “x se distribuye normal, con media µ y varianza σ2”

UNIVERSIDAD DE LAS COMUNICACIONES 13


Lea esto primero. UNIACC, semana 5

Algunas propiedades de la distribución normal:

1. La moda, la media y la mediana son iguales.


2. La campana de Gauss es simétrica respecto de la media.
3. En el intervalo (µ - σ ; µ + σ) se encuentra, aproximadamente, el 68,26% de
la distribución.
4. En el intervalo (µ -2𝜎 ; µ + 2𝜎) se encuentra, aproximadamente, el 95% de
la distribución.

b.- Distribución normal estándar

Calcular la probabilidad de que x este entre a y b, según la distribución normal


es equivalente a calcular:

𝑏 (𝑥−𝜇)2
1 −
𝑃(𝑎 < 𝑋 < 𝑏) = ∫ ∗𝑒 2𝜎2 𝑑𝑥
𝑎 √2𝜋𝜎 2

Como se puede apreciar este cálculo resulta ser un poco más complejo, por el
desarrollo de esta integral, afortunadamente el estudio de la distribución ha
permitido realizar un proceso llamado estandarización, en donde se plantea:

Cualquier variable X cuya distribución sea una distribución normal con media µ y
varianza σ2 (es decir,𝑥~𝑁(𝜇; 𝜎 2 )), a dicha variable se le resta su media y divide por
su desviación estándar, automáticamente se convierte en una distribución normal
con media cero y varianza 1.

UNIVERSIDAD DE LAS COMUNICACIONES 14


Lea esto primero. UNIACC, semana 5

Lo anterior se expresa como:


𝑥~𝑁(𝜇; 𝜎 2 ) 𝑠𝑖 𝑠𝑒 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑖𝑧𝑎:

𝑥−𝜇
𝑍= ~𝑁(0; 1)
𝜎

Esta distribución normal estándar se encuentra tabulada en muchos libros y Excel


permite además el rápido cálculo de las probabilidades.

Ejemplo:

El consumo de electricidad en los hogares de una ciudad es una variable aleatoria


cuyo consumo medio mensual es de 85 kW con una varianza de 81.
Se debe hallar la probabilidad de que una familia consuma menos de 75 kW y
cuánta electricidad consume el 75% de la población.

Qué se sabe:

X: consumo de electricidad en los hogares de una ciudad; 𝑥~𝑁(85; 81)

Se debe calcular:

(65−85)2
65 1
P(X<75)= ∫−∞ ∗ 𝑒− 2∗81 𝑑𝑥
√2𝜋81

Pero si se aplica el proceso de estandarización:

𝑥 − 85
~𝑁(0; 1)
9

𝑥−µ 75−85
𝑃(𝑥 < 75) 𝑎𝑙 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑖𝑧𝑎𝑟 𝑞𝑢𝑒𝑑𝑎: 𝑃 ( 𝜎
< 9
) =P(Z<-1,11)

UNIVERSIDAD DE LAS COMUNICACIONES 15


Lea esto primero. UNIACC, semana 5

Para encontrar el resultado de esa probabilidad se puede utilizar Excel, con la


función (que depende de la versión de Excel) distribución normal estándar:

Es decir, el 13,3% de la población consume menos del 65 kw por mes.

En la pregunta cuánta electricidad consume el 75% de la población, se consulta al


revés es decir P(X<?) = 0,75, y se resuelve:

𝑥 − µ 𝑥 − 85
𝑃( < ) = 0,75
𝜎 9

(Recuerde que se estandariza la variable).

Desde Excel se obtiene la inversa:

UNIVERSIDAD DE LAS COMUNICACIONES 16


Lea esto primero. UNIACC, semana 5

𝑥−85
Por lo que se puede resolver que = 0,6745 en consecuencia la respuesta es
9

que el 75% de la población consume menos de 91 kW.

c.- Teorema central del límite

Este es un teorema fundamental de estadística y dice que si se tiene un grupo


numeroso de variables independientes y todas ellas siguen el mismo modelo de
distribución (cualquiera que este sea), la suma de ellas se distribuye
aproximadamente según una distribución normal.

La importancia práctica del teorema central del límite es que la función de


distribución de la normal puede usarse como aproximación de algunas otras
funciones de distribución.

Si: 𝑋~𝐵(𝑛; 𝑝) con p no demasiado cerca de los extremos 𝑥~𝑁(𝑛𝑝; 𝑛𝑝(1 − 𝑝))

UNIVERSIDAD DE LAS COMUNICACIONES 17


Lea esto primero. UNIACC, semana 5

Si: 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛 (𝜆), entonces 𝑥~𝑁(𝜆; 𝜆)

d.- Otras distribuciones

En el desarrollo de la estadística inferencial que tiene como piedra angular la


distribución normal, en muchas ocasiones, es necesario hacer algunas
transformaciones a las variables, producto por ejemplo de desconocer algún
parámetro de la distribución normal como la varianza, lo que implica que la
variable deje de tener un comportamiento que se acerca a la distribución normal y
para poder adaptarla de mejor manera a la verdadera distribución de la población,
es que , como producto de estas transformaciones, nacen distribuciones como la
χ2 (Chi-cuadrado), distribución t de Student o distribución F,

Conclusión

En las clases de las semanas 2 y 3 se establecieron los principios básicos de


probabilidades, luego en la semana 4 se aplicaron dichos conceptos para definir
variables aleatorias y distribuciones de probabilidad. En esta semana se
examinaron algunas de las distribuciones más importantes tanto para variables de
tipo discreta como continua, que han demostrado empíricamente ser modelos que
se aplican a diferentes problemas prácticos, como son el número de artículos
defectuoso en una planta de producción o la llegada de camiones en un proceso
de logística y distribución, o la estimación del precio de las acciones. En medicina,
por ejemplo, cuando se estudia el crecimiento de los bebés desde su primer día de
nacimiento se van comparando y revisando si hay un crecimiento y/o desarrollo
correcto, estas tablas son aplicaciones de la distribución normal, etc. Finalmente,
el correcto uso de las distribuciones solo depende del ingenio del investigador, es
decir: Ud.

UNIVERSIDAD DE LAS COMUNICACIONES 18


Lea esto primero. UNIACC, semana 5

UNIVERSIDAD DE LAS COMUNICACIONES 19


Lea esto primero. UNIACC, semana 5

Referencias Bibliográficas

Wackerly, D. D.; Mendenhall, W. y Scheaffer, R. L. (2010). Estadística

matemática con aplicaciones. 7.ª edición. México: Cengage Learning.

Walpole, R.; Myers, R.; Myers, S. y Ye K. (2007). Probabilidad y estadística para

ingeniería y ciencias. 8ª edición. México: Pearson Educación.

Si usted desea referenciar este documento, considere:

UNIACC (2016). Modelos probabilísticos: teoría y aplicaciones. Estadística

aplicada. Lea esto primero (Semana 5).

UNIVERSIDAD DE LAS COMUNICACIONES 20


Lea esto primero. UNIACC, semana 5

UNIVERSIDAD DE LAS COMUNICACIONES 21


Lea esto primero. UNIACC, semana 5

Todos los derechos de autor son de la exclusiva propiedad de UNIACC o de los otorgantes de sus licencias. No está permitido
UNIVERSIDAD
copiar, reproducir, reeditar, descargar, publicar, DE LAS
emitir, COMUNICACIONES
difundir, poner a disposición del público ni utilizar los contenidos 22
para fines comerciales de ninguna clase.

Вам также может понравиться