Вы находитесь на странице: 1из 16

Estadística II

David Giuliodori

Universidad Nacional de Córdoba


Funciones de Probabilidad en Excel

En Excel se pueden calcular probabilidades de las distintas distribuciones derivadas


de la normal y también de la distribución normal estándar.

Funcion (Distribución Normal Estándar)

DISTR.NORM.ESTAND(Z)

Este comando devuelve el área acumulada a izquierda de una distribución normal


estádar, es decir:

1 −z 2
f (z) = √ e 2 (1)

Funciones de Probabilidad en Excel

Si estamos interesados en calcular el valor de z para una cierta probabilidad


acumulada, el comando es:

Funcion (Distribución Normal Estándar Inversa)

DISTR.NORM.ESTAND.INV(p)

Este comando devuelve el valor de z para la probabilidad acumulada a izquierda p


que el usuario define.
Funciones de Probabilidad en Excel

Funcion (Distribución t-Student)

DISTR.T.CD(x;gl)
DISTR.T.N(x;gl)

Este comando devuelve el área acumulada a derecha (CD) o a izquierda (N) de


una distribución t-Student para un valor x dado.

Funcion (Distribución χ2 )

DISTR.CHICUAD.CD(x;gl)
DISTR.CHICUAD(x;gl)

Este comando devuelve el área acumulada a derecha (CD) o a izquierda de una


distribución χ2 para un valor x dado.
Funciones de Probabilidad en Excel

Funcion (Distribución F)

DISTR.F.CD(x;gl1 ;gl2 )
DISTR.F.N(x;gl1 ;gl2 )

Este comando devuelve el área acumulada a derecha (CD) o a izquierda (N) de


una distribución F para un valor x dado.
Intervalos de Confianza

Cuando uno quiere hacer inferencia sobre algún parámetro poblacional construye
un estimador que sea el adecuado para inferir el valor de dicho parámetro. Sin
embargo, esta estimación puntual del parámetro no da ningún tipo de información
acerca del posible grado de “error” que podemos estar cometiendo.

Definición (Estimación por Intervalos)


Una estimación de intervalo describe un intervalo de valores dentro del cual es
posible que esté el parámetro poblacional que se desea averiguar.

Como dijimos anteriormente, primero se empieza con la estimación puntual del


parámetro poblacional, luego se busca el error probable de esa estimación y por
último se calcula la probabilidad de que el intervalo contenga dicho parámetro.

En estadística, la probabilidad que asociamos con una estimación de intervalo se


conoce como el nivel de confianza y se lo suele denotar como (1 − α). Esta
probabilidad, entonces, indica qué tanta confianza tenemos de que la estimación
del intervalo incluya al parámetro de la población.
Intervalos para la Media
Intervalos para una muestra

Se distinguirán dos situaciones. Por un lado, cuando conocemos el valor de la


varianza poblacional y, por el otro, cuando ese valor es desconocido.

Varianza conocida

Sea una variable aleatoria X con media µ y varianza σ 2 , entonces por el Teorema
Central del Límite, cuando n es grande, tenemos que X se distribuye:

X ∼ N(µ, σ 2 /n)
X −µ
√ ∼ N(0, 1) (2)
σ/ n
Intervalos para la Media

Problema
Una empresa que vende agroquímicos para los cultivos, quiere saber la cantidad
mensual que vende de agroquimímico específico para el cultivo de soja, en
promedio, por cliente. Toma una muestra al azar de 50 clientes y encuentra que,
en promedio vendió 15 dosis. Si sabe por estudios anteriores que la población se
distribuye aproximadamente normal con una desviación estándar de 3 dosis, se
pide encontrar:
Un intervalo de confianza del 95 % para la media de la venta mensual de
dicho agroquímico
Si luego se conociera que la media poblacional es de 14 litros, ¿qué pudo
haber pasado?
Un intervalo de confianza del 99 %. Explicar la diferencia con el obtenido en
el primer punto
Intervalos para la Media

Para calcular intervalos de confianza para la media, y debido a que se trata de una
población aproximadamente normal (en este caso, si no se cumpliese el supuesto
de poblaciones normales, el tamaño de muestra es mayor a 30, por lo que también
sería válido el estadístico aplicado en la estimación), entonces podemos afirmar
que:

P(Zα/2 ≤ Z ≤ Z1−α/2 ) = 1−α (3)

Reemplazando Z por el estadístico 2, tenemos:

 
X −µ
P Zα/2 ≤ √ ≤ Z1−α/2 = 1−α (4)
σ/ n
Intervalos para la Media

Ahora, despejando de la ecuación anterior µ, podemos llegar a:

 
σ σ
P Zα/2 √ ≤ X − µ ≤ Z1−α/2 √ = 1−α
n n
 
σ σ
P − X + Zα/2 √ ≤ −µ ≤ −X + Z1−α/2 √ = 1−α
n n
 
σ σ
P X − Z1−α/2 √ ≤ µ ≤ X − Zα/2 √ = 1−α (5)
n n

La expresión anterior nos determina el intervalo de confianza para la media. Con


lo cual se puede afirmar que existe una probabilidad de 1 − α que el intervalo de
confianza contenga a la media poblacional.
Intervalos para la Media

Ahora bien, teniendo en cuenta que nos piden un intervalo de confianza del 95 %,
podemos escribir:

3 3
15,03 − 1,96 √ ≤ µ ≤ 15,03 − (−1,96) √
50 50
14,19 ≤ µ ≤ 15,86 (6)

Como conclusión podemos decir que el 95 % de las posibles muestras aleatorias de


tamaño n (en este caso 50), tendrán una media dentro de ese intervalo de
confianza.
Ahora bien, si luego se conoce que la media población es 14 dosis, pueden haber
sucedido básicamente dos cosas, o bien tuvimos “mala suerte” y sacamos una
muestra aleatoria (que tiene sólo el 5 % de probabilidad de presentarse), cuya
media cae fuera del intervalo, o bien tuvimos un problema de muestreo, como
podría ser que la selección no haya sido aleatoria, que la medición de los litros de
nafta no fue correctamente realizada, etc.
Intervalos para la Media
Gráficamente hubiese sido:

Se puede observar claramente que el intervalo de confianza no incluye al verdadero


valor del parámetro poblacional.
Intervalos para la Media

Si consideramos una confianza del 99 %, el intervalo es:

3 3
15,03 − 2,58 √ ≤ µ ≤ 15,03 − (−2,58) √
50 50
13,93 ≤ µ ≤ 16,12 (7)

Como podemos ver, el intervalo de confianza es más amplio que el anterior, es


decir perdemos precisión para poder tener mayor confianza. En este último caso, si
la media poblacional hubiese sido igual a 14, entonces el intervalo hubiese
contenido al valor del parámetro poblacional a un nivel de confianza del 99 %.
Sólo es posible aumentar la precisión y el nivel de confianza simultáneamente
tomando una muestra de mayor tamaño.
Intervalos para la Media

Para programar en Python es recomendable instalar Anaconda, que es un


distribución libre y abierta. Anaconda incluye distintas aplicaciones en las cuales se
pueden ejecutar los códigos, tales como Jupyter Notebook o Spyder. Por otra
parte, también se puede utilizar Google Colab que es una versión on-line de
Jupyter Notebook y en la que se pueden correr procesos de varias horas de
duración haciendo uso de máquinas virtuales.
Para calcular el intervalo de confianza con Python podemos usar el siguiente
código:
# Librerias
i m p o r t numpy a s np
from s c i p y import s t a t s
f r o m s c i p y . s t a t s i m p o r t norm
from statsmodels . s t a t s import weightstats as stests
import s t a t i s t i c s
from s t a t i s t i c s import stdev

# N i v e l de c o n f i a n z a
n i v e l _ c o n f =0.95
# Varianza poblacional
v a r =3∗∗2
# Datos m u e s t r a l e s
data =[13.68 ,13.57 ,10.26 ,12.4 ,16.99 ,13.98 ,16.13 ,19.23 ,17.76 ,16.1 ,
16.79 ,11.54 ,17.62 ,14.17 ,17.02 ,13.12 ,13.97 ,16.69 ,13.62 ,15.58 ,
12.4 ,14.92 ,16.74 ,15.39 ,13.42 ,15.67 ,15.25 ,15.35 ,15.35 ,14.52 ,
15.42 ,16.47 ,12.91 ,16.17 ,13.65 ,14.67 ,13.94 ,15.03 ,16.01 ,15.75 ,
16.28 ,16.22 ,15.77 ,13.95 ,16.24 ,14.63 ,12.36 ,15.08 ,17.19 ,14.52]

def i c ( data , var , n i v e l _ c o n f ) :


n = l e n ( data )
z = norm . p p f ( n i v e l _ c o n f +(1− n i v e l _ c o n f ) / 2 )
data_mean = np . mean ( d a t a )
d a t a _ s d = s t d e v ( d a t a , data_mean )
s i g m a=np . s q r t ( v a r )
l i m _ i n f=data_mean−z ∗ s i g m a / n ∗ ∗ 0 . 5
l i m _ s u p=data_mean+z ∗ s i g m a / n ∗ ∗ 0 . 5
r e t u r n l i m _ i n f , l i m _ s u p , z , data_mean , data_sd , n
l i m _ i n f , l i m _ s u p , z , data_mean , data_sd , n = i c ( d a t a , v a r , n i v e l _ c o n f )
p r i n t ( " Media ␣ M u e s t r a l ␣=" , data_mean )
p r i n t ( "S␣ M u e s t r a l ␣=" , d a t a _ s d )
p r i n t ( " n ␣ m u e s t r a l ␣=" , n )
p r i n t ( " z ␣=" , z )
p r i n t ( " I n t e r v a l o ␣ de ␣ c o n f i a n z a : ␣ " , " [ " , l i m _ i n f , " ; " , l i m _ s u p , " ] " )

Media M u e s t r a l = 1 5 . 0 2 9 8
S Muestral = 1.7327063766706414
n m u e s t r a l = 50
z = 1.959963984540054
I n t e r v a l o de c o n f i a n z a : [ 14.198257705390192 ; 15.861342294609807 ]

Вам также может понравиться