Вы находитесь на странице: 1из 126

Curso

Estadística Inferencial

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teoría básica de probabilidad

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Fundamentos
Teoría básica de probabilidad

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
La probabilidad
• Camino para cuantificar resultados que no pueden predecirse.
• Medida numérica de la posibilidad de ocurrencia de un evento/suceso.
• Su relación con la estadística:
• Apoya toma de decisiones en condiciones de incertidumbre

0 0.5 1

Improbable Tan probable como improbable Muy probable

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
El mundo del azar
• Determinación del género de un recién nacido.
• Lanzamiento de un dado.
• Preferencia de un cliente por una marca.
• Pronóstico del clima.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Fundamentos
La teoría básica de probabilidad requiere de la especificación de algunos conceptos:

Probabilidad Valor numérico que indica el grado de certeza con el que se puede
obtener un resultado.

Experimento Experimento cuyo resultado no puede predecirse. La fecundación de un


aleatorio óvulo, el lanzamiento de una moneda.

Suceso Posible resultado de un experimento aleatorio.

Espacio Conjunto de todos los resultados posibles de un experimento aleatorio.


muestral Se denota con la letra M.

Evento Resultado que es de interés para el experimentador.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Eventos y espacio muestral

Experimento Sucesos aleatorios


𝑀 = 𝑐𝑎𝑟𝑎, 𝑠𝑒𝑙𝑙𝑜
aleatorio (posibles resultados) Espacio muestral
Diagrama de árbol

Cara 𝐴 = 𝑐𝑎𝑟𝑎
Lanzamiento de Evento A: cae cara
una moneda
Sello
𝐵 = 𝑠𝑒𝑙𝑙𝑜
Evento B: cae sello

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Eventos y espacio muestral
Sucesos
Experimento aleatorios
aleatorio (posibles 𝑀 = 1,2,3,4,5,6
resultados)
Espacio muestral

1
Diagrama de árbol

2 𝐴 = 2,4,6
Evento A: cae número par
3
Lanzamiento
de un dado
4
𝐵 = 1,3,5
5
Evento B: cae número impar

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Probabilidad de un evento
Un evento 𝐸 puede ocurrir en ℎ de 𝑁 maneras posibles, así la probabilidad de que ocurra 𝐸 (a lo que
se le llama éxito) se denota como:


𝑝=𝑃 𝐸 =
𝑁
La probabilidad de que no ocurra el evento 𝐸 (a lo que se denomina fracaso) estará dada por:


𝑞 =1−𝑝 =1−𝑃 𝐸 =1−
𝑁

La negación del evento 𝐸 se denota como 𝐸.


ത Así: 𝑞 = 𝑃(𝐸)

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Definiciones de probabilidad
Existen tres formas de definir la probabilidad:
1. Clásica:
• Definida como el número de formas en que se presenta un evento sobre el total de las posibilidades.
• 𝑃 𝐸 = ℎΤ𝑁.
2. Como frecuencia relativa:
• Cuando el experimento se repite indefinidamente.
• Cuando se aplican encuestas.
• Registros de 1000 nacimientos corroborarán que la probabilidad de que un recién nacido sea mujer y
hombre es de 50%.
• Una encuesta a 900 personas sobre su grado de acuerdo con una aseveración.
• En este escenario la probabilidad se asume como una proporción (en el lenguaje de frecuencia
relativa).
3. Subjetiva

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Definiciones de probabilidad
• Ejemplos:
1. Clásica:
➢ Dentro de una bolsa hay 5 bolas rojas, 3 azules y 1 negra. ¿Cuál es la probabilidad de extraer una bola de color
azul?
2. Como frecuencia relativa:
➢ “Considero que el fenómeno de la inmigración es una amenaza contra la identidad de una región”.
➢ “Considero que los inmigrantes tienen derecho a crear sus propios partidos políticos”.

Escala Frecuencia absoluta Frecuencia relativa


Total acuerdo 225 0,25
De acuerdo 450 0,5
Indiferente 108 0,12
En desacuerdo 72 0,08
Total desacuerdo 45 0,05
Total 900 1

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Relación entre eventos
Teoría básica de probabilidad

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Relación entre eventos
Una pareja no ha decidido sobre si van a ir a una fiesta o no, Lourdes desea ir pero Rafael prefiere ir a
cine. Deciden dejarlo a la suerte, así que cada uno lanza una moneda. Si ambas caen iguales irán a la
fiesta, si caen diferentes irán al cine.

Primer Segundo
lanzamiento lanzamiento El espacio muestral está definido por:
𝑀 = 𝑐𝑐, 𝑐𝑠, 𝑠𝑐, 𝑠𝑠
Cara
Cara El evento A denota “caen caras iguales”:
Sello
Inicio
𝐴 = 𝑐𝑐, 𝑠𝑠
Cara
Sello El evento B denota “caen caras diferentes”:
Sello
𝐵 = 𝑐𝑠, 𝑠𝑐

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Relación entre eventos
Para entender la forma en que dos o más eventos se relacionan, existen tres
operaciones básicas entre conjuntos:

1. Evento no A: 𝐴𝑐
2. Evento A ó B: 𝐴 ∪ 𝐵
3. Evento A y B: 𝐴 ∩ 𝐵

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Relación entre eventos
1. Evento no A: 𝐴𝑐
• Se lee: “A complemento”
• Es el conjunto de todos los elementos que no están en A.
• Es posible confirmar que 𝐴𝑐 = 𝑀 − 𝐴
• Su probabilidad está definida como: 𝑃 𝐴𝑐 = 1 − 𝑃(𝐴)
• Se denomina ley del complemento.

𝐴
𝐴𝑐

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Relación entre eventos
2. Evento A ó B: 𝐴 ∪ 𝐵
• Es el conjunto de todos los elementos que están en A ó en B ó en ambos.
• Los eventos tienen elementos en común, pueden ocurrir al mismo tiempo, ser simultáneos, no
ser mutuamente excluyentes.
• Su probabilidad está definida como: 𝑃 𝐴 ∪ 𝐵 = 𝑃 𝐴 + 𝑃 𝐵 − 𝑃 𝐴 ∩ 𝐵
• Se denomina ley de la adición.
• Se resta 𝑃 𝐴 ∩ 𝐵 para evitar el doble conteo cuando no son eventos mutuamente excluyentes.

𝑀
𝐴 𝐵

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Relación entre eventos
3. Evento A y B: 𝐴 ∩ 𝐵
• Es el conjunto de todos los elementos que están en A y en B al mismo tiempo.
• Es el evento en el que suceden A y B simultáneamente.
• Cuando A y B son mutuamente excluyentes, este conjunto está vacío 𝜙.
• 𝑃 𝐴∩𝐵 =0
• Su probabilidad está definida como: 𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 𝑃(𝐵)
• Se denomina ley de la multiplicación.

𝑀 𝑀
𝐴 𝐴𝐵 𝐵 𝐴 𝐵

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Probabilidad condicional
Hemos visto que 𝐴 ∩ 𝐵 implica que sucede el evento A y el evento B simultáneamente.

Cuando la probabilidad de ocurrencia de B no depende de la ocurrencia de A se dice que son eventos


independientes:

𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 𝑃(𝐵)

Cuando la ocurrencia de B sí depende de A, los eventos se llaman dependientes, y se lee “probabilidad


de que ocurra B dado que A ha ocurrido”.

𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 𝑃(𝐵|𝐴)

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Probabilidad condicional
Una caja contiene 6 pelotas rojas, 4 blancas y 5 azules. Determinar la probabilidad de que al extraer
una bola ésta sea de color:
a) Rojo
b) Blanco
c) Azul
d) No roja
e) Blanca o roja

Se extraen sucesivamente 3 bolas del ejemplo anterior. Hallar la probabilidad de que sean extraídas en
el siguiente orden: roja, blanca y azul.
a) Haciendo muestreo con reemplazamiento.
b) Haciendo muestreo sin reemplazamiento.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Análisis combinatorio
Teoría básica de probabilidad

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Análisis combinatorio
• Busca encontrar el número de formas en que un conjunto de objetos puede
ordenarse.
• Su finalidad es la enumeración de todas las posibilidades de un suceso.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Principio fundamental
Un equipo de trabajo está conformado por 5 personas.

𝐸 = 𝐼𝑟𝑎𝑡𝑖, 𝐿𝑜𝑢𝑟𝑑𝑒𝑠, 𝐽𝑜𝑠𝑒𝑚𝑎𝑟í𝑎, 𝐺𝑒𝑟𝑚á𝑛, 𝑅𝑎𝑓𝑎𝑒𝑙

Necesitamos formar un equipo de supervisores que conste de un hombre y una


mujer. ¿De cuántas formas es posible organizar el equipo?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Principio fundamental
Josemaría

Lourdes Germán

Rafael

Josemaría

Irati Germán

Rafael

6 formas posibles, 2 × 3 = 6.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Principio fundamental
Del equipo de trabajo anterior, se debe nombrar un coordinador y un secretario, ¿De cuántas maneras
se pueden elegir ambos representantes?

1. Existen 5 maneras de elegir el coordinador.


2. Una vez el coordinador es elegido, restan 4 posibles candidatos para escoger el secretario.
3. En la primera elección hay 5 formas, en la segunda hay 4. Existirán 20 formas diferentes de elegir
los representantes 5 × 4 = 20.

Este procedimiento puede extenderse a más elecciones y se conoce como el principio de la


multiplicación.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Factorial de 𝑛
El factorial de 𝑛 se denota como 𝑛! y está definido por:

𝑛! = 𝑛 𝑛 − 1 𝑛 − 2 … 1
Así el factorial de 5 será:

5! = 5 × 4 × 3 × 2 × 1 = 120

Conviene recordar que 0! = 1

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Principio de la permutación
Permite conocer el número de acomodaciones posibles de objetos en un orden
determinado.

𝑛!
𝑛 𝑃𝑟 =
𝑛−𝑟 !
Donde 𝑛: número de objetos, 𝑟: forma de ordenarlos
𝑛 > 𝑟 siempre

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Principio de la combinación
Permite conocer el número de acomodaciones posibles de objetos sin importar su
orden.

𝑛 𝑛!
𝑛 𝐶𝑟 = 𝐶 𝑛, 𝑟 = 𝐶𝑛,𝑟 =
𝑟
=
𝑟! 𝑛 − 𝑟 !
Donde 𝑛: número de objetos, 𝑟: forma de ordenarlos
𝑛 > 𝑟 siempre

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Ejemplo
¿Cuál es el número de permutaciones posibles de las letras a, b, c tomadas de dos en dos?

𝑛! 3!
𝑛 𝑃𝑟 = = 3 𝑃2 = =6
𝑛−𝑟 ! 3−2 !

(𝑎, 𝑏)(𝑎, 𝑐)(𝑏, 𝑎)(𝑏, 𝑐)(𝑐, 𝑎)(𝑐, 𝑏)

¿Cuál es el número de combinaciones posibles?

𝑛! 3!
𝑛 𝐶𝑟 = = 3 𝐶2 = =3
𝑟! 𝑛 − 𝑟 ! 2! 3 − 2 !

(𝑎, 𝑏)(𝑎, 𝑐)(𝑏, 𝑐)

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Variables aleatorias
• Una variable aleatoria es un número que representa el resultado de un experimento
aleatorio.
• Asocia un valor numérico con cada resultado posible.

Experimento Variable aleatoria 𝑥 Valores posibles para 𝑥

Lanzamiento de un dado Posibles valores de la cara del dado {1, 2, 3, 4, 5, 6}


Número de clientes que hacen un
Llamar a cinco clientes {0, 1, 2, 3, 4, 5}
pedido
Inspeccionar un lote de producción
Número de elementos defectuosos {0 a 2500}
de 2500 unidades
Lanzamiento de una moneda Cara de la moneda Cara (0), sello (1)
Vender un automóvil Género del cliente Hombre (0), mujer (1)

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Variables aleatorias

Discretas
Número de vehículos que llegan a un peaje
Pueden asumir una cantidad
Género de un entrevistado
finita de valores como 0, 1, 2…n
Número de estudiantes en un aula

Continuas
Tiempo de espera en línea para hacer un pedido.
Toman cualquier valor
Altura de un edificio
numérico en un intervalo
Capacidad de un recipiente

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
• Muestra las probabilidades asociadas a los posibles valores que puede tomar una
variable aleatoria, tras un experimento aleatorio.
• Discretas: función de probabilidad/masa ⇒ 𝑓(𝑥)
• Continuas: función de densidad ⇒ 𝑓(𝑥)

Cara del dado 1 2 3 4 5 6


Probabilidad 1/6 1/6 1/6 1/6 1/6 1/6
𝑝(𝑥) 0,16666667 0,16666667 0,16666667 0,16666667 0,16666667 0,16666667

෍𝑓 𝑥 = 1

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas
Distribución de probabilidad para los días de estancia en el hospital.

Días de estancia Frecuencia Distribución de


Frecuencia
(𝑥) relativa probabilidad 𝑓(𝑥)
4 12 0,0421 4%
5 34 0,1193 12%
6 120 0,4211 42%
7 86 0,3018 30%
8 24 0,0842 8%
9 7 0,0246 2%
10 2 0,007 1%

¿Cuál es la probabilidad de que un paciente pase 5 días en el hospital? 𝑝 𝑥 = 5 = 12%


¿Cuál la de que paciente dure más de 6 días? 𝑝 𝑥 > 6 = 41%

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas
Distribución de probabilidad de días de estancia en un hospital Días de estancia Distribución de
45% (𝑥) probabilidad 𝑓(𝑥)
40% 4 4%
35%
5 12%
30%
Probabilidad

6 42%
25%
20% 7 30%
15% 8 8%
10% 9 2%
5%
10 1%
0%
4 5 6 7 8 9 10

𝑝(5 ≤ 𝑥 ≤ 7)

𝑝(4 ≤ 𝑥 ≤ 8)

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas
• Valor esperado ⇒ 𝐸 𝑥 = σ 𝑥 ∙ 𝑓 𝑥 = 𝜇
• Varianza ⇒ 𝑉𝑎𝑟 𝑥 = 𝜎 2 = σ(𝑥 − 𝜇) ∙ 𝑓(𝑥)

Días de estancia ෍𝑥 ∙ 𝑓 𝑥
𝑓(𝑥) 𝑥∙𝑓 𝑥
(𝑥)
4 4%
5 12%
6 42%
7 30%
8 8%
9 2%
10 1%

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas
Existen principalmente cuatro distribuciones de probabilidad discreta:
1. Binomial
2. Poisson
3. Hipergeométrica

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas: la binomial
Características:
• Es un experimento que acepta sólo dos posibilidades de respuesta.
• Éxito o fracaso.
• Se dispone de una probabilidad “empírica”.
• Ésta no varía a lo largo del experimento. La obtención de un éxito en un ensayo no condiciona el
resultado del siguiente ensayo.
• Se tiene un número de ensayos determinado.
• Número de ensayos fijo.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas: la binomial

𝑥 𝑛−𝑥
𝑛!
𝑝 𝑥 = 𝑛 𝐶𝑥 𝑝 𝑞 = 𝑝 𝑥 𝑞 𝑛−𝑥
𝑥! 𝑛 − 𝑥 !

𝑛 ⇒ número de ensayos (fijo)


𝑥 ⇒ valor que toma la variable aleatoria
𝑝 ⇒ probabilidad de éxito empírica (dada)
𝑞 ⇒ 1 − 𝑝 (probabilidad de fracaso)

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Aplicación
Por experiencia se sabe que 4 de 50 artículos son defectuosos. Hallar la
probabilidad de que en un lote de producción de 25 elementos, 7 sean
defectuosos.

• ¿Cuál es el experimento aleatorio?


• ¿Cuál la variable aleatoria 𝑥? ¿Cuáles sus posibles valores?
• ¿Cuál es el valor de la 𝑝 empírica? 𝑝 = 4Τ50 = 0,08
• ¿Cuál es el valor de la variable aleatoria 𝑥? 𝑥 = 7
• ¿Cuál es el número de ensayos 𝑛? 𝑛 = 25

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas: la binomial
Con la distribución de probabilidad binomial es posible hallar:
• Función de distribución (distribuciones de probabilidad acumuladas) fda ó fd.
• 𝑝(𝑥) = 0, 1, 2, 3 … 𝑛
• 𝑝 𝑥 > ò ≥ 0, 1, 2, 3 … 𝑛
• 𝑝 𝑥 < ó ≤ 0, 1, 2, 3 … 𝑛
• 𝑝 𝑎 >𝑥 >𝑏 ó𝑃 𝑎 ≥𝑥 ≥𝑏
• 𝑝 𝑎 < 𝑥 < 𝑏 ó 𝑃(𝑎 ≤ 𝑥 ≤ 𝑏) donde 𝑎 y 𝑏 son ℤ+ .

Excel permite el cálculo mediante la función +DISTR.BINOM.N

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas
• Valor esperado ⇒ 𝐸 𝑥 = 𝑛𝑝 = 𝜇
• Varianza ⇒ 𝑉𝑎𝑟 𝑥 = 𝜎 2 = 𝑛𝑝(1 − 𝑝)

Días de estancia ෍𝑥 ∙ 𝑓 𝑥
𝑓(𝑥) 𝑥∙𝑓 𝑥
(𝑥)
4 4%
5 12%
6 42%
7 30%
8 8%
9 2%
10 1%

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas
Las probabilidades de variables aleatorias continuas se definen como el
área bajo la curva de una distribución.
1. Normal
2. Normal estándar
3. t-Student
4. Chi cuadrado 𝜒 2
5. La F.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: la normal
• Es la distribución de probabilidad más común debido la normalidad aproximada
con la que ocurren naturalmente muchas situaciones de mediciones físicas,
biológicas y sociales.
• Muchos análisis estadísticos requieren que los datos provengan de poblaciones
normalmente distribuidas.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: la normal
Está determinada por dos parámetros, media y desviación estándar (μ, σ).

1 − 𝑥−𝜇 2 /(2𝜎 2 )
𝑓 𝑥 = 𝑒
𝜎 𝜎 2𝜋

𝑥 ~ 𝑁(𝜇, 𝜎 2 )
𝜇

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: la normal
Con el archivo “Base Pruebas Saber”:

1. Trazaremos un histograma para conocer cómo se distribuyen los puntajes nacionales de las
pruebas Saber.
2. También su polígono de frecuencias.
3. Obtenemos la tabla de resumen de estadísticas descriptivas.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: la normal
Histograma de la distribución de los puntajes de las Pruebas
Resumen de estadísticas
Saber año 2014
Media 𝜇 305,24
450
Mediana 299
400
Moda 301
350
Desviación estándar 𝜎 55,60
300
Varianza de la muestra 3.091,23
Densidad

250
Curtosis 0,43
200
Coeficiente de asimetría 0,61
150
Rango 352
100
Mínimo 148
50
Máximo 500
0 Cuenta 11.667
229

327
181

409

474
278
262

295

376
392
360

458
148

213

311

441
197

344
164

246

425

490
Clase

La distribución normal es el modelo teórico que explica o aproxima la distribución de la variable aleatoria de
una muestra.
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: la normal
Características:
• La media es el centro o pico de la campana.
• Media = mediana = moda.
• La distribución es simétrica alrededor de μ: coeficiente de asimetría de cero.
• El 50% de las observaciones está por debajo de la media, y el restante 50% de las
observaciones está por encima de ella.
• Las colas de la curva normal se extienden al infinito en ambas direcciones y en teoría jamás
tocan el eje horizontal.
• El área total bajo la curva es 1.
• La desviación estándar determina la dispersión en los datos. Determina qué tan plana y ancha
es la curva normal.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: la normal
Histograma de la distribución de los puntajes de las Pruebas
Saber año 2014
450
400
350
300
Densidad

250
200
150
100
50
0
229

327
181

409

474
262
278
295

360
376
392

458
148

213

311

441
246

344
164

197

425

490
Clase

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
𝜇1 𝜇2 𝜇3 𝜇1 𝜇2 𝜇3

Diferentes medias 𝜇 pero desviaciones estándar 𝜎 iguales Diferentes medias 𝜇 y desviaciones estándar 𝜎

𝜇
Medias 𝜇 iguales pero desviaciones estándar 𝜎 diferentes

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: la normal estándar

𝑥−𝜇
𝑧=
𝜎 𝜎 1

𝜇 0

𝑥 𝑧

*En la distribución normal estándar, la probabilidad también puede ser considerada como una proporción.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Aplicación
La media de estatura para un grupo de 250 mujeres es de 1,62 metros, con una
desviación estándar de 0,17 metros. Vamos a hallar:

1. La probabilidad de que las mujeres de este grupo midan más de 1,65 metros.
2. Cuántas mujeres de este grupo miden más de 1,65 metros.
3. La probabilidad de que las mujeres de este grupo midan menos de 1,65 metros.
4. Cuántas miden menos de 1,65 metros.
5. La probabilidad de que las mujeres de este grupo midan 1,60 metros o menos.
6. 1,63 metros exactamente.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teoría elemental de muestreo

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
El objetivo de la inferencia estadística es obtener información de una población a
través de una muestra.

Inferencia
estadística

Población Muestreo Muestra

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teoría elemental de muestreo
• Estudio de la relación existente entre una población y las muestras que se obtienen
de ella.
• Es el fundamento de la inferencia estadística.
Media 𝜇

Desviación
Poblacionales Parámetros
estándar 𝜎

Varianza 𝜎 2
Medidas
Media 𝑥ҧ

Desviación
Muestrales Estadísticos
estándar 𝑠

Varianza 𝑠 2

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
Una población consta de los cinco números 2, 3, 6.
Considerar todas las posibles muestras de tamaño 2 que pueden extraerse de esta
población (con reemplazamiento), calcular:

1. La media de la población.
2. La desviación estándar de la población
3. La media de las medias muestrales.
4. La desviación estándar de las medias muestrales.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
Desvest
No. Muestras Medias muestrales
muestrales Media poblacional:
1 (2,2) 2,0 0,0 𝜇 = 3,66ത
2 (2,3) 2,5 0,7
3 (2,6) 2,8 Desvest poblacional:
4,0
𝜎 = 1,70
4 (3,2) 2,5 0,7
5 (3,3) 3,0 0,0 Media de las medias:
6 (3,6) 4,5 2,1 𝜇𝑥ҧ = 3,66ത
7 (6,2) 4,0 2,8
Desvest de la distribución muestral:
8 (6,3) 4,5 2,1
𝜎𝑥ҧ = 1,20
9 (6,6) 6,0 0,0

Distribución muestral de la media

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
1. Surgen de considerar todas las posibles muestras que pueden extraerse de una
población.
2. Para cada muestra es posible calcular estadísticos que varían de una muestra a
otra, obteniendo la distribución muestral del estadístico.
3. Indican todos los posibles valores que puede tomar un estadístico de una
muestra a otra.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
De medias
Distribuciones muestrales

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribución muestral de 𝑥:ҧ

Es posible confirmar que la distribución


muestral de medias distribuye normalmente o se
Frecuencia

aproxima.

¿Qué es posible si distribuye normalmente?

Posibles valores para la media muestral

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribución muestral de 𝑥:ҧ

𝜇 Media poblacional

𝜎 Desviación estándar poblacional

𝜇𝑥ҧ Media de la distribución muestral de medias

𝜎𝑥ҧ Desviación estándar de la distribución muestral de medias (error estándar).

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribución muestral de 𝑥:ҧ
Valor esperado de 𝑥ҧ ⟹ 𝐸 𝑥ҧ = 𝜇𝑥ҧ = 𝜇

Desviación estándar ⟹ Depende del tipo de población:

𝜎 𝑁−𝑛
𝜎𝑥ҧ = ⟹ Población finita | n/N > 0,05
𝑛 𝑁−1

𝜎
𝜎𝑥ҧ = ⟹ Población infinita
𝑛

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teorema del límite central:

La población de La distribución muestral de medias también


la que se extraen distribuirá normalmente.
las muestras 𝜇 ~ 𝑁(𝜇, 𝜎)
distribuye Es posible hallar probabilidades.
normalmente

No se conoce la ¿Es posible aplicar probabilidad?


forma en que
distribuye la 𝜇~?
población Se puede suponer distribución muestral normal
a medida que la muestra se hace grande n > 30.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teorema del límite central

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Aplicación
Una escuela cuenta con un total de 400 estudiantes, su altura promedio
es de 1.50 m, con una desviación típica de 0.25 m. Determinar la
probabilidad de que en una muestra de 36 alumnos, el promedio de la
altura sea superior a 1.60 m.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribución muestral de 𝑥:ҧ
Un ejemplo
Procedimiento:
1. ¿Se conoce el total de la población?
2. ¿Cuál es el 𝑛 muestral? ¿Es el 𝑛 inferior al 5% de la población?
3. ¿Cuál es el valor de la media 𝜇?
4. ¿Cuál es el valor de la desviación estándar 𝜎?
5. ¿Cuál es el valor de la media 𝑥ҧ que queremos probar?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribución muestral de 𝑥:ҧ
Un ejemplo
Desarrollo:
1. Hallamos 𝜎𝑥ҧ .
2. Dado que buscamos una probabilidad que es un área bajo la curva normal,
debemos estandarizar a 𝑧 la media 𝑥ҧ que queremos probar.
4. Hallamos el área pedida.
5. Multiplicamos por 100 para obtener la probabilidad en términos de porcentaje.
6. Interpretamos.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Relación entre 𝑛 y la
distribución muestral de 𝑥ҧ
• A mayor 𝑛, mejor estimación de 𝜇.
• 𝜇 siempre será la misma, independientemente de 𝑛.
• 𝜎𝑥ҧ sí está relacionado con el tamaño de la muestra.
• Mientras 𝑛 crezca, 𝜎𝑥ҧ será menor.
• Si 𝑛 es grande la variabilidad entre las muestras será menor y habrá mayor
precisión en la estimación de de 𝜇.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
De proporciones
Distribuciones muestrales

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribución muestral de 𝑝ҧ
Indica todos los posibles valores que puede tomar una proporción de una muestra a otra y
con qué frecuencia.

La distribución binomial es aproximada por la normal siempre y


cuando:
Frecuencia

𝑛𝑝 ≥ 5 y/o 𝑛(1 − 𝑝) ≥ 5

¿Qué es posible si se asume que distribuye normalmente?

Posibles valores para la proporción muestral

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribución muestral de 𝑝ҧ

𝑝, 𝑝ҧ Proporción poblacional / muestral

𝜇𝑝ҧ Media de la distribución muestral de proporciones

𝜎𝑝ҧ Desviación estándar de la distribución muestral de proporciones (error estándar).

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribución muestral de 𝑝:ҧ
Valor esperado de 𝑝ҧ ⟹ 𝐸 𝑝ҧ = 𝜇𝑝ҧ = 𝑝

Desviación estándar ⟹ Depende del tipo de población:

𝑝𝑞 𝑁 − 𝑛
𝜎𝑝ҧ = ⟹ Población finita | n/N > 0,05
𝑛 𝑁−1

𝑝𝑞
𝜎𝑝ҧ = ⟹ Población infinita
𝑛

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Aplicación
Se sabe que el 2% de los elementos producidos por una máquina son
defectuosos. ¿Cuál es la probabilidad de que en un pedido de 400
elementos, el 3% o más resulte defectuoso?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribución muestral de 𝑝ҧ
Ejemplo
Procedimiento:
1. ¿Se conoce el total de la población?
2. ¿Cuál es el 𝑛 muestral? ¿𝑛/𝑁 > 5%?
3. ¿Cuál es el valor de la proporción 𝑝 poblacional con la cualidad?
4. ¿Cuál es el valor de la proporción 𝑝ҧ que queremos probar?
5. ¿Es 𝑛𝑝 ≥ 5? ¿Es 𝑛(1 − 𝑝) ≥ 5?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribución muestral de 𝑝:ҧ
Ejemplo
Desarrollo:
1. Hallamos 𝜎𝑝ҧ .
2. Dado que buscamos una probabilidad que es un área bajo la curva normal,
debemos estandarizar a 𝑧 la proporción 𝑝ҧ que queremos probar.
3. Hallamos el área pedida.
4. Multiplicamos por 100 para obtener la probabilidad en términos de porcentaje.
5. Interpretamos.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación de parámetros
2
𝜇, 𝑝, 𝜎, 𝜎

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación de parámetros
Es posible mediante la estimación de sus correspondientes estadísticos

Estimación puntual:

𝑥ҧ ⟹ 𝜇
Estadísticos 𝑠 ⟹ 𝜎 Parámetros
𝑠2 ⟹ 𝜎2
Estimación por intervalos:

𝑥ҧ ± 𝛿 ⟹ 𝜇
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Puntual
Estimación de parámetros

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimadores puntuales:
Propiedades
Supóngase:

𝛽መ ⟹ 𝛽
𝛽መ será un buen estimador de 𝛽 si cumple con las propiedades de:
1. Insesgadez
2. Eficiencia
3. Consistencia

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimadores puntuales:
Propiedades
1. Insesgadez:
• 𝐸 𝛽መ = 𝛽
• La media de la distribución muestral del estadístico es igual al parámetro 𝜇𝑥ҧ = 𝜇

2. Eficiencia:
• Varianza mínima: tendrá el menor error estándar.
• La varianza de la distribución muestral de un estimador es menor que la de otro estimador.
• Por ejemplo 𝑥ҧ y 𝑀𝑒 .
• Todo estimador eficiente es insesgado.

3. Consistencia:
• Se aproxima al verdadero valor del parámetro cuando 𝑛 aumenta.
• Una muestra grande tiende a proporcionar mejor estimación puntual que una pequeña.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Por intervalos de confianza
Estimación de parámetros

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Intervalos de confianza
Estimadores puntuales:
• No proporcionan el valor exacto de un parámetro poblacional
• Fluctuaciones muestrales

𝛽መ ≠ 𝛽 𝑥ҧ ≠ 𝜇 𝑠≠𝜎 𝑠2 ≠ 𝜎2

Estimación por intervalos:


Plantea límites alrededor de la estimación puntual.

(𝛽መ + 𝛿, 𝛽መ − 𝛿)

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Intervalos de confianza
• Indican la probabilidad de que el verdadero valor del parámetro se encuentre entre dos límites.
• 𝛽መ ± 𝛿 donde:
» መ estimación puntual (estadístico muestral).
𝛽:
» 𝛿: margen de error
» 𝛽መ + 𝛿 y 𝛽መ − 𝛿: posibles límites

Pr(𝛽መ − 𝛿 ≤ 𝛽 ≤ 𝛽መ + 𝛿) = 1 − 𝛼
1 − 𝛼: coeficiente de confianza (0,90; 0,95; 0,99)
Alpha 𝛼: nivel de significancia (0 < 𝛼 < 1) (probabilidad de errar)

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Construcción del IC y 𝛿:
σ conocida
Intervalo de confianza para la media
La determinación del error dependerá del nivel de confianza elegido.
Si la distribución muestral del estadístico (en este caso la media) ~ 𝑁:

Pr −1,96 ≤ 𝑧 ≤ 1,96 = 0,95

𝑥ҧ − 𝜇
Pr −1,96 ≤ ≤ 1,96 = 0,95
95% 𝜎𝑥ҧ

−1,96 𝝁 =? 1,96 Pr 𝑥ҧ − 1,96𝜎𝑥ҧ ≤ 𝜇 ≤ 𝑥ҧ + 1,96𝜎𝑥ҧ = 0,95


Pr 𝛽መ − 𝛿 ≤ 𝛽 ≤ 𝛽መ + 𝛿 = 1 − 𝛼

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Construcción del IC y 𝛿:
σ conocida
Intervalo de confianza para la media
Supongamos:

𝑥ҧ = 82; 𝜎𝑥ҧ = 2; 𝑧𝑐 = 1,96

Pr −1,96 ≤ 𝑧 ≤ 1,96 = 0,95

82 − 𝜇
Pr −1,96 ≤ ≤ 1,96 = 0,95
95% 2

−1,96𝜎𝑥ҧ 𝝁 =? 1,96𝜎𝑥ҧ Pr 82 − 3,92 ≤ 𝜇 ≤ 82 + 3,92 = 0,95


3,92 3,92

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Cálculo del margen de error 𝛿:
σ conocida

95%
𝝁 =?
3,92 3,92

Intervalo dado por


𝑥1ҧ ± 1,96𝜎𝑥ҧ 𝑥ҧ1

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Cálculo del margen de error 𝛿:
σ conocida

95%
𝝁 =?
3,92 3,92

Intervalo dado por


𝑥1ҧ ± 1,96𝜎𝑥ҧ 𝑥ҧ1
Intervalo dado por
𝑥ҧ 2 𝑥ҧ2 ± 1,96𝜎𝑥ҧ
Intervalo dado por
Intervalo dado por 𝑥ҧ 3 𝑥ҧ3 ± 1,96𝜎𝑥ҧ
𝑥ҧ4 ± 1,96𝜎𝑥ҧ 𝑥ҧ 4
Intervalo dado por
𝑥ҧ 5 𝑥ҧ5 ± 1,96𝜎𝑥ҧ
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Construcción del IC y 𝛿:
σ conocida
Intervalo para 𝜇:
Pr 𝑥ҧ − 𝑧𝛼Τ2 𝜎𝑥ҧ ≤ 𝜇 ≤ 𝑥ҧ + 𝑧𝛼Τ2 𝜎𝑥ҧ = 1 − 𝛼
𝒛𝜶Τ𝟐: valor de 𝒛 que proporciona un área de 𝜶Τ𝟐
en la cola superior de la distribución normal
Intervalo para 𝑝:
Pr 𝑝ҧ − 𝑧𝛼Τ2 𝜎𝑝ҧ ≤ 𝑝 ≤ 𝑝ҧ + 𝑧𝛼Τ2 𝜎𝑝ҧ = 1 − 𝛼

Nivel de confianza 𝛼 𝛼 Τ2 𝑧𝛼Τ2


90% 10% 0,05% 1,645
95% 5% 0,025% 1,960
99% 1% 0,005 2,576

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Aplicación
Con el fin de establecer lineamientos nutritivos para los comedores de un centro
universitario, la administración de la universidad desea estimar el índice de masa
corporal (IMC) para evaluar el estado de salud de su población. Se toma una muestra
aleatoria de tamaño 𝑛 = 30, con media 𝑥ҧ = 26.8. Se sabe que la desviación
estándar de la población es 𝜎 = 2.8. Se busca encontrar un intervalo de confianza
del 95% para la media del IMC.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
IC con 𝜎 desconocida:
La desviación estándar poblacional 𝜎 no siempre es conocida:

𝜎 𝑠
𝜎𝑥ҧ = ⟹ Cuando 𝜎 desconocida, el error estándar ⟹ 𝜎𝑥ҧ =
𝑛 puede estimarse mediante: 𝑛

Siempre y cuando 𝑛 ≥ 30 y la variable ~ 𝑁

Cuando se desconoce 𝜎 y 𝑛 < 30 se debe emplear la distribución t.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribución t
Es una familia de curvas, cada una determinada por un parámetro llamado grados de libertad
gl.

𝑔𝑙 ⟹ (𝑛 − 1)

𝑥෤ − 𝜇 𝑥෤ − 𝜇
Normal
𝑧= 𝑡=
t-Student
𝜎Τ 𝑛 𝑠Τ 𝑛
100%
Colas más pesadas que la normal

Media en el centro de la campana


𝑥ҧ = 𝑥෤ = 𝑀𝑜
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
IC
Caso de muestras pequeñas
Intervalo de confianza con 𝜎 desconocida:

𝑠 𝑠
Pr 𝑥ҧ − 𝑡𝛼Τ2 ≤ 𝜇 ≤ 𝑥ҧ + 𝑡𝛼Τ2 = 1−𝛼
𝑛 𝑛

𝒕𝜶Τ𝟐 : valor de 𝒕 que proporciona un área de 𝜶Τ𝟐


1−𝛼 en la cola superior de la distribución t

−𝑡𝛼Τ2 𝝁 =? 𝑡𝛼Τ2

Pr 𝛽መ − 𝛿 ≤ 𝛽 ≤ 𝛽መ + 𝛿 = 1 − 𝛼

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
IC
Caso de muestras pequeñas
Crear un IC del 95% para 𝑥ҧ = 9.312 con 𝑠 = 4.007 con 𝑛 = 25.

Desarrollo:
Sabemos que 𝛼 = 0,05 por lo tanto 𝛼Τ2 = 0,025 necesitamos hallar en
la tabla el valor de 𝑡0,025 con 24 grados de libertad.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Determinación de 𝑛

𝑧𝛼Τ2 2 𝜎 2 𝑧𝛼Τ2 2 𝜎 2 𝑁
𝑛= 𝑛= 2
𝑒2 𝑒 𝑁 − 1 + 𝑧𝛼Τ2 2 𝜎 2

𝑧𝛼Τ2 • Valor de 𝑧 correspondiente a un nivel de confianza.

𝜎2 •

Usar 𝑠 de una muestra previa.
Cuando se desconoce se toma como 0.5

• Límite aceptable de error muestral.


𝑒2 •

Varía entre el 1% (0,01) y 9% (0,09).
Queda a criterio del encuestador.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teoría estadística de la decisión

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis P.H.
• Con frecuencia se hacen suposiciones del valor de parámetros a partir de
estadísticos.
• Las P.H. se usan para determinar si las suposiciones hechas deben o no rechazarse.
• A estas suposiciones que pueden ser o no ciertas se les conoce como hipótesis
estadísticas.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Formulación de hipótesis
• Se empieza por hacer una suposición tentativa del parámetro poblacional.
• Esta suposición da origen a la hipótesis nula:

𝐻0
• Surge una hipótesis que contradice 𝐻0 , la hipótesis alternativa, es contraria a 𝐻0 :

𝐻1

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
𝐻0 y 𝐻1
Las P.H. para un parámetro asumen una de las siguientes formas, donde 𝜇0 es el valor supuesto para
el parámetro:

𝐻0 : 𝜇 = 𝜇0 𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 ≥ 𝜇0
𝐻1 : 𝜇 ≠ 𝜇0 𝐻1 : 𝜇 > 𝜇0 𝐻1 : 𝜇 < 𝜇0
Prueba de dos colas Pruebas de una cola

Importante resaltar:
• La igualdad siempre figurará en la hipótesis nula 𝐻0 .
• Lo que por lo general se intenta demostrar es la veracidad de 𝐻1 .

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
𝐻0 y 𝐻1
“Se supone que la media poblacional 𝜇 de las edades de un grupo de pacientes
psiquiátricos es de 35 años”.

𝐻0 : 𝜇 = 35 𝐻0 : 𝜇 ≤ 35 𝐻0 : 𝜇 ≥ 35
𝐻1 : 𝜇 ≠ 35 𝐻1 : 𝜇 > 35 𝐻1 : 𝜇 < 35

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
𝐻0 y 𝐻1 : generalidades
• 𝐻0 y 𝐻1 son opuestas / incompatibles.
• Una de las dos es verdadera, pero no ambas.
• La P.H. tiene como finalidad:
• Aceptar 𝐻0 cuando es verdadera.
• Rechazar 𝐻0 cuando 𝐻1 es verdadera.
• Las conclusiones correctas no siempre son posibles.
• La prueba de hipótesis se basa en una información muestral, debe tenerse en
cuenta que existe la posibilidad de error.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Tipos de errores
Error tipo 1:
Rechazar 𝐻0 cuando es verdadera

Error tipo 2:
Aceptar 𝐻0 cuando es falsa

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Tipos de errores
Error tipo 1:
Rechazar 𝐻0 cuando es verdadera

Error tipo 2:
Aceptar 𝐻0 cuando es falsa

𝐻0 : no embarazo

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de una cola
𝐻1 será quien determina la dirección de la prueba:

Prueba de cola derecha Prueba de cola izquierda

𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 ≥ 𝜇0
𝐻1 : 𝜇 > 𝜇0 𝐻1 : 𝜇 < 𝜇0

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Caso
La Superintendencia de Industria y Comercio SIC, realiza periódicamente estudios estadísticos
con objeto de comprobar las afirmaciones de los fabricantes acerca de sus productos.

La etiqueta de una lata grande de café dice que la lata contiene 3 libras de café. La SIC sabe que
el proceso de producción no permite llenar las latas con 3 libras exactas de café por lata.
Mientras la media poblacional del peso de llenado sea por lo menos 3 libras por lata, los derechos
del consumidor estarán protegidos.

La SIC interpreta que la información de la etiqueta de una lata grande de café tiene una media
poblacional del peso de llenado de por lo menos 3 libras por lata. Se toma una muestra de 36
latas.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Solución
1. Generación de 𝐻0 y 𝐻1 , la media hipotética 𝜇0 es 3.

𝐻0 : 𝜇 ≥ 3
𝐻1 : 𝜇 < 3
2. Selección de un nivel de significancia 𝛼:
Por lo general se emplea 1% o 5%.
Es la probabilidad de cometer un error tipo 1.

𝛼 = 0,01

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Solución
Se cuenta con la siguiente información:

𝑛 = 36
𝜇0 = 3
𝑥ҧ = 2,92
𝜎 = 0,18
Si 𝑥ҧ < 3, los resultados muestrales despertarán dudas sobre lo que establece la
hipótesis nula.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Solución
3. Cálculo del estadístico de prueba:
Si la variable ~ 𝑁, 𝑛 ≥ 30, 𝜎 conocía se puede emplear 𝑧 para la P.H.

𝑥ҧ − 𝜇
𝑧=
𝜎𝑥ҧ
2,92 − 3
𝑧= = −2,67
0,18Τ 36
𝑧
¿La media muestral se desvía lo suficiente del valor −2,67 0
hipotético de μ como para justificar el rechazo de
la hipótesis nula? 𝑥
2,92 3

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Solución
Método del p-valor:
El p-valor es la probabilidad de obtener un estadístico de prueba tan pequeño o menor que el
obtenido en la muestra.

p-valor: 0,0038

Regla de decisión:
Rechazar 𝑯𝟎 si p-valor ≤ 𝜶

𝑧
0
−2,67 Se rechaza 𝐻0 : 𝜇 ≥ 3 a un nivel de
0,0038
significancia del 1%
𝑥
2,92 3
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Solución
Método del valor crítico:
Es el mayor valor del estadístico de prueba que hará que se rechace 𝐻0 .
Dependerá del 𝛼 elegido.

Nivel de confianza 𝛼 𝑧𝛼
90% 10% 1,285
95% 5% 1,645
99% 1% 2,325

𝑧0,05 = 1,645

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Solución
Método del valor crítico:

Regla de decisión:
Rechazar 𝑯𝟎 si 𝒛 ≤ −𝒛𝜶
Zona de aceptación
de 𝑯𝟎
Zona de rechazo Se rechaza 𝐻0 : 𝜇 ≥ 3 a un nivel de
de 𝑯𝟎
𝑧 significancia del 1%
−2,67 −2,33
0,0038

0,01
𝑥
2,92 3
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Solución
Conclusión:

A un nivel de significancia del 1% la media del peso de llenado de las latas de café es
significativamente inferior a tres libras por lata. ¿Deberá la SIC tomar medidas
correctivas contra la empresa?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de dos colas
𝐻1 será quien determina la dirección de la prueba:

Prueba de dos colas

𝐻0 : 𝜇 = 𝜇0
𝐻1 : 𝜇 ≠ 𝜇0

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Solución
1. Generación de 𝐻0 y 𝐻1 , la media hipotética 𝜇0 es 3.

𝐻0 : 𝜇 = 3
𝐻1 : 𝜇 ≠ 3
2. Selección de un nivel de significancia 𝛼:
Por lo general se emplea 1% o 5%.
Es la probabilidad de cometer un error tipo 1.

𝛼 = 0,01

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Solución
Se cuenta con la siguiente información:

𝑛 = 36
𝜇0 = 3
𝑥ҧ = 2,92
𝜎 = 0,18
Si 𝑥ҧ ≠ 3, los resultados muestrales despertarán dudas sobre lo que establece la hipótesis
nula. La empresa podría ser multada, o podría estar llenando las latas con más de lo
establecido generando pérdidas.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Solución
3. Cálculo del estadístico de prueba:
Si la variable ~ 𝑁, 𝑛 ≥ 30, 𝜎 conocía se puede emplear 𝑧 para la P.H.

𝑥ҧ − 𝜇
𝑧=
𝜎𝑥ҧ
2,92 − 3
𝑧= = −2,67
0, 18Τ 36 𝑧
−2,67 0 2,67

𝑥
2,92 3 3,08

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Solución
Método del p-valor:
El p-valor es la probabilidad de obtener un estadístico de prueba tan pequeño o menor que el
obtenido en la muestra.

p-valor: 0,0076

Regla de decisión:
Rechazar 𝑯𝟎 si p-valor ≤ 𝜶

𝑧
−2,67 0 2,67 Se rechaza 𝐻0 : 𝜇 = 3 a un nivel de
0,0038 0,0038 significancia del 1%
𝑥
2,92 3 3,08

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Método del valor crítico:

Regla de decisión:
Rechazar 𝑯𝟎 si 𝒛 ≤ −𝒛𝜶Τ𝟐 ó si 𝒛 ≥ 𝒛𝜶Τ𝟐

Zona de aceptación Nivel de 𝛼 𝛼Τ2 𝑧𝛼Τ2


de 𝑯𝟎 confianza
Zona de rechazo Zona de rechazo
90% 10% 0,05% 1,645
de 𝑯𝟎 de 𝑯𝟎
𝑧 95% 5% 0,025% 1,960
−2,67 −2,58 2,58 2,67 99% 1% 0,005 2,576
0,0038 0,0038

0,005 0,005 Se rechaza 𝐻0 : 𝜇 = 3 a un nivel de


𝑥 significancia del 1%
2,92 3 3,08

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Solución
Conclusión:

A un nivel de significancia del 1% la media del peso de llenado de las latas de café es
significativamente diferente a tres libras por lata.
1. ¿Deberá la SIC tomar medidas correctivas contra la empresa?
2. ¿Podría estar la empresa incurriendo en pérdidas?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Reglas de decisión
Las reglas de decisión dependerán del tipo de prueba
Prueba de cola inferior Prueba de cola superior Prueba de dos colas
𝐻0 : 𝜇 ≥ 𝜇0 𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 = 𝜇0
Hipótesis
𝐻0 : 𝜇 < 𝜇0 𝐻0 : 𝜇 > 𝜇0 𝐻0 : 𝜇 ≠ 𝜇0
𝑥ҧ − 𝜇0 𝑥ҧ − 𝜇0 𝑥ҧ − 𝜇0
Estadístico de prueba 𝑧= 𝑧= 𝑧=
𝜎Τ 𝑛 𝜎Τ 𝑛 𝜎Τ 𝑛
Regla de decisión mediante Rechazar 𝐻0 si: Rechazar 𝐻0 si: Rechazar 𝐻0 si:
p-valor p-valor ≤ 𝛼 p-valor ≤ 𝛼 p-valor ≤ 𝛼

Rechazar 𝐻0 si:
Regla de decisión mediante Rechazar 𝐻0 si: Rechazar 𝐻0 si: 𝑧 ≤ −𝑧𝛼Τ2
valor crítico 𝑧 ≤ −𝑧𝛼 𝑧 ≥ 𝑧𝛼 o si
𝑧 ≥ 𝑧𝛼Τ2

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
P.H
Caso de muestra pequeña: prueba de una cola
𝑥ҧ = 7,25
𝑠 = 1,052 Regla de decisión:
𝑛 = 25 Rechazar 𝐻0 si 𝑡 ≥ 𝑡𝛼
𝐻0 : 𝜇 ≤ 7
𝐻1 : 𝜇 > 7
𝛼 = 0,05
Se habla de una prueba de cola derecha.

Zona de
Desarrollo: aceptación de
𝑯𝟎 Zona de
𝑥ҧ − 𝜇0 7,25 − 7 rechazo de 𝑯𝟎
𝑡= = ≈ 1,19 𝑡
𝑠Τ 𝑛 1,052Τ25
0 1,19 1,71
𝑡0,05 ; 24 = 1,7109 𝑥
7 7,25
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
P.H
Caso de muestra pequeña: prueba de dos colas
𝑥ҧ = 7,25
𝑠 = 1,052 Regla de decisión:
𝑛 = 25 Rechazar 𝑯𝟎 si 𝒕 ≤ −𝒕𝜶Τ𝟐 ó 𝒕 ≥ 𝒕𝜶Τ𝟐
𝐻0 : 𝜇 = 7
𝐻1 : 𝜇 ≠ 7
𝛼 = 0,05
Se habla de una prueba de dos colas.

Zona de aceptación
Desarrollo: de 𝑯𝟎
Zona de rechazo Zona de rechazo
𝑥ҧ − 𝜇0 7,25 − 7 de 𝑯𝟎 de 𝑯𝟎
𝑡= = ≈ 1,19 𝑡
𝑠Τ 𝑛 1,052Τ25
−2,06 −1,19 0 1,19 2,06
𝑡0,025 ; 24 = 2,0639 𝑥
7 7,25
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Reglas de decisión
Las reglas de decisión dependerán del tipo de prueba
Prueba de cola inferior Prueba de cola superior Prueba de dos colas
𝐻0 : 𝜇 ≥ 𝜇0 𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 = 𝜇0
Hipótesis
𝐻0 : 𝜇 < 𝜇0 𝐻0 : 𝜇 > 𝜇0 𝐻0 : 𝜇 ≠ 𝜇0
𝑥ҧ − 𝜇0 𝑥ҧ − 𝜇0 𝑥ҧ − 𝜇0
Estadístico de prueba 𝑡= 𝑡= 𝑡=
sΤ 𝑛 sΤ 𝑛 sΤ 𝑛
Regla de decisión mediante Rechazar 𝐻0 si: Rechazar 𝐻0 si: Rechazar 𝐻0 si:
p-valor p-valor ≤ 𝛼 p-valor ≤ 𝛼 p-valor ≤ 𝛼

Rechazar 𝐻0 si:
Regla de decisión mediante Rechazar 𝐻0 si: Rechazar 𝐻0 si: 𝑡 ≤ −𝑡𝛼Τ2
valor crítico 𝑡 ≤ −𝑡𝛼 𝑡 ≥ 𝑡𝛼 o si
𝑡 ≥ 𝑡𝛼Τ2

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Small-Sample Theory
t-Student distribution

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Small-Sample Theory
Use standard distribution

𝑛 ≥ 30
Use
standard distribution

𝜎 known

𝑋~𝑁 Use t-Student

Use a non-parametric
test

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Regresión lineal simple

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ

Вам также может понравиться