Вы находитесь на странице: 1из 57

Estadística Aplicada

a los Procesos
Ing. MBA Miguel Ángel Patiño Antonioli
E-mail: mpatino@pucp.pe
E-mail2: miguel.patino@6sconsultores.com
WhatsApp: (+51) 993495101
Skype: mpatino23
Diplomatura de Estudio en
Gestión de Procesos
Módulo I
Recordando la clase anterior…
¿Qué recuerdas?
“Al que
ESTUDIA,
dios lo ayuda”
Miguel Angel Patiño Antonioli
Sesiones 11 y 12:
“Estimación de Parámetros:
Estimación por Intervalos”
Objetivos
Al finalizar esta sesión, el alumno:

1. Comprende los conceptos clave de los


Intervalos de Confianza y su aplicabilidad
en la realidad.
2. Es capaz de inferir por intervalos acerca de la
media y proporción poblacional.
3. Comprende análisis del tamaño de muestra.
4. Es capaz de hacer inferencias de
comparaciones entre parámetros.
Agenda
1. Estimaciones por intervalos de confianza:
▪ Para la Media
▪ Para la Proporción
2. Cálculo del tamaño de muestra.
3. Intervalos de confianza para la diferencia de:
▪ 2 Medias
▪ 2 Proporciones
Control de lectura
Lecturas previas obligatoria

Veliz, C. (2014). Estadística


para la Administración y los
Negocios (2ª ed.).
México-Lima: Pearson:
▪ Estimación de
parámetros
(pp. 229 - 256)
“Las cifras no mienten,
pero los mentirosos
también usan cifras”
Y seguimos con . . .

Estadística
Inferencial
Recordando el cuadro “núcleo” del curso

INDICADOR MUESTRA (n) POBLACIÓN (N)


▪ Media ഥ
𝒙 µ
▪ Desv. Est. S σ
▪ Varianza S2 σ2
▪ Proporción ෝo𝒑
𝒑 ഥ πop
INFERENCIA
▪ Correlación r Puntual Por IC ρ
෡ 𝛉
Estimadores puntuales PH Parámetros

𝛉
o Estadísticos
El “Largo Plazo”
La importancia del “largo plazo”

Fuente: Tesis Ing. Miguel Patiño (http://tesis.pucp.edu.pe/repositorio/handle/123456789/1112?show=full)


Generando 100k corridas de Pi …

𝑷𝒂𝒓𝒂 𝟏𝟎𝟎, 𝟎𝟎𝟎 𝒄𝒐𝒓𝒓𝒊𝒅𝒂𝒔:


𝝅 ≈ 𝟑, 𝟏𝟒𝟏𝟓𝟗𝟐𝟔𝟓𝟑𝟓𝟖𝟗𝟕𝟗𝟑𝟐𝟑𝟖𝟒𝟔 …

𝑷𝒂𝒓𝒂 𝟒𝟓𝟎 𝒄𝒐𝒓𝒓𝒊𝒅𝒂𝒔: 𝒗𝒂𝒓𝒊𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅

Fuente: Tesis Ing. Miguel Patiño (http://tesis.pucp.edu.pe/repositorio/handle/123456789/1112?show=full)


Las Cadenas de Markov Ergódicas

ESTADO
ESTACIONARIO
MARKOVIANO

Verificación del Estado Estable para una Cadena de Markov Ergódica


Elaboracion Propia en Scilab
Fuente: Tesis Ing. Miguel Patiño (http://tesis.pucp.edu.pe/repositorio/handle/123456789/1112?show=full)
MARGEN DE ERROR 3
(de Estimación)
IC (𝜽)
Intervalo de Confianza

𝑰𝑪𝜽 = 𝜽 ± 𝑲𝝈𝜽෡
*

𝐞
K: Número Estadístico de Tablas. 𝑍(1−𝛼) 𝑜 𝑇(1−𝛼; 𝑛−1)
Depende del caso Media, Proporción: 2 2

▪ Intervalo de valores dentro del cual es posible que


esté el parámetro de la población (basado en las
observaciones de la muestra)
▪ Proporciona un grado de confianza para determinar
donde se ubica el parámetro de la población.

* Fuente: Tesis Ing. Miguel Patiño (http://tesis.pucp.edu.pe/repositorio/handle/123456789/1112?show=full)


Nivel de Significancia 4
Nivel de Significación
Error Tipo I
NC (Nivel de Confianza)

𝑵𝑪 = 𝟏 − 𝜶
▪ Probabilidad de que el intervalo contenga al
Parámetro.
▪ Se expresa en porcentaje.
▪ Rango: [90% - 99%]. Valor típico: 95%
Un ejemplo de K: 1) Error Tipo I:
3) Número en el eje Z 𝜶 = 1 - NC

𝜶
(𝟏− )
2) Probabilidad
Acumulada
𝟐
Un ejemplo de K en Excel:
Ej.: Si el NC = 95%.
1. 𝜶 = 1 – 0.95 = 0.05.
2. Probabilidad Acumulada: 1 – 0.05/2 = 0.975
3. Z = DISTR.NORM.ESTAND.INV(0.975) = 1.96
Pregunta de reflexión:
1. ¿Cómo mejoramos la precisión
de un Intervalo de Confianza?
2. ¿De qué depende?
1

Intervalos de
Confianza Simétricos
Para estimar una sola Población (1 Parámetro)

1.1 Para 1 Media


1.2 Para 1 Proporción
1.1

IC (𝝁)
1.1
Intervalo de Confianza para la Media

𝝈𝒙 𝝈𝒙
ഥ −𝒁
𝑿 𝜶 ∗ ഥ +𝒁
≤ 𝝁 ≤𝑿 𝜶 ∗
𝟏− 𝒏 𝟏− 𝒏
𝟐 𝟐

IC ( 90%) = x  1.645 x
IC (95%) = x  1.96 x
IC ( 99%) = x  2.58 x
1.1
Intervalo de Confianza para la Media
1-α
x-
donde Z =
α/2 α/2

-Z0 Z0
n
 
Pr − Z   Z  Z   = 1 − 
1−
 1− 2 2

 x− 
Pr − Z    Z   = 1−
 1− 2 x 1−
2

    ¿Cómo
Pr  x − Z  x+ Z   = 1 −  se lee?
 n 1− 2 n 1− 2 
1.1
¿Cómo saber si
trabajamos con Z o T?
¿Conozco 𝝈 o 𝒏 ≥ 𝟑𝟎?
La pregunta se hace en ese orden: la Jerarquía importa

SÍ 𝒁𝟏−𝜶
𝟐

NO 𝑻(𝟏−𝜶,𝒏−𝟏)
Dado que n<30, 𝟐
asumo Normalidad y uso:
1.1
Distribución t de Student
Características:
Normal Estándar
Acampanada 13 grados de
Simétrica libertad)
Más plana
Para n<30 Distribución t
5 grados de
libertad

z
Grados de Libertad = n − 1 0 t
Número de observaciones que son libres de variar después que
una estadística de la muestra ha sido calculada.
1.1
Intervalo de confianza para la media
Distribución t de Student
▪ Se usa para inferir medias cuando:
– Desconocemos la Desv. Estándar poblacional.
– La población está normalmente distribuida.
– n<30.
▪ Más achatada que la normal.
▪ Corregida por grados de libertad, gl = n-1

IC = x t
(1 −  ) 1 - α/2,n -1
*S x
Empleando EXCEL, =DISTR.T.INV(α;gl)
Ejercicios
Ejercicio 1:
Una encuesta hecha a 400 familias de una
gran ciudad dio un consumo medio anual
con tarjetas de crédito de S/. 740 por
familia. La desviación estándar fue S/. 400.
¿Es cierto que en esa ciudad, el
consumo medio por familia en tarjetas de
crédito es mayor a S/. 800?
Ejercicio 2:

El banco MyK, un banco muy prestigioso por el legado de su fundadora, la


Directora Karina P., dueña del mismo desde el 31 de enero, está muy
preocupado actualmente por los reclamos recientes de los clientes respecto al
proceso “entrega de Tarjeta de Crédito”. Los reclamos han incrementado 30%
en el último mes.
El Ing. Pirlo consideró apropiado hacer un estudio respecto a la tipología de
los mismos y descubrió que el Pareto se encontraba concentrado en “tiempos
de atención excesivos, superiores a 21 min”.
Con este relevamiento de la VOC, Andrea Pirlo está pensando seriamente en
enviar a vacaciones indefinidas al nuevo Gerente de Oficina, el Sr. Dybala,
sobre todo si descubre que los reclamos de los clientes son reales.
Para tomar una decisión acertada, decide tomar una muestra de los últimos 40
días, obteniendo una media de 24 y una desviación estándar de 6.31 min.
En base a su dominio de la Estadística:
¿Qué le recomendaría al Ing. Pirlo asumiendo un riesgo del 5%?
Ejercicio 3:

Una muestra de tamaño 10 de la producción de


neumáticos para camionetas SUV, tomada de un lote
donde los radios tienen un comportamiento
aproximadamente simétrico, arroja un valor promedio de
16.6 cm y una desviación estándar de 1.3 cm.
La promesa al cliente es entregar un neumático que en el
97% de las veces, tenga un radio de 18 cm.

Mediante el nivel de confiabilidad ofrecido, validar la


promesa al cliente: ¿Se está cumpliendo con el cliente?
Ejercicio 4:
Nueve automóviles del mismo modelo fueron conducidos de
idéntica manera usando un litro de gasolina corriente.
La distancia media recorrida por estos automóviles fue de 8
Km con una desviación estándar de 1.14 Km.
El Director de Logística requiere distribuciones a los
almacenes con trayectos diarios promedio de 9 Km. De no
cumplir con esta métrica, el Director tercerizaría la
distribución para alcanzar el objetivo.
Con una riesgo del 5% y en base a su know-how de la
Estadística Inferencial, le recomienda al Director que
tercerice la Distribución? ¿Qué acciones adicionales
propondría a raíz de la lectura de sus resultados?
1.2

IC (𝝅)
1.2
Intervalo de confianza para la
Proporción
▪ Procedimiento semejante a
IC( p ) = pˆ  z(1− / 2 ) pˆ la estimación de la media
▪ Factores:
pq ▪ Número de observaciones
IC( p ) = pˆ  z(1− / 2 ) en la muestra (n).
n ▪ El valor de p.
▪ El nivel de confianza, z
Ejercicio 5:

De 985 electores encuestados, 592 indican que


votaran por el candidato oficialista. Con un nivel de
confianza del 0.90 cuál es la proporción de
votantes de la población que piensa votar por el
candidato oficialista.
¿Tiene probabilidades de ganar?
¿Cuál es el riesgo de una victoria “estimada”?
Para reflexionar:
¿Cómo saber qué cantidad de
muestra tener en un estudio?
¿De qué depende?
Tamaño de muestra
1. Para Muestreo Con Reposición o Población “Infinita”:
a. Caso Media b. Caso Proporción

 Z1− / 2 
2 2
z pˆ qˆ
n0 =   n0 = (1− / 2 )

 e  e 2

2. Si la Población no es “Infinita” (se conoce N):


n ▪ e: Margen de error (mitad ancho
n = 0
Intervalo de Confianza)
n −1
1+  0
 ▪ Si no conocemos el p muestral, usamos
0.5, esto nos da un mayor tamaño de “n”
 N 
Tamaño de muestra
Fórmulas directas en caso de Población Finita*
a. Caso Media

b. Caso Proporción

* Tomado de la Tesis de Ing. de Miguel Patiño: "Aplicación de las Cadenas de Markov


Ocultas para la Preferencia del mercado cervecero"
http://tesis.pucp.edu.pe/repositorio/handle/123456789/1112?show=full
Ejercicio 6:
Se desea estimar la media de consumo
mensual de combustible por los automóviles
de una ciudad dentro de ±50 galones del
valor verdadero con una confianza del 95%.
Con base en un estudio realizado el año
anterior, se conoce que la desviación
estándar es de 325 galones.
¿Cuál será el tamaño de la muestra
requerido para esta estimación?
Ejercicio 7:

¿Qué tamaño de muestra de clientes debe


escoger una comercializadora para
estimar la proporción de ventas del
próximo año, si desean que su estimación
quede dentro del 0.04 de la proporción
real con probabilidad igual a 0.90?
Ejercicio 8:
El Ing. Del Piero especula que el Lead Time promedio de entrega del
producto ABC a su almacén es superior a 3 días, motivo por el cual está
pensando contratar un servicio express para así tener el pedido a tiempo y
poder cumplir con la especificación del cliente (máximo 3 días).
El Ing. Zidane toma una muestra aleatoria de 36 últimos pedidos y descubre
que el tiempo promedio fue de 2.6 días, sospechando que el Ing. Del Piero
estaría malgastando los recursos al contratar un servicio express
innecesariamente.
La empresa trabaja con riesgos del 5% y 1% y se sabe que, de acuerdo al
último estudio, la desviación estándar del Lead Time sigue siendo de 0.3 días.
▪¿Qué conclusiones nos entrega el análisis de sensibilidad con ambos
riesgos respecto a la decisión del Ing. Del Piero?
▪¿Qué tan grande se requiere que sea la muestra si se desea una
confianza del 95 % que la estimación de la µ difiera de ésta por menos
de 0.05 días?
2

Intervalos de
Confianza Simétricos
Para comparar dos Poblaciones (2 Parámetros)

2.1 Para 2 Medias


2.2 Para 2 Proporciones
2.1

IC (𝝁𝟏 − 𝝁𝟐 )
2.1
Intervalo de Confianza para µ1-µ2
 
2 2
Cuando conocemos las varianzas 1 2

L.S.C ( x1 − x2 ) + z (1− / 2 ) x − x
1 2

L.I.C ( x1 − x2 ) − z (1− / 2 ) x − x
1 2

 +2
2 2

 x1 − x2
= 1

n 1 n 2
2.1
Intervalo de Confianza para µ1-µ2
Cuando no conocemos las varianzas, pero
 
2 2
asumimos que son iguales: 1 2

1 1
L.S.C ( x1 − x2 ) + t (1− / 2, gl ) S p +
n n
1 2

1 1
L.I.C ( x1 − x2 ) − t (1− / 2, gl ) S p +
n n
1 2

(n1 − 1) S 1 + (n2 − 1) S 2
2 2

Sp = gl = n1+n2-2
n1 + n2 − 2
2.1

Ejercicio 9 – PARA GANAR PUNTOS ADICIONALES:

Se aplica un Test de tendencia a la deserción laboral a 50


mujeres y 75 hombres de una planta de gaseosas, como parte
de su programa de mejora del Clima laboral.
Las mujeres obtienen una calificación promedio de 76 puntos, y
los hombres 82 puntos.
Encuentre un intervalos de confianza del 96% para la diferencia
entre µ1-µ2 donde µ1 es la puntuación promedio de todos los
hombres y µ2 de todas las mujeres que realizaron la prueba.
De estudios anteriores se estableció que las desviaciones
estándar para las mujeres y los hombres son 6 y 8
respectivamente.
2.2

IC (𝝅𝟏 − 𝝅𝟐 )
2.2
Intervalo de Confianza para p1-p2
Cuando las muestras n1 y n2 son grandes (n>=30)

L.S.C ( p1 − p 2 ) + z (1− / 2 ) p1 − p 2

L.I.C ( p1 − p 2 ) − z (1− / 2 ) p1 − p 2

p1 q1 p2 q2
 p1 − p 2
= +
n 1 n 2
2.2
Ejercicio 10 – PARA GANAR PUNTOS ADICIONALES:

El Ing. Nedved es el responsable de tomar la decisión de asignar Proyectos LSS (Lean Six Sigma)
enfocados en la reducción de la tasa de defectos en una de las líneas de producción de una empresa
que produce consolas de Play Station. Dado que esta tarea involucra un presupuesto contundente
por contratar los servicios de 6S Consultores para cada proyecto LSS, el Ing. Nedved debe ser
cuidadoso con su selección, pues luego será auditado para verificar si asignó los recursos escasos
en una mejora de procesos para las líneas que realmente lo ameritaban.
La tasa de defectos actual de la línea PS4 Regular está controlada, fruto del proyecto LSS liderado
por el dueño de 6S Consultores 6 meses atrás, por lo que quedaría la duda respecto a la nueva línea
PS4 Pro.
Se sabe, por algunos rumores del área de post venta, que al parecer, las nuevas consolas PS4 Pro
están teniendo problemas considerables desde su lanzamiento, a finales del 2016.
Si se determina que, efectivamente, la línea PS4 Pro tiene un mayor porcentaje de defectos que la
línea PS4 Regular, el Ing. Nedved contrataría los servicios del Ing. MAPA para un nuevo proyecto
LSS en esta línea, caso contrario, no invertiría por el momento en contratar a los consultores.
En una muestra aleatoria de 200 consolas PS4 Regular y 100 consolas PS4 Pro, se determinó que
60 y 20 de las mismas, se consideraron defectuosas.
Construya un intervalo de confianza del 95% para entender la problemática y tomar la decisión final.
¿Contratamos a 6S Consultores para un nuevo proyecto LSS en la línea PS4 Pro?
Caso:
Inmobiliaria El Golfo
Conclusión:

Los IC son confiables,


pero manejan una
amplitud de
variabilidad y un
riesgo cuantificado
¿Qué aprendimos
hoy?
Pendientes para la siguiente sesión
1. Leer y desarrollar las
preguntas del Caso 3
– El Súper Pollo.
Colgarlo resuelto en la
intranet hasta el inicio
de la siguiente clase y
traerlo impreso.

2. Ir terminando el TAF.
¡A seguir practicando!

75
Estadística Aplicada
a los Procesos
Ing. MBA Miguel Ángel Patiño Antonioli
E-mail: mpatino@pucp.pe
E-mail2: miguel.patino@6sconsultores.com
WhatsApp: (+51) 993495101
Skype: mpatino23
Diplomatura de Estudio en
Gestión de Procesos
Módulo I

Вам также может понравиться