Академический Документы
Профессиональный Документы
Культура Документы
a los Procesos
Ing. MBA Miguel Ángel Patiño Antonioli
E-mail: mpatino@pucp.pe
WhatsApp: (+51) 977342458
Skype: mpatino23
Recordando la clase anterior…
¿Qué recuerdas?
Sesión 2:
“Estadística Sumaria y
KPI de procesos”
Objetivos
Al finalizar esta sesión, el alumno:
1. Conoce el cálculo de las Medidas de Tendencia
Central y comprende la aplicabilidad.
2. Conoce el cálculo de las Medidas de Dispersión y
comprende la aplicabilidad.
3. Conoce el cálculo de las Medidas de Asimetría y
comprende la aplicabilidad.
4. Es capaz de desarrollar un análisis de Regresión así
como de interpretar los resultados.
5. Domina las herramientas de Estadística Descriptiva y
reconoce cuándo emplear cada una en un contexto real.
Agenda
1) Resumen numérico de los datos
i. Medidas de Tendencia Central.
ii. Medidas de Dispersión
iii. La importancia de la “limpieza de datos”
iv. Medidas de Simetría y Curtosis
v. Medidas de Posición
2) Modelos de Regresión
i. Análisis bivariado de los Modelos de Regresión:
a. Modelo de Regresión Lineal Simple (MRLS).
b. Ecuación de la recta de Regresión de Mínimos Cuadrados
c. Teoría de las Variaciones
d. Coeficiente de Correlación de Pearson de Pearson
e. Coeficiente de Determinación
ii. Modelo de Regresión Lineal Múltiple (MRLM).
iii. KPI de ajuste y modelos
Control de lectura
Lecturas previas obligatoria
Recuperado de:
https://ebookcentral.proquest.com/lib/pucp
centrumsp/detail.action?docID=5486569#
“La Estadística
es una ciencia
que demuestra
que si mi vecino
tiene dos coches
y yo ninguno,
entonces…
los dos
George Bernard Shaw
(1856-1950) tenemos uno.”
“Un estadístico
podría meter su
cabeza en un
horno y sus
pies en hielo, y
decir que en
promedio …
Peter Drucker se encuentra
bien.”
Resumen numérico de los datos
Características clave de los Datos
Tendencia Central
(Posición)
Dispersión
(Variación)
Asimetría
Medidas de
Tendencia Central
Debate en equipos:
¿Por qué no existe una única
medida de tendencia central?
“The only certainty is
that nothing is certain”
Resumen numérico de los datos
Medidas de Tendencia Central
Aquellas que nos indican cual podría ser el punto medio
o representativo de un conjunto de datos analizados.
Llamados “Promedios”, buscan dar su “opinión” respecto
al valor central. Los principales son:
w x i i
x p
i 1
k
w
i 1
i
Resumen numérico de los datos
Medidas de Tendencia Central
Media Geométrica
0.5 H i 1
Punto medio de los Med Li A *
valores después de
ordenarlos.
hi
No es afectada por Intervalos
valores extremos.
d1
Valor que más se repite en Mo Li i
un conjunto de datos. d 1 d 2
No es afectada por valores DatosAgrupados
extremos.
Para datos discretos es
fácil de calcular.
No puede ser calculada
exactamente en una
distribución de frecuencias.
Resumen numérico de los datos
Medidas de Tendencia Central
Selección del promedio más adecuado
CV Grado de Variabilidad
0% < CV < 10% Datos muy homogéneos
10% ≤ CV < 15% Datos regularmente homogéneos
15% ≤ CV < 20% Datos regularmente variables
20% ≤ CV < 25% Datos variables
CV ≥ 25% Datos muy variables
Resumen numérico de los datos
Medidas de Posición
Fractiles
F j X jn F 0.5
Medidas de posición.
DatosNoAgrupados
Dividen en:
Cuartiles (Qj) jn faA
Deciles (Dj)
F i
Centiles (Pj) F j Lij f
Formulación semejante ij
a la mediana. DatosAgrupados
Me = Q2 = D5 = P50
Resumen numérico de los datos
Medidas de Posición
Resumen numérico de los datos
Medidas de Posición
Cuartiles en el Diagrama de Cajas
Resumen numérico de los datos
Medidas de Posición
Resumen numérico de los datos
Medidas de Simetría y Curtosis
Coeficiente de Asimetría de Pearson
3(𝜇 − 𝑀𝑒𝑑)
𝑆𝑘𝑝 =
𝜎
3(𝑥 − 𝑚𝑒𝑑)
𝑆𝑘𝑝 =
𝑠
𝑆𝑘𝑝 = 0
Resumen numérico de los datos
Medidas de Simetría y Curtosis
Sesgo de una distribución
Negativamente Positivamente
Simétrica Sesgada
Sesgada
Media < Mediana < Moda Media = Mediana = Moda Moda < Mediana < Media
Resumen numérico de los datos
Medidas de Simetría y Curtosis
Coeficiente de Curtosis
Modelo de Regresión
Regresor
Coeficiente de Regresión
Intercepto
Pronóstico
Función de modelación
Mínimos Cuadrados
Regresión
Asociación entre variables
Recta de Recta de
Lineal Regresión con Regresión con 2 o
1 Regresor más Regresores
Curva de Curva de
No Lineal Regresión con Regresión con 2 o
1 Regresor más Regresores
Regresión Lineal Simple
Ejemplos
14
Y
12 * Y’
10 Valor Y’=2.7+2.1X
Efectivo *
8 Valor
Estimado
6
4
2
0
0 1 2 3 4 5
Modelos de Regresión lineal
Análisis de Regresión
Variaciones
14
Y
* Variación no Y’
12
Explicada
10 Variación
8 Total *
Variación
6 Explicada
4
2
Y
0
0 1 2 3 4 5
Modelos de Regresión lineal
KPI de calidad de ajuste en la Regresión
0.7
FUERTE
1
R2
0
Medidas de Correlación
Análisis de Regresión Simple
Ejemplos de posibles correlaciones
(a) Lineal directamente proporcional (b) Lineal inversamente proporcional (c) Curvilínea directa
Y Y
(r > 0) • (r < 0) Y
•
• • • • ••
• •
• • • • •
• • • ••
• • X X
• • •
X
Y • Y Y
(r≈0)
• •• • • • ••
•• • • •• • • •
••
• •• • • • • ••
• • •
•• •• •• • • •
••• •
• •
X X X
(d) Curvilínea inversa (e) Lineal inversamente proporcional (d) Ninguna relación
con más dispersión
Medidas de Correlación
Análisis de Regresión Simple
Ejemplos de posibles correlaciones
Medidas de Correlación
Análisis de Regresión Simple
Coeficiente de Determinación (R2)
Y Y’ 𝑌 (Y- 𝑌 )2 (Y’- 𝑌 )2 (Y-Y’)2
9 9.0 9 0 0.0 0.0
5 4.8 9 16 0.2 0.04
7 6.9 9 4 0.1 0.01
14 13.2 9 25 0.8 0.64
10 11.1 9 1 -1.1 1.21
∑= 46 ∑= 44.10 ∑= 1.90
Variación Total = Variación Explicada + Variación No Explicada
46 = 44.10 + 1.90
𝒀 = 𝜷𝟎 + 𝜷𝟏 𝑿𝟏 + 𝜷𝟐 𝑿𝟐 + … + 𝜷𝒊 𝑿𝒊 + 𝜺𝒊
Donde, 𝜀𝑖 ~𝑁(0, 𝜎
2)
Supuestos:
𝜺𝒊 representa la perturbación o error aleatorio, independiente, con
esperanza nula y distribución de probabilidad normal.
Varios Regresores o variables independientes aportan una contribución
explicativa para el modelo que trata de estimar a la variable dependiente.
Multi-Colinealidad entra las variables independientes y la dependiente.
Homocedasticidad
ANOVA
Análisis de Varianza
Procedimiento para comparar varias medias poblacionales de forma simultánea.
Se asume normalidad y es para variables en escala de Intervalos o Razón
Se asume independencia.
Se asume homocedasticidad
Estadístico de Prueba:
𝑺𝑪𝑹
𝑴𝑪𝑹 𝒌
𝐅𝟎 = = ~ 𝒇(𝒌, 𝒏 − 𝒌 − 𝟏)
𝑴𝑪𝑬 𝑺𝑪𝑬
𝒏−𝒌−𝟏
Regresión Lineal Múltiple
Pruebas de significancia
Estadístico de Prueba:
𝒃𝒊
𝐓𝟎 = ~ 𝒕(𝒏 − 𝒌 − 𝟏)
𝑺𝒃
Regresión Lineal Múltiple
Pruebas de significancia
3) Prueba de la Correlación
Estadístico de Prueba:
𝐫 𝒏−𝟐
𝐓𝟎 = ~ 𝒕(𝒏 − 𝒌 − 𝟏)
𝟏 − 𝒓𝟐
Regresión Lineal Múltiple
Análisis de resultados en Minitab
Regresión Lineal Múltiple
Análisis de resultados en Minitab
Ej. Regresión
Análisis de KPI de un proceso
Peter Drucker
¿Para qué son importantes los
modelos de Regresión?
“La
formulación
de un
problema es
más
importante
que su
solución”
Conclusiones finales:
1. Un buen análisis de datos
utiliza como mínimo Tendencia
central y Dispersión.
70
Estadística Aplicada
a los Procesos
Ing. MBA Miguel Ángel Patiño Antonioli
E-mail: mpatino@pucp.pe
WhatsApp: (+51) 977342458
Skype: mpatino23