Fase Analisis

VIII.
FASE
DE
ANÁLISIS
Resumen
Dr. Primitivo Reyes Aguilar /

enero 2009
FASE DE ANÁLISIS P. Reyes enero 2009
Contenido
VIII. FASE DE ANÁLISIS......................................................................................................... 4
VIII.I INTRODUCCIÓN .......................................................................................................... 4
VIII.2 LOS 7 DESPERDICIOS .................................................................................................. 8
Sobreproducción ............................................................................................................. 8
Inventario......................................................................................................................... 9
Reparaciones / Rechazos ................................................................................................. 9
Movimientos .................................................................................................................... 9
Reproceso ...................................................................................................................... 10
Transporte ..................................................................................................................... 10
Esperas ........................................................................................................................... 11
Otros desperdicios ......................................................................................................... 11
VIII.3 ANÁLISIS MULTI-VARI .............................................................................................. 12
Procedimiento de muestreo .......................................................................................... 12
Ejemplo .......................................................................................................................... 14
VIII.4 MODELO LINEAL SIMPLE ......................................................................................... 16
Método de mínimos cuadrados .................................................................................... 18
Inferencias respecto a la pendiente e intervalo de confianza para 1 ...................... 21
Coeficiente de correlación ............................................................................................. 22
Coeficiente de determinación ....................................................................................... 23
VIII.5 REGRESIÓN LINEAL MÚLTIPLE ................................................................................ 24
Valor p (p – value) ......................................................................................................... 25
VIII.6 PRUEBAS DE HIPÓTESIS ........................................................................................... 26
1. Conceptos básicos ..................................................................................................... 26
Hipótesis nula ............................................................................................................. 26
Estadístico de prueba ................................................................................................. 27
Tipos de errores ......................................................................................................... 27
2. Pruebas de una y dos colas ........................................................................................ 28
Prueba de una cola ..................................................................................................... 28
Prueba de dos colas ................................................................................................... 29
Significancia práctica vs significancia estadística ....................................................... 29
Potencia de la prueba (I - ) ....................................................................................... 30
Tamaño de muestra ................................................................................................... 34
Página 2 de 61
3. Estimación puntual y por intervalo ........................................................................... 36

Estimación puntual para la media poblacional .......................................................... 36
Estimación puntual para la varianza poblacional....................................................... 36
Intervalo de confianza para la media (CI) – sigma conocida...................................... 37
Intervalo de confianza para la media (CI) – sigma desconocida ................................ 37
Intervalo de confianza para una proporción.............................................................. 37
Intervalo de confianza para la varianza 2 ................................................................. 38
4. Pruebas de hipótesis.................................................................................................. 38
Prueba de hipótesis para la media (sigma conocida) ................................................ 40
Prueba de hipótesis para la media (sigma desconocida, muestras pequeñas) ......... 42
Pruebas de hipótesis de dos medias – varianzas iguales ........................................... 45
Pruebas de hipótesis de dos medias – varianzas diferentes ..................................... 46
Prueba t pareada ........................................................................................................ 47
Prueba de una proporción – prueba p ....................................................................... 47
Prueba Chi cuadrada (2) para un varianza ............................................................... 48
Tabla de contingencia ................................................................................................ 49
Prueba de igualdad de dos varianzas F ...................................................................... 51
Resumen de pruebas de inferencia estadística ......................................................... 53
VIII.7 ANÁLISIS DE VARIANZA ............................................................................................ 54
ANOVA – UNA VÍA ......................................................................................................... 54
ANOVA – DOS VÍAS ........................................................................................................ 58
VIII.8 OTRAS HERRAMIENTAS ........................................................................................... 59
ANÁLISIS DE CAUSA RAÍZ ............................................................................................... 59
LOS CINCO POR QUÉS .................................................................................................... 60
5Ws – 1H (o 2H) ............................................................................................................. 61
Análisis del modo y efecto de falla (AMEF) ................................................................... 61
Página 3 de 61
VIII. FASE DE ANÁLISIS
Definir
Definir Medir Analizar
Analizar Mejorar
Mejorar Controlar
Controlar
VIII.I INTRODUCCIÓN
En esta fase se efectuará el análisis de los datos obtenidos en la etapa de Medición, con
el propósito de conocer las relaciones causales. La información de este análisis
proporcionará evidencias de las fuentes de variación y desempeño insatisfactorio, el
cual es de gran utilidad para la mejora del proceso.
Los objetivos de esta fase son:
 Aprender el uso de las herramientas de la fase de análisis.

 Determinar en qué nivel de desempeño del proceso nos encontramos actualmente.
 Identificar cuáles son las fuentes de variación. Por ejemplo mediante el análisis
Multi-Vari podemos determinar las fuentes que presentan mayor variación, a través
de la descomposición de los componentes de variabilidad del proceso. las cuáles
pueden ser, por ejemplo: de lote a lote, dentro del lote, de turno a turno, entre
turnos, dentro del turno, de máquina a máquina, dentro de la máquina, de operador
a operador, dentro del operador, entre operadores, etc.
Las herramientas que se incluyen en esta fase son:
No. Herramienta ¿Para qué es utilizada?

Identificar las diferentes formas de
1 Los 7 desperdicios
desperdicio para minimizarlos
El objetivo general de las cartas Multi-Vari es,
descubrir los componentes de variación en el
2 Análisis Multivari
proceso y cuantificar las diferentes fuentes
de variabilidad.
Página 4 de 61
Sirve para predecir el valor de una variable a

Análisis de Regresión y partir de una o más variables. Es usada para
3 -4
Correlación – simple y múltiple conocer las relaciones que existen entre las
variables dependientes e independientes.
Sirve para interpretar la significancia de
5 Valor p variables y factores en diversos métodos
estadísticos
Pruebas estadísticas para probar
afirmaciones y teorías sobre causas
potenciales y para verificar las mejoras:
 Conceptos básicos
- Estimación puntual y por intervalo
 Media
 Proporción
 Varianza
6 Pruebas de hipótesis - Pruebas de hipótesis
 Una media
 Dos medias
 Medias pareadas
 Una proporción
 Una varianza
 Tabla de contingencia
 Igualdad de varianzas
Para probarla significancia del efecto de

diversos niveles o tratamientos de un factor.
7 ANOVA de una vía Sirve para analizar la variación entre
muestras y al interior de las mismas con sus
varianzas
Para probar la significancia del efecto de los
8 ANOVA de dos vías tratamientos de un factor con una variable de
bloqueo para reducir el error experimental.
Permite identificar la causa raíz para tomar la
9 Análisis de causas raíz
acción correctiva necesaria
Permite identificar la causa raíz a través de
10 5 Porqués
una serie de preguntas sucesivas porqué
11 5W – 1H Permite identificar la causa raíz a través de
Página 5 de 61
una serie de preguntas combinadas para

colectar la mayor parte de la información
sobre el problema
Identificar las maneras en las cuales un
proceso puede fallar para alcanzar los
12 AMEF (FMEA) requerimientos críticos del cliente. Estimar el
riesgo de la causas específicas en relación con
estas fallas.
La fase de análisis consta de las siguientes etapas:
Identificar las fuentes de variación.-
Cuando un proceso se encuentra fuera de las especificaciones permitidas, se tiene

evidencia de que existe variación. Para comprobarlo utilizamos alguna de las
herramientas de análisis, según sea el el caso por ejemplo, el análisis Multi-Vari es una
herramienta estadística que nos permite determinar las fuentes que presentan mayor
variación, a través de la descomposición de los componentes de variabilidad del
proceso. Una vez determinadas las causas de variación, nos enfocaremos en los “pocos
vitales X” que están afectando la variable de respuesta “y”. Una opción para priorizar
estas causas es el uso del “diagrama de Pareto”.
Variación del
Proceso
Variación Actual del Proceso Variación del Proceso de Medición
Variación a Largo Variación a Corto Variación debida al Variación debida al Otras fuentes de
Plazo Plazo Equipo de Medición operador Variación
Exactitud Precisión Discriminación

(Sesgo) (Error de Medición) (Resolución)
Figura 1 Posibles fuentes de variación del proceso.
Página 6 de 61
FASE DE ANÁLISIS RESUMEN

El proceso de análisis que se recomienda es el siguiente:
QFD
FASE DE ANÁLISIS
Diagrama de
relaciones
Diagrama
Causa Efecto Diagrama de
Ishikawa
Diagrama
de Árbol
Definición
Y=X1 + X2+. .Xn
CTQs = Ys Medición Y,
Operatividad X1, X2, Xn
X's
Causas
Análisis del Modo y Efecto de potenciales
Falla (AMEF)
Pruebas
de
hipótesis
Diagrama
de Flujo
del X's vitales
Salidas de la Fase de Análisis
proceso No ¿Causa Si Causas raíz
o Causas raíz validadas Raíz? validadas
o Guía de oportunidades de mejora
Resumen de la validación de las causas
# de
Resultados Causa
Causa Causas Raíz
1 Ensamble de ojillos, bloques y SI ES CAUSA RAIZ
X
contrapesos no adecuados en
aspas.
2 Amortiguadores dañados. X
SI ES CAUSA RAIZ
3 Desgaste de bujes en los
carretes. NO ES CAUSA RAIZ
4 Fabricación y reemplazo de NO ES CAUSA RAIZ
ejes y poleas no adecuados en
ensamble de aspas.
Desalineamiento de poleas y
5 bandas de transmisión de SI ES CAUSA RAIZ X
aspas.
Método de Balanceo no
6 SI ES CAUSA RAIZ X
adecuado.
7 Desalineación de pinolas en NO ES CAUSA RAIZ
cuna.
Página 7 de 61
VIII.2 LOS 7 DESPERDICIOS
Las actividades que no agregan valor se clasifican como Muda: Las actividades por las
que paga el cliente se considera que agregan valor. Imai proporciona 7 categorías
comunes en la industria:
 Sobreproducción
 Inventarios
 Reparaciones / Rechazos
 Movimientos
 Proceso adicional
 Transporte
 Espera
Sobreproducción
Se refiere a producir de más en un momento dado, se caracteriza por:
 Producir más de lo que necesita el siguiente proceso o cliente

 Producir antes de lo que necesita el siguiente proceso o cliente
 Producir más rápido de lo que necesita el siguiente proceso o cliente
En JIT producir mucho antes es tan malo como producir después de cuando se requiere
el producto. Las partes necesitan estar disponibles en cierto lugar, a cierto tiempo, en la
cantidad requerida de acuerdo al programa del cliente.
Si no se produce JIT se incurre en gastos adicionales como son:
 Espacio extra utilizado en la planta del cliente

 Espacio extra en la planta de la organización
 Materias primas extras en uso
 Energéticos extras
 Transporte extra para el cliente y organización
 Costos extra de programación
Página 8 de 61
Inventario
Son formas de inventario que no agrega valor o Muda: las partes, WIP, inventarios de
materia prima, materiales indirectos y productos terminados, estos:
 Requieren espacio en la planta
 Requieren transporte
 Requieren montacargas
 Requieren transportadores
 Requieren personal adicional para su manejo
 Requieren el pago de un interés financiero por el costo de los materiales
Además el inventario almacenado en varias etapas puede ser afectado de estas formas:
 Se empolva
 Se deteriora
 Se hace obsoleto
 Se humedece
 Se daña en el manejo
Reparaciones / Rechazos
La reparación o retrabajo de partes defectivas son una segunda oportunidad de producir

partes buenas, las partes que ya no se pueden recuperar se convierten en desperdicio
de recursos. Si hay defectos en una línea continua elimina el flujo continuo. Se utilizan
operadores y personal de apoyo para corregir problemas, excediendo el takt time.
También intervienen los proveedores en los retarbajos generando muda.
Varios cambios de diseño pueden ser muda también si generan retrabajos y

desperdicios.
Movimientos
El uso eficiente del cuerpo humano es crítico para el bienestar del operador, los
movimientos extra innecesarios causan desperdicio de energías. Los operadores no
deben caminar demasiado, cargar pesado, doblarse periódicamente, tener cosas lejos,
repetir movimientos, etc. Se deben desarrollar nuevas herramientas para hacer el
Página 9 de 61
trabajo más fácil, incluyendo el rediseño del layout con un enfoque ergonómico. Cada
estación debe ser analizada de acuerdo a los requisitos de ergonomía y movimientos.
La ergonomía puede eliminar factores en el lugar de trabajo que causen dañios y

pérdidas de producción. Algunas guías son las siguientes:
 Énfasis en seguridad todo el tiempo

 Adecuar el empleado a la tarea
 Cambiar el lugar de trabajo al empleado (no viceversa)
 Diseñar el lugar de trabajo de modo se mantengan posiciones del cuerpo
neutrales
 Rediseñar las herramientas de mano para reducir esfuerzo y daños
 Variar las tareas con rotación de tareas cada 2 a 4 horas
 Hacer que la máquina sirva al humano
Reproceso
Consiste de pasos adicionales o actividades en el proceso de manufactura, puede
describirse como:
 Remover rebabas del proceso de manufactura

 Retrabajar piezas causadas por dados dañados
 Agregar un proceso extra de manejo por falta de esapcios
 Realizar un paso de inspección (no agregan valor)
 Repetir cambios al producto que sean innecesarios
 Mantener copias adicionales de información
Transporte
Todas las formas de transporte son Muda (excepto el llevarle el producto al cliente), ya
que implica el uso de montacargas, transportadores, movedores de pallets y camiones.
La causa puede ser una distribución de planta inadecuada, celdas mal diseñadas, uso de
proceso en lotes, tiempos de proceso largos, áreas grandes de almacenamiento, o
problemas de programación. El transporte en general se debe minimizar.
Página 10 de 61
Esperas
El muda de espera ocurre cuando un operador está listo para la siguiente operación,
pero debe permanecer ocioso en espera, ya sea por falla en máquinas, falta de partes,
actividades de seguimiento descuidadas o paros de línea. Un técnico de mantenimiento
es espera de una refacción es parte de muda. El muda de espera se caracteriza por:
 Operadores ociosos
 Fallas de maquinaria
 Tiempos de preparación y ajuste muy largos
 Programación de tareas no balanceado
 Flujo de materiales en lotes
 Reuniones largas e innecesarias
(Imai, 1997)
Otros desperdicios
Además de los siete desperdicios clásicos listados previamente, otras fuentes son;
 Recursos mal utilizados
 Recursos subutilizados
 Conteos
 Búsqueda de herramientas o partes
 Sistemas múltiples
 Intervenciones manuales múltiples
 Aprobaciones innecesarias
 Fallas mayores de máquinas
 Muda causado por enviar productos malos a los clientes
 Muda causado por proporcionar un mal servicio a los clientes
(Metcalf, 1997)
Página 11 de 61
VIII.3 ANÁLISIS MULTI-VARI
El CEP permite el monitoreo de variables como las quejas del cliente, la presión, la
temperatura al tomar mediciones en ciertos intervalos. Pero en el caso de temperatura
de hornos o el espesor de una placa varían dependiendo del lugar donde se tomen.
La variación puede ser de pieza a piezas, tiempo a tiempo o dentro de la pieza, para
analizar estos tres tipos de variación se utiliza la carta Multi-vari. También sirven para
investigar la consistencia de un proceso.
Procedimiento de muestreo
 Seleccionar el proceso y la característica a ser investigada

 Seleccionare el tamaño de muestra y frecuencia de tiempo
 Usar una hoja tabular para registrar el tiempo y los valores para cada muestra
 Graficar la carta con el tiempo o secuencia en el eje horizontal
 Graficar los valores medidos en el eje vertical
 Unir los valores observados con líneas apropiadas
 Analizar la carta identificando la variación dentro de la muestra, entre muestras
y en el tiempo
 Realizar estudios adicionales para concentrarse en las áreas problema
 Después de la mejora, repetir el estudio para confirmar los resultados
A continuación se muestran las mediciones tomadas en cinco puntos de las partes,
diferentes partes secuenciales y su comportamiento en el tiempo.
Se presentan otros tres ejemplos:
Página 12 de 61
Se presenta una variabilidad excesiva dentro de la pieza (cónica)
Menor variabilidad dentro de la pieza (el centro es más grueso)
Página 13 de 61
La variación se incrementa con el tiempo (la parte se hace más grande)
La interpretación de la carta es aparente una vez que se grafican los valores. Las
ventajas de las cartas Multi-vari son:
 Puede resaltar la variación dentro la pieza (posicional)

 Puede resaltar la variación de pieza a pieza (cíclica)
 Sigue cualquier cambio relacionado con el tiempo (temporal)
 Ayuda a minimizar la variación al identificar áreas donde buscar la mayor
variación
 También identifica áreas donde no buscar la variación
Por ejemplo:
Producto / Proceso bajo consideración

Áreas de variación Pieza Lote
Posicional Dentro de la pieza Dentro del lote
Cíclica Pieza a pieza Lote a lote
Temporal En el tiempo En el tiempo
La variación posicional se puede dividir en componentes:
Cilindro Extremo a extremo, no redondez en cada extremo

Lote Parte superior a inferior, lado a lado
Pieza plana A todo lo ancho, de frente hacia atrás
Ejemplo
Un fabricante de láminas planas de aluminio lleva control del espesor después del
rolado en caliente. La especificación es de 0.245” ± 0.005”. El proceso ha producido
desperdicio ya que su Cp es de 0.8, el costo del desperdicio es de $20,000 por mes. Se
ha pensado en adquirir otra máquina con un costo de $800,000 y 6 meses de
instalación.
Se hace un estudio Multi-vari para analizar el problema. Se hacen 4 mediciones dentro

de la pieza y se toman tres piezas cada hora, con el correspondiente resultado.
Página 14 de 61
8 AM 9 AM 10 AM 11 AM 12 AM
.0.2510”
0.2500”
0.2490”
Izquierda
Máximo
Derecha
Mínimo
Parece que la variación en el tiempo es la mayor, las contramedidas se muestran a

continuación.
Tipo de % de variación Variación y Corrección de % de reducción

variación causa la variación de la variación
Tiempo a 50% Bajo nivel de Alimentador Cerca del 50%
tiempo refrigerante automático
Dentro de la 30% Ajustes no Respaldo del Cerca del 30%
pieza paralelas rollo
renivelado
Dentro de la 10 – 15% Enfriamiento Se agregan más 10%
pieza inadecuado del espreas de
rollo rociado
Pieza a pieza 5 – 10% Desconocido Ninguna Ninguna
El costo total de las mejoras fue de $8,000 tomando dos semanas para el proyecto y el
Cp >1 cumpliendo con las especificaciones establecidas.
Página 15 de 61
VIII.4 MODELO LINEAL SIMPLE

Considere el problema de predecir los resultados de una prueba (Y) para los estudiantes
con base las horas de estudio (X) siguiente:
Estudiante Tiempo de estudio (horas) Resultados de prueba (%)

1 60 67
2 40 61
3 50 73
4 65 80
5 35 60
6 40 55
7 50 62
8 30 50
9 45 61
10 55 70
En una gráfica de dispersión indicando la línea de mejor ajuste se tiene con Minitab:
La ecuación matemática de la línea recta es:
𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜖
Fitted Line Plot

Resultados de prueba (%) = 31.21 + 0.6955 Tiempo de estudio (horas)
85 Regression
95% CI
80
S 4.47182
Resultados de prueba (%)
R-Sq 77.0%
75 R-Sq(adj) 74.2%
70
Error
65
60
55
50
45
30 40 50 60 70
Tiempo de estudio (horas)
Página 16 de 61
El error aleatorio es la diferencia entre el valor observado de Y y el valor promedio de Y

para una Xo dada, este error se distribuye normalmente.
En la ecuación, 0 es la intersección con el eje Y, 1 es la pendiente de la línea. Se

asume que para cualquier valor dado de X, los valores observados de Y varían de
manera aleatoria con una distribución normal.
El modelo probabilístico de cualquier valor observado Y es:
Y = (Media de Y para una X dada) + (error aleatorio)
𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜖
Página 17 de 61
Método de mínimos cuadrados
Es el procedimiento para encontrar la línea recta que mejor “ajuste” a los datos, esto se
puede intentar hacer visualmente, tratando de minimizar la diferencia entre los puntos
y la línea, la ecuación de la recta de predicción es:
̂0 + 𝛽
𝑦̂ = 𝛽 ̂1 𝑥 + 𝜖
La respuesta Y y los coeficientes con gorro son los coeficientes estimados de la recta de
regresión con datos de la muestra.
Fitted Line Plot

S 4.47182
80
R-Sq 77.0%
R-Sq(adj) 74.2%
75
Resultados de prueba (%)
70
65
60
55
50
30 40 50 60 70
Tiempo de estudio (horas)
Matemáticamente se trata de minimizar:
sustituyendo el valor estimado de Yi
Los estimadores Beta cero y Beta 1 son:
Página 18 de 61
Una vez calculados Beta 0 y Beta 1, se sustituyen sus valores en la ecuación de la recta
de regresión para obtener la ecuación de predicción de mínimos cuadrados o “línea de
regresión”.
El método manual es el siguiente:
Página 19 de 61
Tips en el análisis de regresión:
 Tener cuidado en redondear errores, usar un mínimo de seis cifras significativas.

 Siempre graficar la línea de regresión, para observar que si no ajusta haya errores
de cálculo
 Extrapolar la recta de regresión puede ser riesgoso, por ejemplo para Xo = 100 se
puede estimar una Y de 100% de calificación, lo cual no es creible.
De la tabla de ANOVA obtenida con Minitab:
Regression Analysis: Resultados de pr versus Tiempo de estudi
The regression equation is

Predictor Coef SE Coef T P

Constant 31.212 6.465 4.83 0.001
Tiempo de estudio (horas) 0.6955 0.1342 5.18 0.001
S = 4.47182 R-Sq = 77.0% R-Sq(adj) = 74.2%
Analysis of Variance
Source DF SS MS F P
Regression 1 536.92 536.92 26.85 0.001
Residual Error 8 159.98 20.00
Total 9 696.90
Página 20 de 61
𝑆𝑆𝐸 = ∑(𝑦𝑖 − 𝑦̂𝑖 )2

𝑖=1
Aquí el cuadrado medio del error MSE = 20 es la desviación estándar del error :
Una estimación de la varianza de los errores o residuales es la siguiente:
En este caso
(𝑆^2𝑥𝑦 )
̂1 𝑆𝑥𝑦 = 𝑆𝑦 2 −
𝑆𝑆𝐸 = 𝑆𝑦 2 − 𝛽
𝑆𝑥 2
𝑛
̅̅̅ ^2
𝑆𝑦 2 = ∑(𝑦𝑖 − 𝑦)
𝑖=1
Con los datos del ejemplo:
SSE = 696.9 – (0.6955)*(772) = 159.97
S^2 = SSE / n – 2 = 159.97 / 8 = 19.99625
S = 4.47
En la figura se cumple que al menos el 95% de los puntos se encuentren en el intervalo

±1.96S (de 8.76) de la línea. Todos los valores se encuentran en este intervalo de ±8.76
respecto a la línea.
Inferencias respecto a la pendiente e intervalo de confianza para 1
La hipótesis nula es:
Se usa el estadístico de prueba:
Página 21 de 61
El denominador de esta ecuación es la desviación estándar de la pendiente.
De los datos del ejemplo se tienen:
0.6955−0
𝑡= =5.18
4.47/√1110
La región crítica se obtiene para una alfa de 0.05 y n – 2 = 8 grados de libertad

t0.025,8 =- 2.306 y t0.975,8 =2.306
Como el estadístico de prueba se encuentra en la zona de rechazo, se rechaza Ho

indicando que la regresión es válida.
El intervalo de confianza (1 − 𝛼) para 1 es:
𝜎
̂𝑒
̂1 ± 𝑡𝛼
𝛽1 = 𝛽 ,𝑛−2
2 √ 𝑆𝑥 2
Por ejemplo con los datos del ejemplo anterior se tiene:
4.47
𝛽1 = 0.6955 ± 2.306 = 0.6955 ± 0.3094 = (0.386, 0.1005)
√1110
Es decir por cada 10 horas de incremento en estudio, el incremento esperado en la

calificación está en el intervalo de 3.86 a 10.05%
Coeficiente de correlación
Es un indicador de la fuerza de la relación lineal entre dos variables Y y X denominado el

coeficiente de correlación de Pearson de producto – momento.
Página 22 de 61
 r se encuentra entre -1 y 1
 El numerador de r es el mismo que para 𝛽1 por tanto tienen el mismo signo y será
cero cuando 𝛽1 = 0
 Un valor positivo de r implica que la recta va hacia arriba a la derecha. Un valor
negativo de r indica que la recta va hacia abajo a la derecha
 Cuando r = 0 no hay correlación, los puntos están muy dispersos alrededor de la
recta, puede ser que haya un patrón curvilíneo
 Cuando r = 1 o -1, todos los puntos se encuentran en la recta y SSE es igual a cero
 Cualquier otro valor de r sugiere el grado en el cual los puntos tienden a estar
relacionados linealmente
Con los datos del ejemplo anterior:
Sxy = 772, Sx = 1,110, Sy^2 = 696.9
772
𝑟= = 0.878
√(1110)(696.9)
Coeficiente de determinación
Es el cuadrado del coeficiente de correlación lineal, o sea:
Con los datos del ejemplo anterior:
𝑟 2 = (0.878)2 = 0.771
Por tanto se decir que el 77% de la variación en calificaciones puede ser explicada por la
variación en horas de estudio.
Página 23 de 61
r2 se encuentra en el intervalo entre 0 y 1.
SST es la suma de cuadrados total (de la media experiemntal) y SSE es la suma de

cuadrado del error (del mejor ajuste). Cuando SSE es cero, r^2 es igual a 1 y cuando SSE
es igual a SST, r^2 es igual a cero.
VIII.5 REGRESIÓN LINEAL MÚLTIPLE
Es una extensión de la regresión lineal simple a más variables independientes, por tanto
se podría explicar una mayor proporción de la variación de y.
El modelo de primer orden es:
Página 24 de 61
EL modelo de segundo orden es:
La tabla ANOVA es (con k número de variables predictoras):
Valor p (p – value)
El método tradicional de prueba de hipótesis compara un estadístico de prueba a un

valor crítico de probabilidad pre – determinado conocido como alfa (). El valor más
común es 5%, aunque también se utiliza 1% para situaciones más críticas.
Un valor – p es la probabilidad de obtener un valor del estadístico muestral de la prueba

que es al menos tan extremo como el encontrado con los datos de la muestra
(asumiendo que el valor hipotetizado es correcto) (Triola, 1994)
O sea que un valor pequeño de p es indicador de que la hipótesis nula es falsa, los
paquetes estadísticos proporcionan el valor exacto de p.
Alfa o valor p Comentarios

P > 5% No hay evidencia de
diferencia significativa
1 < p < 5% Hay diferencia
estadísticamente
Página 25 de 61
significativa
P <= 1% Hay una alta diferencia
estadística significativa
(Langley, 1971)
Ejemplo: tomando los resultados de Minitab del ejemplo anterior se tiene:
Regression Analysis: Resultados de pr versus Tiempo de estudi
Se proporciona la ecuación de regresión, el coeficiente de determinación y los valor P en

regresión y ANOVA.
El valor de p – value del coeficiente Beta 1 de 0.001 indica una ecuación válida y el
estudiante debe dedicar varias horas al estudio. El coeficiente de determianción fue de
0.77 por lo que el coeficiente de correlación es de 0.8775. El valor p – value de la
regresión es de 0.001 indicando que el coeficiente de correlación es significativo.
VIII.6 PRUEBAS DE HIPÓTESIS

1. Conceptos básicos
Se revisan algunos conceptos básicos:
Hipótesis nula
Es la hipótesis que sea probar, se establece a partir del problema y de indica como Ho.
Por ejemplo:
 Al investigar si una semilla mejora el rendimiento. Ho: R1 = R2
 Se trata de probar si el promedio del proceso A es mayor que el promedio del
proceso B. Ho: A <= B
La hipótesis nula solo puede rechazarse o no rechazarse (no se puede aceptar), cuando
se rechaza la Ho, se acepta la hipótesis alterna (su complemento) Ha.
Página 26 de 61
Estadístico de prueba
Para probar la hipótesis nula, se calcula un estadístico de prueba a partir de los datos de
la muestra, para que después se compre con un valor crítico apropiado, para tomar una
decisión sobre la hipótesis nula.
Tipos de errores
Cuando se formulan conclusiones en relación a una población con base en datos de una
muestra, se pueden cometer dos tipos de errores:
 Error tipo I: se comete cuando la Ho es rechazada, siendo en realidad verdadera.

Se denomina error Alfa. Por ejemplo, se rechaza un producto comprado cuando
en realidad es bueno (riesgo del productor).
 Error tipo II: se comete cuando no se rechaza la Ho, cuando en realidad debe ser
rechazada. Por ejemplo se acepta un producto comprado cuando en realidad es
malo (riesgo del consumidor).
El grado de riesgo alfa, normalmente se acuerda entre las partes (siendo el más común
5%) . Es deseable un  bajo sin embargo se incrementa el error . Para un mismo
tamaño de muestra  y  están relacionados inversamente. Al incrementar el tamaño
de muestra se reducen ambos  y .
Página 27 de 61
2. Pruebas de una y dos colas
Cualquier prueba de hipótesis tiene asociado un riesgo  (error tipo I – rechazar Ho

verdadera). Este factor se utiliza para determinar el valor crítico del estadístico de
prueba que se compara con el valor del estadístico muestral calculado.
Prueba de una cola

Si se establece la hipótesis alterna si un valor es más grande o más pequeño que un
valor poblacional, el riesgo alfa se coloca en un lado de la curva de la distribución. Esto
se llama prueba de una cola. Por ejemplo para Ha: Media > 45 horas:
En caso de ser Ha: Media < 20%
Determinar si la media verdadera se encuentra dentro de la región crítica o de rechazo

Alfa.
Página 28 de 61
Prueba de dos colas
Si la hipótesis alterna se establece para probar si ha ocurrido un corrimiento de la

población en cualquier dirección, el error se distribuye en los dos extremos de la curva
normal. Por ejemplo: Ha: Los niveles de salario de la empresa A difieren de los de la B o
Ha: los niveles son  y Ho: los niveles son iguales:
Significancia práctica vs significancia estadística
Las hipótesis se prueban para determinar si la afirmación tiene mérito de significancia

estadística. Tradicionalmente se utilizan valores de 5% y 1% como valores de
significancia crítica. Si el estadístico calculado tiene un valor p por debajo del nivel
crítico, se considera estadísticamente significativo, Cuando se trata de posibles daños al
hombre o pérdidas catastróficas, se requieren valores más estrictos en caso contrario
conviene utilizar valores menos críticos si las ganancias económicas son altas.
Algunas hipótesis se demuestran como significativas estadísticamente, pero es

necesario valorar el esfuerzo o los costos de su implementación. Por ejemplo se
demuestra que una dieta reduce el peso en 0.5 libras para 10,000 personas,
estadísticamente es significativa pero no es de valor práctico reducir 0.5 libras.
Los problemas de significancia estadística ocurren frecuentemente si el tamaño de

muestra no es adecuado, se requiere hacer un análisis de potencia para apoyar el
proceso de decisión.
(Huck, 1996)
Página 29 de 61
Potencia de la prueba (I - )
Considerar una hipótesis nula donde se considera que la media poblacional tiene una
media 0 = 70 y una 𝜎𝑋̅ = 0.8. El intervalo de confianza para un nivel del 95% de
confianza es 70 ± (1.96)*(0.8) = 68.43 y 71.57. Se acepta la hipótesis de que 0 = 70 si la
X media de la muestra se encuentra en esos límites. El riesgo alfa es el que la media de
la muestra exceda esos límites. ¿Qué pasa si se recorre ’0 = 71, se puede detectar este
corrimiento? El riesgo de que la hipótesis sea aceptada aún con el corrimiento de la
media poblacional se denomina riesgo .
El valor de  es grande cuando  es cercano a 0 y pequeño si esta diferencia es grande,

de modo que las diferencias pequeñas serán difíciles detectar y las diferencias grandes
fáciles de detectar, por ejemplo si  se corre de 70 a 71, hay un 76% de probabilidad de
que no sea detectado.
Distribution Plot
Normal, Mean=70, StDev=0.8
0.5
0.4
0.3
Density
0.2
0.1
0.025 0.025
0.0
68.4 70 71.6
X
Página 30 de 61
Distribution Plot
0.5
0.4

0.3
Density
0.762
0.2
0.1
0.0
71 71.57
X
C = criterio de rechazo
En este caso:
𝛼 = 𝑃(𝑋̅ > 𝐶|𝐻𝑜)
 = 𝑃(𝑋̅ < 𝐶|𝐻1)
𝑍𝛼 𝜎
𝐶 = 𝜇𝑜 +
√𝑛
Para construir una curva de potencia de la prueba (1 – beta) contra valores alternativos
de . En general si se incrementa alfa, beta se reduce y la potencia (1 – beta) se
incrementa. En este caso si se toma el caso de dos colas donde se reparte el valor alfa se
tiene:
Página 31 de 61
Distribution Plot
0.5
0.4
0.3
Density
0.2
0.1
0.025 0.025
0.0
68.4 70 71.6
X
C1 = 68.43
C2 = 71.57
𝛼 = 𝑃(𝑋̅ > 𝐶2|𝐻𝑜) + 𝑃(𝑋̅ < 𝐶1|𝐻𝑜)
 = 𝑃( 𝐶1 < 𝑋̅ < 𝐶2|𝐻1)
𝑍𝛼/2 𝜎
𝐶1 = 𝜇𝑜 −
√𝑛
𝑍𝛼/2 𝜎
𝐶2 = 𝜇𝑜 +
√𝑛
𝜇𝑜 − 𝜇1 𝜇𝑜 − 𝜇1
 = 𝐹𝑧 ( + 𝑍𝛼/2 ) − 𝐹𝑧 ( − 𝑍𝛼/2 )
𝜎/√𝑛 𝜎/√𝑛
La gráfica de (1-beta) como función de 1 se conoce como curva de potencia. Que es la

probabilidad de rechazar la hipótesis nula Ho:  = o cuando realmente  = 1, de
modo que es la decisión correcta.
Página 32 de 61
Tomado como referencia a C1 en 68.43 y a C2 en 71.57 para determinar las áreas

sombreadas cuando se cambia la media desde 67 hasta 73 se tiene:
=1-NORMSDIST((71.57-B44)/0.8) + NORMSDIST((68.43-B44)/0.8)
Mu 1 - Beta
67.0 0.9630716
67.2 0.9379146
67.4 0.9010401
67.6 0.8502489
67.8 0.7845066
68.0 0.7045429
68.2 0.6131479
68.4 0.5149939
68.6 0.4159611
68.8 0.3221290
69.0 0.2387355
69.2 0.1694250
69.4 0.1159994
69.6 0.0787007
69.8 0.0568684
70.0 0.0497043
70.2 0.0568684
70.4 0.0787007
70.6 0.1159994
70.8 0.1694250
71.0 0.2387355
71.2 0.3221290
71.4 0.4159611
71.6 0.5149939
71.8 0.6131479
72.0 0.7045429
72.2 0.7845066
72.4 0.8502489
72.6 0.9010401
72.8 0.9379146
73.0 0.9630716
Página 33 de 61
1 - Beta
1.2000000
1.0000000
0.8000000
0.6000000
1 - Beta
0.4000000
0.2000000
0.0000000
67.2
67.6
68.0
68.4
68.8
69.2
69.6
70.0
70.4
70.8
71.2
71.6
72.0
72.4
72.8
Mu
Se puede decir que se gana en potencia al aceptar un valor menor de error alfa. AL
aumentar el tamaño de muestra se reducen tanto los errores alfa como los beta.
El concepto de potencia también se aplica al diseño de experimentos y al análisis de

varianza (ANOVA), donde:
1 – beta = P(rechazar Ho, si realmente es falsa)
Tamaño de muestra
En los ejemplos anteriores se asume que se da alfa y el tamaño de muestra, sin embargo
el procedimiento ideal es primero determinar los errores  y  deseados y con ello
determinar el tamaño de muestra necesario para obtener el nivel de confianza
planeado.
El tamaño de muestra depende de:
 El valor deseado de riesgo para los errores tipo I y tipo 2.

 El valor mínimo a ser detectado entre las medias de la población ( - 0)
Página 34 de 61
 La variación de la característica medida (S o  en datos variables)
Ejemplo:
Se desea conocer en un proceso piloto si un ajuste altera el rendimiento en a lo más 4

toneladas por hora, ¿cuál es el tamaño mínimo de muestra, que a un 95% de nivel de
confianza – Z = 1.96, confirme la significancia de un corrimiento en la media mayor a 4
toneladas por hora. La información histórica sugiere una desviación histórica de 20
toneladas.
Obtener 96 valores de rendimiento por hora y determinar el promedio. Si este

promedio se desvía en más de 4 toneladas por hora del promedio previo, ha ocurrido un
cambio significativo, de otra forma la variación ha sido normal.
Para el caso de proporciones usar:
Z = Valor de Z en función alfa / 2

𝑝̅ = proporción promedio
∆𝑝= intervalo deseado de la proporción (error máximo)
N = tamaño de muestra
Si además del error alfa se especifica el error beta para el caso de una prueba de una
cola se tiene:
𝜎 2 (𝑍𝛼 + 𝑍𝛽 )^2
𝑛≥
(𝜇𝑜 − 𝜇1)^2
Por ejemplo se quiere probar que el tiempo de respuesta de un servidor es de 2 s contra

la hipótesis alterna de 3 s. Las probabilidades de alfa = 0.05 y beta = 0.1 (Zalfa = 1.645 y
Zbeta = 1.28). Si la varianza es de 5.8. El tamaño de muestra es:
Página 35 de 61
5.8(1.645+1.28)^2
𝑛≥ = 50
(3−2)^2
La línea del criterio es:
1.645√5.8
𝐶=2 + = 2.556 s
√𝑛
3. Estimación puntual y por intervalo

Estimación puntual para la media poblacional
Corresponde a la media aritmética:
Ejemplo:
Dados los siguientes valores de tiempos de espera de cuatro clientes: 28.7, 27.9, 29.2 y
26.5
Estimación puntual para la varianza poblacional
La varianza muestral S2 es la mejor estimación puntual de la varianza poblacional 2:
Página 36 de 61
Intervalo de confianza para la media (CI) – sigma conocida
Se usa la media de la muestra, tamaño de muestra y la sigma de la población
Ejemplo: La media de 100 muestras es 18 y la desviación estándar de la población es 6.

Calcular el intervalo de confianza al 95% (Z 0.025 = 1.96)
Intervalo de confianza para la media (CI) – sigma desconocida
Para una muestra pequeña (n < 30) con desviación estándar S, se usa la distribución t de
Student:
Ejemplo: El promedio de 25 muestras es 18 con una desviación estándar de 6, calcular el

intervalo de confianza para la media a un nivel de confianza del 95% (t 0.025, 17 = 2.064).
Intervalo de confianza para una proporción
Para muestras grandes con np y n(1-p) mayores o iguales a 5, la distribución binomial

puede ser aproximada por la distribución normal para calcular el intervalo de confianza
para la proporción poblacional (Z0.05 = 1.645):
Página 37 de 61
Ejemplo: Si 16 defectivos se encuentran en una muestra de 200, calcular el intervalo de

confianza del 90% para la proporción.
Intervalo de confianza para la varianza 2
Dado que se utiliza una distribución Chi cuadrada, este intervalo no es simétrico
respecto al varianza muestral
Ejemplo: La varianza de un grupo de 25 muestras fue de 36. Calcular el intervalo de

confianza del 90% para la varianza (20.05,24 = 36.42, 21-0.05, 24 = 13.85)
Para las desviaciones estándar se tiene:
4. Pruebas de hipótesis
A continuación se muestran las pruebas de hipótesis normales y las de proporciones:
Página 38 de 61
Página 39 de 61
Prueba de hipótesis para la media (sigma conocida)
La hipótesis nula es Ho y la hipótesis nula es H1, el valor fijo de comparación es 0.
Dependiendo del signo de la hipótesis alterna H1, si es > se trata de una

prueba de cola derecha, si es < es una prueba de cola derecha y si es  una
prueba de dos colas.
Página 40 de 61
El estadístico de prueba es:
Ejemplo: el tiempo promedio que una persona ahorra en un banco es de 5 años con una
desviación estándar de 0.12 años. Se verificaron 5 cuentas nuevas resultando en 5.10,
4.90, 4.92. 4.87, 5.09, 4.89, 4.95 y 4.88 ¿Se puede afirmar con un 95% de confianza que
las nuevas cuentas se guardan por un periodo más corto que el original?
es una prueba de cola izquierda
Después de sacar el promedio y la desviación estándar muestral se determina el

estadístico de prueba:
El valor crítico de - Z 0.05 = -1.645

Como el estadístico calculado Zc es mayor al valor crítico y no se encuentra en la región
de rechazo, no puede rechazarse Ho
-1.645 -1.18 0
Página 41 de 61
Prueba de hipótesis para la media (sigma desconocida, muestras pequeñas)
Para este caso se utiliza la distribución t de Student (usada cuando n < 30), su estadístico
de prueba es:
Se sigue el mismo procedimiento que en el caso anterior. El estadístico calculado Tc se

compara con el valor crítico t/2, df = n-1 para una prueba de dos colas o con t, df = n-1 para
pruebas de una cola.
Ejemplo: La media de ingresos de un hospital es de 880. Se está evaluando un nuevo

programa de mercadotecnia durante 25 días (n = 25) con un rendimiento de 900 y
desviación estándar de 20. ¿Se puede decir a un 95% de confianza que el ingreso ha
cambiado?
Se trata de una prueba de dos colas
El estadístico calculado es:
El valor crítico t0.025, 24 = -2.064 y t0.975,24 = 2.064 que definen las zonas de rechazo
Como el valor de tc es mayor al valor t crítico de 2.064, se rechaza la Ho y se concluye al

95% de nivel de confianza que el ingreso ha cambiado.
-2.064 0 2.064 tc = 5
Página 42 de 61
Página 43 de 61
Ejercicio: Una nueva bujía se prueba para desgaste. Una muestra de seis bujías dieron
los resultados siguientes: 58, 49, 44, 50 y 47 milésimas de pulgada de desgaste. El diseño
clásico tiene un desgaste promedio de 55, a un 95% de nivel de confianza ¿es mejor el
nuevo diseño?
Ejemplo: Un experimento muy caro se evalúa para producir diamantes sintéticos por
una nueva técnica, se han generado cinco de ellos con pesos: 0.46, 0.61, 0.52, 0.57 y
0.54 quilates. Si el peso promedio se encuentra por encima de los 0.50 quilates el
proyecto es rentable, probar esto a un 95% de nivel de confianza ¿cuál es la
recomendación?
Pasos de la prueba de hipótesis:
En los ejemplos anteriores, los pasos seguidos fueron:
Paso 1. Establecer las hipótesis Ho y H1 (la Ho siempre lleva el signo =, <=, >=)
Paso 2. Determinar el valor crítico del estadístico con el que se va a comparar (con base
en alfa y n), este define las zonas o zona de rechazo
Paso 3. Calcular el estadístico de prueba con los datos de la muestra
Paso 4. Si el estadístico calculado cae en la zona de rechazo, rechazar Ho de otra forma

no habrá evidencia suficiente para rechazarla
Página 44 de 61
Pruebas de hipótesis de dos medias – varianzas iguales
Prueba la diferencia entre 2 medias muestrales cuando se conocen las varianzas de las
poblaciones y se consideran iguales.
Las hipótesis son las siguientes:
Con Sp = desviación estándar conjunta
Ejemplo: Comparar el peso de productos en dos máquinas
Máquina 1 Máquina 2
3.125 3.11
3.12 3.095
3.135 3.115
3.13 3.12
3.125 3.125
̅̅̅1 = 3.127
𝑋
𝑆1 = 0.0057
̅̅̅2 = 3.113
𝑋
𝑆2 = 0.0115
4(0.0057)2 +4(0.0115)^2
𝑆𝑝 = √ = 0.0091 df. = 5 + 5 = 8
8
3.127 − 3.113
𝑡= = 2.43
1 1
0.0091√ +
5 5
El valor crítico para t0.025,8 = 2.3096 (prueba de dos colas), se rechaza la Ho
Página 45 de 61
Pruebas de hipótesis de dos medias – varianzas diferentes
Prueba la diferencia entre 2 medias muestrales cuando se conocen las varianzas de las
poblaciones y se consideran iguales.
Las hipótesis y fórmulas son las siguientes:
Ejemplo: Comparar el peso de productos en dos máquinas
Máquina 1 Máquina 2
3.125 3.11
3.12 3.095
3.135 3.115
3.13 3.12
3.125 3.125
̅̅̅1 = 3.127
𝑋
𝑆1 = 0.0057
̅̅̅2 = 3.113
𝑋
𝑆2 = 0.0115
DF = 5.83, si se redondea hacia abajo, tiende a incrementarse el nivel de confianza
3.127 − 3.113
𝑡= = 2.44
√(0.0057)^2 + (0.0115)^2
5 5
El valor crítico para t0.025,5 = 2.571 (prueba de dos colas), no se rechaza la Ho (a pesar de
estar muy cerca)
Página 46 de 61
Prueba t pareada
Se utiliza para probar la diferencia entre dos medias muestrales de tratamientos a los
mismos sujetos. Los datos se toman en pareas y se calcula la diferencia de cada par.
Ejemplo: Calcular si hay diferencia a un 95% de nivel de confianza con dos operadores
que miden el mismo grupo de muestras:
En este caso se rechaza la Ho
Prueba de una proporción – prueba p
Se aplica cuando el número de intentos es fijo e independiente y la probabilidad de

éxito se mantiene constante. Cuando np < 5 o n(1-p) < 5 se usa la distribución binomial
para hacer las pruebas en relación a la proporción.
Si np >= 5 o n(1-p) >= 5 se usa la distribución normal como aproximación a la binomial,

las hipótesis son:
Página 47 de 61
Donde el número de éxitos es X y el número de muestras es n. El estadístico de prueba

es Zc y el valor crítico a comparar es Z/2 o Z
Prueba Chi cuadrada (2) para un varianza
Cuando la población es normal, las pruebas de hipótesis para comparar una varianza
poblacional 2x con un valor 2o fijo son:
Este estadístico de prueba se compara con el valor crítico 2 o 2/2 dependiendo si la
prueba es de una o dos colas, los grados de libertad son d.f. = n – 1.
Dependiendo del signo de la hipótesis alterna H1, si es > se trata de una

prueba de cola derecha, si es < es una prueba de cola derecha y si es  una
prueba de dos colas.
Caso I. Prueba de una varianza

Ejemplo: La variación a la tensión de un nuevo material de acero ¿es menor o igual a 60
psi a un 95% de confianza (sigma = 15). Ocho muestras tuvieron una desviación estándar
de 8 psi.
Página 48 de 61
prueba de cola izquierda
Con n=1 = 7 grados de libertad y un nivel de significancia de 5% el valor crítico es menor

a 2.17.
El estadístico calculado es:
Como X2c en mayor al valor crítico, la variación es menor en el nuevo acero.
Tabla de contingencia
Caso II. Prueba de igualdad de proporciones
Es frecuente comparar proporciones que representan las condiciones de varios procesos

(habilidad de inspectores, calidad de máquinas para producir productos aceptables,
etc.), el método se denomina Tabla de contingencia.
Se sigue el procedimiento siguiente:

1. Tomar un subgrupo de cada proceso y determinar las frecuencias observadas (O)
2. Calcular para una de las condiciones las frecuencias esperadas (E )
Ei = Total de renglón i *Total de columna i / Gran total
3. Comparar las frecuencias observadas y las esperadas para obtener “realidad”.
(Oi – Ei) / Ei
4. Sumar todas las condiciones de proceso
5. Se determina el valor crítico usando la tabal de Chi cuadrada. El estadístico Chi

cuadrado de frecuencias observadas (O) y esperadas (E ) con grados de libertad (R-1)(C-
Página 49 de 61
1) – R filas, C – columnas, con todo el nivel de significancia  en el lado derecho de la

distribución.
6. Se hace una comparación entre el estadístico de prueba y el valor crítico para

confirmar si existe una diferencia significativa (a un nivel de confianza seleccionado).
Ejemplo: en un aeropuerto se quiere evaluar la habilidad de 3 inspectores para detectar

por rayos X radios de transistores en las maletas:
¿hay diferencia significativa en las habilidades de los inspectores a un 95% de nivel de

confianza?
Las hipótesis en relación con las proporciones son:
Ho: No hay diferencia entre inspectores,

H1: Si hay diferencia entre inspectores
Los grados de libertad DF = (filas – 1) (columnas -1) = (2-1)(3-1) = 2
El valor crítico de 20.05,2 =5.99
El valor esperado del estadístico calculado es:
Página 50 de 61
Como el estadístico calculado de Chi cuadrada es menor que su valor crítico de 5.99, la
hipótesis nula no puede ser rechazada indicando que no evidencia suficiente para decir
que las habilidades de los inspectores son diferentes.
Prueba de igualdad de dos varianzas F
Si se extraen dos muestras independientes de dos poblaciones normales con varianzas

iguales, la relación S12/ S22 crea una distribución muestral conocida como la distribución
F. Las pruebas de hipótesis para comparar las varianzas de dos poblaciones se da a
continuación:
Los grados de libertad asociados a las varianzas de las dos muestras se representan por
1 y 2 respectivamente.
El estadístico F es la relación de las dos varianzas muestrales (dos distribuciones Chi

cuadrada) como sigue:
Por costumbre se toma la varianza S12 como la mayor respecto a S22 . Para esta prueba
se utilizan las tablas F, abajo se muestra la de =0.05.
Página 51 de 61
Los valores críticos para F pueden se usados con una cola (=0.05, 95% de confianza) o
con dos colas (/2=0.05, 90% de confianza).
La gráfica de la distribución F se muestra a continuación:
Ejemplo: Si S1 = 900 psi, n1 = 9, S2 = 300 psi, n2 = 7. A un 95% de nivel de confianza, ¿se

puede concluir que ahora hay menor variación?
Grados de libertad 1 = 8, Grados de libertad 2 = 6.
Usando todo el riesgo alfa del lado derecho, el valor crítico de F es F0.05, 8, 6 = 4.15, este
valor define donde inicia la zona de rechazo.
Página 52 de 61
El estadístico F calculado es:
Fc = 900^2/300^2 = 9
Por tanto se rechaza Ho y hay evidencia suficiente para decir que la variación se ha
reducido.
Resumen de pruebas de inferencia estadística
Página 53 de 61
VIII.7 ANÁLISIS DE VARIANZA

ANOVA – UNA VÍA
En muchas investigaciones es necesario comparar tres o más medias poblacionales

simultáneamente, los supuestos antes de realizar la prueba son:
 La varianza es la misma para todos los tratamientos o niveles del factor

 Las mediciones individuales dentro de cada tratamiento están normalmente
distribuidas
 El término de error o residuales se considera que tienen un efecto aleatorio
normal e independientemente distribuido.
http://www.uncp.edu/home/frederick/DSC510/m510ANOVA.htm
Con el ANOVA, las variaciones en las mediciones de la respuesta se particionan en

componentes que reflejan el efecto de una o más variables independientes. La
variabilidad de un conjunto de mediciones es proporcional a la suma de cuadrados de
las desviaciones usadas para calcular la varianza.
El ANOVA particiona la suma de cuadrados de las desviaciones de las mediciones

individuales de la gran media (suma de cuadrados totales) en partes: la suma de
Página 54 de 61
cuadrados de las medias de los tratamientos más un residuo denominado error

aleatorio o experimental.
Donde:
Suma de cuadrados cruda
Factor de corrección de la media (CF)
Suma de cuadrados total o suma de cuadrados

corregida
Varianza (N = datos toales)
Fórmulas
Página 55 de 61
Página 56 de 61
Ejemplo: Se comparan las salidas de tres máquinas, determinar is hay una diferencia
significativa en los resultados con =0.05.
La Tabla ANOVA es la siguiente:
Fuente de
SS DF MS F
variación
Máquinas 137.2 2 68.6 33.2
Error 24.8 12 2.067
Total 162 14
Como el valor calculado de F(33.2) excede el valor crítico de F, se rechaza la Hipótesis

nula, hay evidencia de que existe una diferencia real entre las medias de las máquinas.
e es la desviación estándar conjunta de la variación dentro de los tratamientos. Se

puede considerar también la sigma de capacidad del proceso de las mediciones
individuales, es la variación que permanecería aun si se eliminara la diferencia entre
tratamientos.
Página 57 de 61
ANOVA – DOS VÍAS
El ANOVA de dos vías es una continuación del ANOVA de una vía. En el ANOVA de dos
vías hay tres componentes de varianza: Tratamientos del factor A, Tratamientos del
factor B y error experimental (se refiere como columnas, renglones y error).
Materiales de estudio
Instructor 1 2 3 Suma n Promedio Cuadrado
88 68 76
84 62 70
1 690 9 76.667 52900
92 72 78
60 44 60
68 50 52
2 500 9 55.556 27778
58 52 56
Suma 450 348 392 1190 80678

n 6 6 6 18
Promedio 75 58 65.33
Cuadrado 33750 20184 25610.7 79544.7
Suma X^2 34852 20792 26200 81844
Las hipótesis nulas son: El instructor y los materiales de estudio no difieren
Suma X = 1190 N = 18 DF = 17 Gran media (GM) = 1190 / 18 = 66.11
CM = (Suma X)^2 / N = (1190^2) / 18 = 78672.22 Suma (X^2) = 81844
SS total = Suma (X^2) – CM = 81844 – 78672.22 = 3171.78
SSCol = Suma Cuadrados Columnas – CM = 79544,67 – 78672.22 = 872.44
SSReng = Suma Cuadrados Renglones – CM = 80677.78 – 78672.22 = 2005.56
SSE = SS total – SS Col – SS Reng = 3171.78 – 872.44 -2005.56 = 293.78
La Tabla ANOVA de dos vías es la siguiente:
Fuente SS DF MS F F0.05, 1, 2

Columnas
872.44 2 436.22 20.8 F0.05, 2,14= 3.74
(materiales)
Filas
2005.56 1 2005.56 95.6 F0.05, 1,14= 4.6
(instructor)
Página 58 de 61
Error 293.78 14 20.98

Total 17
Como la F del instructor 95.6 excede a la F crítica de 4.6, se rechaza la Ho y hay

diferencias en instructores.
Como la F de los materiales de 20.8 excede a la F crítica de 3.74, se rechaza la Ho y hay

diferencias en instructores.
La sigma del error es la raíz de 20.98 = 4.58
La sigma total es la raíz de SS Total / (N – 1) = 13.66
La diferencia entre sigmas total y del error se debe a la diferencia significativa de los
instructores y loa materiales de estudio. Si no hubiera habido diferencias significativas,
las sigmas hubieran sido similares.
VIII.8 OTRAS HERRAMIENTAS

ANÁLISIS DE CAUSA RAÍZ
L a solución a un problema puede tomar varios pasos:
Situación Acción inmediata Acción intermedia Acción de causa

raíz
La presa tiene fuga Taparle Poner un parche Buscar la causa de
la fuga y reconstruir
la presa
Partes fuera de Inspección 100% Poner un Analizar el proceso

especificaciones dispositivo de y tomar acción para
prueba en la línea eliminar la
producción de
partes defectuosas
Para ayudar a localizar el problema verdadero del sistema, se pueden utilizar diversas
herramientas como son:
Herramientas subjetivas Herramientas analíticas

Preguntar porqué, porqué, porqué,…. Colección y análisis de datos
Tormenta de ideas Análisis de Pareto
Página 59 de 61
Análisis de flujo de proceso Análisis de regresión

Planear –hacer – verificar – actuar Hojas de verificación
Solución sistemática de problemas Matriz de análisis de datos
Técnica de grupo nominal Análisis de capacidad de procesos
Observación de operador Partición de variación
Diagramas de causa efecto Subgrupos de datos
Ejercicios de consenso Experimentos simples
Seis sombreros de pensamiento Diseño estadístico de experimentos
Uso de equipos Pruebas analíticas (Chi cuadrada, F, Z, t)
FMEA / Árbol de fallas Cartas de control
Cuando se proponen acciones correctivas permanentes, la administración debe

determinar si:
 El análisis de causa raíz ha identificado la extensión completa del problema
 La acción correctiva es satisfactoria para eliminar o prevenir la recurrencia
 La acción correctiva es realista y mantenible
LOS CINCO POR QUÉS
El método de los 5 porqués para el análisis de causa raíz se describe como hacer cinco
veces la pregunta ¿Porqué?, por ejemplo:
Síntoma: Los embarques al cliente no llegan a tiempo:
1. ¿Por qué? Nos atrasamos porque falló la troqueladora

2. ¿Por qué? No se le ha dado mantenimiento durante tres meses
3. ¿Por qué? Se redujo el personal de mantenimiento de ocho a seis personas
4. ¿Por qué? El departamento de mantenimiento excedió su presupuesto por los costos
de tiempo extra, el director eliminó el tiempo extra y pidió una reducción del 25%
5. La empresa no logró los resultados planeados de modo que el director ordenó evitar
todos los gastos innecesarios
Las cinco preguntas no son mandatorias, si no hay necesidad de preguntar más pararle y
si hay necesidad hacer más preguntas.
Página 60 de 61
5Ws – 1H (o 2H)
Es una técnica ya común, se originó con periodistas que preguntaban para conseguir la
historia completa, se trata de preguntar ¿Quién?, ¿Qué?, ¿Cuándo?, ¿Dónde?, ¿Por
qué? Y ¿Cómo?. En el área de calidad se aplica en cada rama del diagrama de Ishikawa
para llegar a la causa raíz.
El orden de las Ws varia dependiendo la fuente de referencia. La técnica busca en un

problema o síntoma desde varios puntos de vista de modo de incluir tanta información
como sea requerida para ayudar a determinar la causa raíz.
Análisis del modo y efecto de falla (AMEF)
Herramienta para anticipar acciones preventivas a problemas potenciales
ANALISIS DEL MODO Y EFECTO DE FALLA

AMEF de Diseño / Proceso
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de FMEA ______(rev.) ______
Resultados de Acción
O Controles de D
Función S Causa(s)
Efecto (s) c Diseño o e R Responsable S O D R
del Producto/ Modos de Falla e Potencial(es) Acción Acción
Potencial (es) c Proceso t P y fecha límite e c e P
Paso del Potenciales v o Mecanismos Sugerida Adoptada
de falla u Actuales e N de Terminación v c t N
proceso . de falla
r c
Página 61 de 61

Fase Analisis

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Fase Analisis

Загружено:

Авторское право:

Доступные форматы

VIII.

Dr. Primitivo Reyes Aguilar /

3. Estimación puntual y por intervalo ........................................................................... 36

VIII. FASE DE ANÁLISIS

Los objetivos de esta fase son:

 Aprender el uso de las herramientas de la fase de análisis.

Las herramientas que se incluyen en esta fase son:

No. Herramienta ¿Para qué es utilizada?

Sirve para predecir el valor de una variable a

Para probarla significancia del efecto de

una serie de preguntas combinadas para

La fase de análisis consta de las siguientes etapas:

Identificar las fuentes de variación.-

Cuando un proceso se encuentra fuera de las especificaciones permitidas, se tiene

Variación Actual del Proceso Variación del Proceso de Medición

Exactitud Precisión Discriminación

Figura 1 Posibles fuentes de variación del proceso.

FASE DE ANÁLISIS RESUMEN

o Guía de oportunidades de mejora

Resumen de la validación de las causas

VIII.2 LOS 7 DESPERDICIOS

Se refiere a producir de más en un momento dado, se caracteriza por:

 Producir más de lo que necesita el siguiente proceso o cliente

Si no se produce JIT se incurre en gastos adicionales como son:

 Espacio extra utilizado en la planta del cliente

La reparación o retrabajo de partes defectivas son una segunda oportunidad de producir

Varios cambios de diseño pueden ser muda también si generan retrabajos y

La ergonomía puede eliminar factores en el lugar de trabajo que causen dañios y

 Énfasis en seguridad todo el tiempo

 Remover rebabas del proceso de manufactura

VIII.3 ANÁLISIS MULTI-VARI

 Seleccionar el proceso y la característica a ser investigada

Se presentan otros tres ejemplos:

Se presenta una variabilidad excesiva dentro de la pieza (cónica)

Menor variabilidad dentro de la pieza (el centro es más grueso)

La variación se incrementa con el tiempo (la parte se hace más grande)

 Puede resaltar la variación dentro la pieza (posicional)

Producto / Proceso bajo consideración

La variación posicional se puede dividir en componentes:

Cilindro Extremo a extremo, no redondez en cada extremo

Se hace un estudio Multi-vari para analizar el problema. Se hacen 4 mediciones dentro

Parece que la variación en el tiempo es la mayor, las contramedidas se muestran a

Tipo de % de variación Variación y Corrección de % de reducción

VIII.4 MODELO LINEAL SIMPLE

Estudiante Tiempo de estudio (horas) Resultados de prueba (%)

La ecuación matemática de la línea recta es:

Fitted Line Plot

El error aleatorio es la diferencia entre el valor observado de Y y el valor promedio de Y

En la ecuación, 0 es la intersección con el eje Y, 1 es la pendiente de la línea. Se

El modelo probabilístico de cualquier valor observado Y es:

Y = (Media de Y para una X dada) + (error aleatorio)

Método de mínimos cuadrados

Fitted Line Plot

Matemáticamente se trata de minimizar:

sustituyendo el valor estimado de Yi

Los estimadores Beta cero y Beta 1 son:

El método manual es el siguiente:

Tips en el análisis de regresión:

 Tener cuidado en redondear errores, usar un mínimo de seis cifras significativas.

De la tabla de ANOVA obtenida con Minitab:

Regression Analysis: Resultados de pr versus Tiempo de estudi

The regression equation is

Predictor Coef SE Coef T P