Академический Документы
Профессиональный Документы
Культура Документы
Derechos reservados
Primera Edición: Enero 2014
Tiraje: 500 ejemplares
PRESENTACIÓN DE LA ASIGNATURA 9
COMPETENCIA DE LA ASIGNATURA 9
UNIDADES DIDÁCTICAS 9
TIEMPO MÍNIMO DE ESTUDIO 9
Lectura Seleccionada N° 1 28
¿Funciona la terapia de contacto? Mario Triola. pp. 319 28
ACTIVIDAD N°1 29
Tema N° 2: ESTIMACIÓN Y TAMAÑOS DE MUESTRA 29
1 Estimación de la proporción poblacional 31
2 Estimación de la media poblacional 31
CONTROL DE LECTURA N° 1 39
glosario DE LA UNIDAD I 39
bibliografía DE LA UNIDAD I 40
AUTOEVALUACIóN DE LA UNIDAD I 40
Lectura Seleccionada N° 1 67
La paradoja del cumpleaños Blog Estadística para todos
ACTIVIDAD N° 1 68
ACTIVIDAD N° 2 68
TAREA ACADÉMICA Nº 1 68
GLOSARIO DE LA UNIDAD II 69
BIBLIOGRAFÍA DE LA UNIDAD II 69
AUTOEVALUACIÓN de la unidad ii 69
ACTIVIDAD N° 1 133
Actividad Nº 2 133
TAREA ACADÉMICA Nº 2 133
glosario DE LA UNIDAD IV 134
Bibliografía de la unidad IV 136
AUTOEVALUACIóN DE LA UNIDAD IV 137
ANEXO: Claves de las autoevaluaciones 140
6
INTRODUCCIÓN
T
odos los conceptos y aplicaciones vertidos en el curso Es importante manejar adecuadamente los procedimientos y
anterior de Estadística I tales como tablas de frecuen- métodos que utiliza la estadística inferencial pues no debemos
cia, gráficos, cálculo de medidas descriptivas se pueden olvidar que sus resultados serán utilizados por diferentes enti-
resumir dentro de un término general que vendría a ser ESTA- dades y personas quienes se basarán en ellos para poder tomar
DÍSTICA DESCRIPTIVA, debido que a través de ellos podemos decisiones y nosotros tenemos la obligación moral de entregar la
describir, presentar y resumir esencialmente el comportamiento información lo más clara y entendible posible sin necesidad de
de una serie de datos que han sido recolectados con algún pro- tergiversarla ni modificarla.
cedimiento adecuado. El presente Manual Autoformativo de ESTADÍSTICA II está
Si embargo a través de la ESTADÍSTICA DESCRIPTIVA no se diseñado para que el lector pueda adquirir los conocimientos
puede aclarar interrogantes acerca de una población cuando necesarios para poder ejecutar los procesos relacionados con la
no se dispone de ella y solo se tiene parte de ella, o sea de una estimación y prueba de hipótesis estructurados en cuatro unida-
muestra. Por ejemplo si sabemos que el rendimiento promedio des. En la primera unidad aprenderemos a realizar los distintos
de una muestra de automóviles de cierto modelo y marca es de métodos de muestreo que validen nuestro trabajo y el cálculo de
55 km. por galón, ¿qué podremos concluir acerca de todos los intervalos de confianza a través de las estimaciones, en la segun-
automóviles producidos de dicha marca y modelo? da unidad aplicaremos las pruebas de hipótesis a través de los
Para poder dar una conclusión acerca de la población, la Esta- métodos paramétricos, en la tercera unidad continuaremos con
dística dispone de una serie de procedimientos y métodos que las pruebas de hipótesis pero utilizando métodos no paramé-
se resumen en un término general que es el de ESTADÍSTICA tricos y finalizaremos la cuarta unidad desarrollando el análisis
INFERENCIAL, la cual determina específicamente la probabili- de correlación y regresión el cual nos permitirá realizar algunos
dad de que una conclusión obtenida a partir de una muestra sea pronósticos sobre el comportamiento de alguna variable.
válida para toda la población de la cual proviene, basados todos Agradecemos a quienes de antemano tuvieron paciencia y com-
ellos en la Estimación y Prueba de Hipótesis que serán motivo de prensión en la elaboración del presente manual y a aquellos
estudio en las páginas siguientes. alumnos con quienes pudimos optimizar el uso de la informa-
ción presente en esta primera edición.
8
ESTADÍSTICA II
Desarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
9
PRESENTACIÓN DE LA ASIGNATURA
ESTADÍSTICA II
Recordatorio Anotaciones
Diagrama Objetivos Inicio
COMPETENCIA DE LA ASIGNATURA
UNIDADES DIDÁCTICAS
Recordatorio Anotaciones
UNIDAD Nº I UNIDAD Nº II UNIDAD Nº III UNIDAD Nº IV
Desarrollo
UNIDAD I: MUESTREO Y ESTIMACIÓN DE PARÁMETROS
Actividades Autoevaluación
de contenidos
Recordatorio Anotaciones
Lecturas
seleccionadas DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD I
Glosario Bibliografía
CONTENIDOS
Recordatorio
Desarrollo
Anotaciones
Actividades Autoevaluación EJEMPLOS ACTIVIDADES
de contenidos
Lecturas
seleccionadas
Glosario AUTOEVALUACIÓN
Bibliografía BIBLIOGRAFÍA
Recordatorio Anotaciones
Autoevaluación de la Unidad I
ollo
nidos 12
Actividades Autoevaluación UNIDAD I: MUESTREO Y ESTIMACIÓN DE PARÁMETROS
as Glosario Bibliografía
nadas
TEMA N° 1: DISEÑO Y TÉCNICAS DE MUESTREO PROBABILÍSTICO
1 DEFINICIONES BÁSICAS11
torio Anotaciones
1.1. Unidad elemental
Es el elemento o unidad base de la población o de la muestra que permite ob-
tener información o datos referidos a ciertas características o variables que nos
interesan para explicar determinado fenómeno.
También es llamada unidad de observación, unidad de análisis, unidad estadís-
tica, caso o elemento. Por ejemplo, en estudios de satisfacción del cliente en
una tienda de retails, la unidad elemental es cada consumidor.
1.5. Censo
Es una investigación estadística que consiste en el recuento de la totalidad de
los elementos que componen la población a investigar. Es necesario que se
especifique el espacio y el tiempo al que se refiere el recuento.
1.6. Muestreo
Conjunto de métodos y procedimientos estadísticos destinados a la selección
de una o más muestras. Es la técnica elegida para seleccionar a la muestra. El
objetivo principal de un diseño de muestreo es proporcionar procedimientos
para la selección de muestras que sean representativas de la población en es-
tudio.
El muestreo comprende por lo menos dos etapas:
La selección de las unidades
El registro de las observaciones.
FICHA TÉCNICA
Título del estudio: Encuesta de Opinión en Lima Metropolitana Noviembre
2009
Objetivos del Estudio: Evaluación y opinión sobre la situación económica
Encuestadora: Pontificia Universidad Católica del Perú
Nº de registro: 0108 REE/JNE
Representatividad: En los distritos que forman parte del universo y que están
incluidos en el marco muestral se encuentra el 95.88% de la población electo-
ral total de la provincia de Lima.
as Glosario Bibliografía
nadas
Limitaciones
• Requiere de una lista precisa de las unidades de muestreo, que puedan identi-
ficarse y numerarse. Se puede, tal vez, numerar cada expediente de un proce-
dimiento de compras, pero no se puede enumerar ni identificar exhaustiva-
mente a los pacientes ambulatorios que van a atenderse a un hospital público
en determinado momento.
• Cada unidad de muestreo debe tener la misma probabilidad de ser elegido
que cualquier otra unidad.
• Es poco económico frente a determinadas circunstancias, como cuando
llevar a cabo un procedimiento de auditoría implica la destrucción de la uni-
dad muestreada. En estos casos, el muestreo aleatorio simple ofrece tamaños
de muestra mayores que otros métodos más específicos.
ESTADÍSTICA II
UNIDAD I: MUESTREO Y ESTIMACIÓN DE PARÁMETROSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
15
Recordatorio Anotaciones
Ejercicio 1
Una empresa de alimentos tiene registrado en el cuadro siguiente, información acerca
del ingreso mensual (en nuevos soles) y años cumplidos en la empresa de cada uno de
sus 150 trabajadores.
1 2600 16 Secundaria
2 1700 0 Secundaria
3 2500 12 Secundaria
4 1700 3 Secundaria
5 2400 17 Secundaria
6 2400 16 Secundaria
7 1900 7 Secundaria
8 1700 1 Secundaria
9 2100 6 Secundaria
10 2000 5 Secundaria
11 2000 3 Secundaria
12 2500 13 Secundaria
13 1700 0 Secundaria
14 2500 19 Secundaria
15 1700 3 Secundaria
16 2600 19 Secundaria
17 1600 1 Secundaria
18 1800 6 Secundaria
19 2100 10 Secundaria
20 1700 0 Secundaria
21 2400 16 Secundaria
22 2600 17 Secundaria
23 2100 10 Secundaria
24 2100 8 Secundaria
as Glosario Bibliografía
nadas
25 2400 17 Secundaria
26 1700 1 Secundaria
torio Anotaciones 27 2600 20 Secundaria
28 2400 16 Secundaria
29 2700 17 Secundaria
30 2100 12 Secundaria
31 1600 0 Secundaria
32 2100 15 Secundaria
33 1900 5 Secundaria
34 2100 12 Secundaria
35 2200 12 Secundaria
36 2400 13 Secundaria
37 1800 4 Secundaria
38 2600 17 Secundaria
39 2700 20 Secundaria
40 2500 16 Secundaria
41 2500 16 Secundaria
42 1900 6 Secundaria
43 2100 15 Secundaria
44 1700 9 Secundaria
45 1500 0 Secundaria
46 1800 18 Secundaria
47 2100 10 Secundaria
48 2700 19 Secundaria
49 1800 9 Secundaria
50 2100 1 Secundaria
51 1700 0 Técnica
52 1600 2 Técnica
53 2600 17 Técnica
54 2500 13 Técnica
55 2500 16 Técnica
56 2700 17 Técnica
57 1700 1 Técnica
58 1600 1 Técnica
59 2400 11 Técnica
ESTADÍSTICA II
UNIDAD I: MUESTREO Y ESTIMACIÓN DE PARÁMETROSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
17
60 1900 3 Técnica
61 1800 5 Técnica
62 1800 3 Técnica Recordatorio Anotaciones
63 2400 14 Técnica
64 2600 16 Técnica
65 2700 18 Técnica
66 2100 11 Técnica
67 2300 14 Técnica
68 1700 0 Técnica
69 2200 13 Técnica
70 2900 20 Técnica
71 1800 5 Técnica
72 2100 16 Técnica
73 2000 12 Técnica
74 2000 12 Técnica
75 2900 20 Técnica
76 2300 5 Técnica
77 2800 11 Técnica
78 2400 4 Técnica
79 2500 2 Técnica
80 2300 3 Técnica
81 2100 2 Técnica
82 1700 2 Técnica
83 2000 0 Técnica
84 2200 7 Técnica
85 2100 4 Técnica
86 1700 0 Técnica
87 2500 2 Técnica
88 2800 13 Técnica
89 2400 9 Técnica
90 1700 1 Técnica
91 2400 9 Técnica
92 2200 10 Técnica
93 2200 4 Técnica
94 2300 10 Técnica
95 2800 11 Técnica
96 2100 7 Técnica
97 1700 1 Técnica
98 2500 6 Técnica
99 2400 9 Técnica
100 2700 17 Técnica
ollo
nidos 18
Actividades Autoevaluación UNIDAD I: MUESTREO Y ESTIMACIÓN DE PARÁMETROS
as Glosario Bibliografía
nadas
a. S
eleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Use
las columnas
C4, C8, C12 y C16 de la tabla de números aleatorios.
b. Seleccione
una muestra de diez trabajadores usando muestreo simple aleatorio. Use
las columnas
C5, C9, C13 y C15 de la tabla de números aleatorios.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
ollo
nidos 20
Actividades Autoevaluación UNIDAD I: MUESTREO Y ESTIMACIÓN DE PARÁMETROS
as Glosario Bibliografía
nadas
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
torio Anotaciones
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Limitaciones
•E
s equivalente a un muestreo agrupado del que se extrae un solo grupo, por
lo que pierde robustez en cuanto a la representatividad esperada. Para in-
tentar neutralizar este efecto, su puede elegir más de un grupo (en términos
prácticos, habrá de elegirse una unidad “A” situada entre 1 y k, y al menos
una unidad “B” ≠ “A”, también situada entre 1 y k y seguir el procedimiento
de extracción a partir de “A” y de “B”). No obstante, esto atenta contra la
eficiencia del plan ya que implica un derroche de recursos frente al muestreo
aleatorio simple.
•N
o permite identificar periodicidad oculta. Por ejemplo, frente a mayores
ventas los primeros sábados del mes, o asignaciones de planes sociales
antes de fin de mes.
•N
o permite identificar sistematicidad oculta. Por ejemplo, considérese un
diente defectuoso en un engranaje, y que ese diente incida sobre cierto lote
de productos.
ESTADÍSTICA II
UNIDAD I: MUESTREO Y ESTIMACIÓN DE PARÁMETROSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
21
Recordatorio Anotaciones
Ejemplo
Se tiene una población de 40 personas y se desea elegir a cinco de ellas median-
te un muestreo sistemático. ¿Cuál es el arranque aleatorio para este ejemplo?
Seleccione la muestra indicando la posición de cada elemento elegido.
Ejemplo
Se tiene información de 40 alumnos del curso de Estadística II del ciclo regular.
Obtenga una muestra aleatoria de ocho personas usando el muestreo sistemáti-
co y elabore una tabla con los elementos seleccionados.
as Glosario Bibliografía
nadas
25 Hombre 31 187
26 Mujer 28 161
torio Anotaciones 27 Mujer 19 172
28 Hombre 31 162
29 Hombre 33 147
30 Hombre 17 167
31 Mujer 34 69
32 Mujer 20 76
33 Mujer 26 74
34 Hombre 25 90
35 Mujer 23 164
36 Hombre 20 164
37 Mujer 34 176
38 Hombre 35 188
39 Mujer 30 155
40 Mujer 29 141
Ejercicio 2
Una empresa de alimentos (la misma del ejercicio 1) tiene un total de 150 em-
pleados y ha registrado en la tabla que se muestra a continuación información
acerca de las variables: ingreso mensual (en soles), nivel de educación y años
cumplidos en la empresa.
Aplique el muestreo sistemático para seleccionar una muestra de ocho emplea-
dos. Elabore un listado con la muestra seleccionada.
Recordatorio Anotaciones
Limitaciones
Cálculos complejos para estimar la precisión.
Ejemplo
La empresa embotelladora DEL VALLE tiene 120 empleados de los cuales tie-
ne información de las variables: ingreso en soles, tipo de profesión y años en
la empresa.
as Glosario Bibliografía
nadas
20 2000 C.EMPRESA 11
21 2000 C.EMPRESA 7
torio Anotaciones 22 2500 C.EMPRESA 1
23 1700 C.EMPRESA 6
24 2500 C.EMPRESA 9
25 1700 C.EMPRESA 17
26 2600 C.EMPRESA 0
27 1600 C.EMPRESA 2
28 1800 C.EMPRESA 17
29 2100 C.EMPRESA 13
30 1700 C.EMPRESA 16
31 2400 INGENIERÍA 11
32 2600 INGENIERÍA 14
33 2100 INGENIERÍA 0
34 2100 INGENIERÍA 13
35 2400 INGENIERÍA 20
36 1700 INGENIERÍA 5
37 2600 INGENIERÍA 16
38 2400 INGENIERÍA 12
39 2700 INGENIERÍA 12
40 2100 INGENIERÍA 20
41 1600 INGENIERÍA 13
42 2100 INGENIERÍA 9
43 1900 INGENIERÍA 1
44 2100 INGENIERÍA 9
45 2200 INGENIERÍA 10
46 2400 INGENIERÍA 4
47 1800 INGENIERÍA 10
48 2600 INGENIERÍA 11
49 2700 INGENIERÍA 7
50 2500 INGENIERÍA 1
51 2500 INGENIERÍA 1
52 1900 INGENIERÍA 6
53 2100 INGENIERÍA 17
54 1700 INGENIERÍA 9
55 1500 INGENIERÍA 19
56 1800 INGENIERÍA 7
57 2100 INGENIERÍA 0
58 2700 INGENIERÍA 3
59 1800 INGENIERÍA 14
60 2100 INGENIERÍA 0
ESTADÍSTICA II
UNIDAD I: MUESTREO Y ESTIMACIÓN DE PARÁMETROSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
25
61 2300 INGENIERÍA 15
62 2800 INGENIERÍA 1
63 2400 INGENIERÍA 14 Recordatorio Anotaciones
64 2500 INGENIERÍA 16
65 2300 INGENIERÍA 18
66 2100 INGENIERÍA 3
67 1700 INGENIERÍA 19
68 2000 INGENIERÍA 6
69 2200 INGENIERÍA 2
70 2100 INGENIERÍA 10
71 1700 INGENIERÍA 16
72 2500 INGENIERÍA 0
73 2800 INGENIERÍA 12
74 2400 INGENIERÍA 3
75 1700 INGENIERÍA 17
76 2400 INGENIERÍA 16
77 2200 INGENIERÍA 7
78 2200 INGENIERÍA 1
79 2300 INGENIERÍA 6
80 2800 INGENIERÍA 5
81 2100 C.SOCIALES 3
82 1700 C.SOCIALES 13
83 2500 C.SOCIALES 0
84 2400 C.SOCIALES 19
85 2700 C.SOCIALES 3
86 1700 C.SOCIALES 19
87 1600 C.SOCIALES 1
88 2600 C.SOCIALES 6
89 2500 C.SOCIALES 10
90 2500 C.SOCIALES 0
91 2100 C.SOCIALES 16
92 2300 C.SOCIALES 17
93 1700 C.SOCIALES 10
94 2200 C.SOCIALES 8
95 2900 C.SOCIALES 17
96 1800 C.SOCIALES 1
97 2100 C.SOCIALES 20
98 2000 C.SOCIALES 16
99 2000 C.SOCIALES 17
100 2900 C.SOCIALES 12
101 2100 C.SOCIALES 0
ollo
nidos 26
Actividades Autoevaluación UNIDAD I: MUESTREO Y ESTIMACIÓN DE PARÁMETROS
as Glosario Bibliografía
nadas
Solución
Se divide a la población en estratos que sean mutuamente excluyentes, luego los
estratos 1, 2 y 3 son: C.Empresa, Ingeniería y C.Sociales, respectivamente. Para cada
uno de los estratos, seleccionamos muestras aleatorias simples.
Para cada estrato, realizamos un muestreo aleatorio simple usando las columnas de
la tabla de los números aleatorios.
Ejercicio 3
La siguiente tabla muestra a los 120 alumnos de la facultad de Ingeniería, a quie-
nes se les preguntó por su emisora radial preferida y por la cantidad de horas a la
semana que la escucha.
ESTADÍSTICA II
UNIDAD I: MUESTREO Y ESTIMACIÓN DE PARÁMETROSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
27
as Glosario Bibliografía
nadas
Posición n 11 = N h xn
Estrato Nh
(desde – hasta) h N
TOTAL
Diagrama Objetivos Inicio
Luego, para cada estrato realice un muestreo aleatorio simple utilizando la tabla de
números aleatorios.
Desarrollo Actividades Autoevaluación
de contenidos
LECTURA SELECCIONADA N° 1
Lecturas Glosario Bibliografía
seleccionadas
¿FUNCIONA LA TERAPIA DE CONTACTO? Estadística. Mario Triola. Pág. 319
Muchos pacientes pagan de $25 a $50 por una sesión de terapia de contacto en la que el
terapeuta
Recordatorio coloca sus manos a unos centímetros del cuerpo del paciente, sin tener real-
Anotaciones
mente contacto físico. El objetivo es curar una amplia variedad de problemas médicos,
incluyendo cáncer, SIDA, asma, enfermedades cardiacas, dolores de cabeza, quemadu-
ras y fracturas óseas. La teoría básica plantea que un terapeuta de contacto capacitado
profesionalmente puede detectar un mal alineamiento en el campo de energía del pa-
ciente y generar un equilibrio energético que incrementa el proceso de curación.
Cuando Emily Rosa, una niña de nueve años, estaba en cuarto grado, eligió el tema de
la terapia de contacto para el proyecto de una feria de ciencias y convenció a 21 tera-
peutas de contacto experimentados para que participaran en una prueba sencilla de su
capacidad para detectar el campo de energía humana. Emily utilizó un cartón con dos
agujeros para introducir las manos. Cada terapeuta de contacto pasaba sus dos manos a
través de los agujeros, y Emily colocaba su mano por arriba de una de las manos del tera-
peuta; luego, se le pedía al terapeuta que identificara la mano que Emily había elegido.
La niña lanzaba una moneda para seleccionar al azar la mano sobre la que colocaba la
suya. Esta prueba se repitió 280 veces. Si los terapeutas de contacto realmente tenían la
habilidad de percibir un campo energético humano, debían identificar la mano correc-
ta mucho más del 50% de las veces. Si no tenían tal capacidad y sólo hacían conjeturas,
debían acertar alrededor del 50% de las veces. Emily obtuvo los siguientes resultados: de
los 280 ensayos, los terapeutas de contacto identificaron la mano correcta 123 veces, es
decir, tuvieron una tasa de éxito del 44%. Emily, con la ayuda de su madre, un especialis-
ta en estadística y un médico, envió sus hallazgos para publicarlos en el prestigioso Jour-
nal of the American Medical Association. Después de una cuidadosa y detallada revisión
del diseño experimental y de los resultados, se publicó el artículo "A Close Look at a
Therapeutic Touch" (Journal of the American Medical Association, vol. 279, núm. 13).
Emily se convirtió en la investigadora más joven en publicar un artículo en esa revista.
Además, ganó el primer premio de la feria de ciencias por su proyecto.
Consideremos los principales resultados del proyecto de Emily. En los 280 ensayos, los
terapeutas de contacto acertaron 123 veces. Tenemos una proporción muestral con n
= 280 y x = 123. Los argumentos en contra de la validez del estudio podrían incluir la
ESTADÍSTICA II
UNIDAD I: MUESTREO Y ESTIMACIÓN DE PARÁMETROSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
29
También es importante señalar que el proyecto de Emily Rosa fue relativamente senci-
llo. Recuerde que ella realizó el estudio cuando cursaba el cuarto grado de primaria. Su
proyecto es el tipo de actividad que cualquier estudiante de un curso de introducción
a la estadística podría llevar a cabo. Después de comprender los conceptos que se ense-
ñan en el curso de introducción a la estadística típico, los estudiantes tienen la habilidad
para realizar trabajos significativos e importantes.
ACTIVIDAD N° 1:
Desarrollo Actividades Autoevaluación
de contenidos
Esta actividad puede consultarla en su aula virtual.
Estimación puntual
Intervalo de confianza
Es un intervalo de valores dentro de los cuales se espera que esté comprendido el pará-
metro con un nivel de confianza dado o con un error conocido.
Nivel de confianza
Nivel de riesgo
as Glosario Bibliografía
nadas
real. En la estimación por intervalos se obtienen dos puntos (un extremo inferior y un
extremo superior) que definen un intervalo sobre la recta real, el cual contendrá con
cierta seguridad el valor del parámetro θ.
Posición
Estrato Nh
(desde – hasta)
Media μ n n
∑X i ∑x i
µ̂ = X = i =1
x= i =1
n n
Varianza ó
1 n 1 n
( )
2
σˆ 2 = S 2 = ∑
n − 1 i =1
(Xi −
= X )2 s2 ∑ xi − x
n − 1 i =1
Proporción p ó n X númeroéxitos x
pˆ = = pˆ =
n númeropruebas n
ˆ qˆ
p ˆ qˆ
p
pˆ − zα ˆ + zα
,p
2
n 2
n
p
ˆ qˆ N −n p
ˆ qˆ N −n
ˆ − Z 1−α / 2
p ≤ p≤ p
ˆ + Z 1−α / 2
n N −1 n N −1
Ejemplo
El dueño de un diario se interesa en la proporción de reporteros varones que co-
meten errores al momento de entregar el reporte final. Al seleccionar una muestra
aleatoria de 100 reporteros varones encontró que 24 cometían errores. Calcule e
interprete un intervalo de confianza del 99% para la verdadera proporción de re-
porteros varones que cometen errores al momento de entregar el reporte final.
Solución
(0,24)(0,76) (0,24)(0,76)
ii) 0,24 − (2,58) ≤ p ≤ 0,24 + (2,58)
100 100
0,13 ≤ p ≤ 0,35
Interpretación: Existe un 99% de confianza que entre 0,13 y 0,35 se encontrará la
proporción poblacional de reporteros varones que cometen errores al momento de
entregar el reporte final.
as Glosario Bibliografía
nadas
σ σ
x − zα / 2 , x + zα / 2
n n
torio Anotaciones
σ N −n σ N −n
x − Z1−α / 2 ≤ µ ≤ x + Z1−α / 2
n N −1 n N −1
Ejemplo
Un artículo publicado en un diario local indica que el tiempo promedio em-
pleado por los hogares de Lima Metropolitana en ver televisión en el horario
de 8 p.m. a 11 p.m. es de 7,75 horas. Suponga que el tiempo tiene una distri-
bución aproximadamente normal con desviación estándar de 3,45 horas. Para
corroborar dicha afirmación un grupo de estudiantes selecciona una muestra
de 180 hogares de L.M. y obtuvo que el tiempo promedio fue de 7,42 horas
por semana. ¿Será cierta la afirmación publicada por el diario local al 96% de
confianza?
Solución:
σ σ
como: x − Z 1−α / 2 ≤ µ ≤ x + Z 1−α / 2
n n
3,45 3,45
IC ( µ ) = 7,42 − (2,05) ≤ µ ≤ 7,42 + (2,05)
iii) 180 180
Interpretación: Con un 96% de confianza entre 6,8928 y 7,9472 horas por se-
mana se encontrará la media del tiempo empleado por todos los hogares de
Lima Metropolitana en ver televisión en el horario de 8 p.m. a 11 p.m. por lo
tanto es cierta la afirmación publicada en el diario local.
Ejemplo
Se tienen 50 000 trabajadores de construcción civil empadronados en el Mi-
nisterio de Trabajo, de los cuales se tomó una muestra aleatoria de 400 y se
analizó el ingreso diario. Si la media de los trabajadores encuestados es de 74
soles diarios con una desviación estandar de 10.68 soles, construya un intervalo
de confianza del 90% para el ingreso diario de todos los trabajadores de cons-
trucción civil.
Solución
iii) x − Z σ N −n σ N −n
1−α / 2 ≤ µ ≤ x + Z1−α / 2
n N −1 n N −1
Recordatorio Anotaciones
iv)
10.68 50000 − 400 10.68 50000 − 400
IC ( µ ) = 74 − (1.645) x ≤ µ ≤ 74 + (1.645) x
400 50000 − 1 400 50000 − 1
v) IC ( µ ) = 73.13 ≤ µ ≤ 74.87
s s
x − tα /2 , x + tα /2
n n
s N −n s N −n
x − tα / 2,n −1 ≤ µ ≤ x + tα / 2,n −1
n N −1 n N −1
Distribución t-Student
Cuando se tienen muestras pequeñas y no se conoce la desviación estándar po-
blacional pero la población se distribuye normalmente se puede utilizar como
estadístico de prueba el valor crítico t de la distribución t de Student la cual
tiene las siguientes características:
as Glosario Bibliografía
nadas
torio Anotaciones
3,2
4,8 5,3 9,1 6,3 8,2 6,5 9,6 10,3 8,6
6,3
7,9 8,2 7,9 6,9 9,3 8,6 6,8 10,1 9,0
(1,8597) (1,8597)
IC ( µ ) = 7,645 − 2,0930 ≤ µ ≤ 7,645 + 2,0930
20 20
6.7746 y 8.1130
Ejemplo
Pamela, estudiante de estadística para Ciencias de la Empresa piensa que el
gasto promedio semanal en fotocopias de los estudiantes de su facultad es de
3.5 soles. Para verificar si es cierto lo que está pensando ha elegido al azar una
muestra de 9 estudiantes de un total de 120 estudiantes que llevan el curso de
estadística para comunicadores, resultando los siguientes gastos:
Solución:
i) n=9; N=120; 1-α=0.96
ESTADÍSTICA II
UNIDAD I: MUESTREO Y ESTIMACIÓN DE PARÁMETROSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
35
= 2,3889 ± (2,44898)
(0,7639) (120 − 9)
9 (120 − 1)
= 1,7866 ≤ µ ≤ 2,9912
Conclusión: Con un nivel de confianza del 96% se puede decir que el gasto
promedio semanal en fotocopias de los estudiantes de su facultad es menor a
3.5 soles, por lo que podríamos decir que lo que piensa Pamela no es cierto.
α
donde χ n2−1,1−α /2es tal que P χ n2−1 ≤ χ n2−1,1−α / 2 =
2
y
χ n2−1,α /2 α
es tal que P χ n2−1 ≤ χ n2−1,α / 2 =
1−
2
y la variable aleatoria χ n2−1 sigue una distribución χ 2 de Pearson con n-1 grados
de libertad.
as Glosario Bibliografía
nadas
Un fabricante de baterías para automóviles afirma que sus baterías durarán, en
promedio, tres años con una varianza de un año. Si cinco de estas baterías tienen
duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años, construya un intervalo de confianza del
95% para σ y decida si la afirmación del fabricante de que σ = 1 es válida.
torio Anotaciones
2 2
2 2
ii) El valor 1- /2 , es un valor con = 5-1 grados de libertad, que deja un área de
2
0,025 a la izquierda y por lo tanto un área de 0,975 a la derecha, es 0,975 = 0,484; de
2 2
la misma forma, el valor /2 es igual a 0,025 = 11,143.
iii)
(5 − 1)(0.815) (5 − 1)(0.815)
< σ2 <
11.143 0.484
iv)
0 .3 < σ 2 < 6 .7
Ejemplo
Se desea estimar la varianza de la longitud de ciertos cables. En una muestra de 25
cables se encuentra que la longitud tiene una media de 80 m y una desviación de 3
m. Hallar un intervalo con una confianza del 95%, para la varianza de las longitudes
de los cables.
Solución
i)
n = 25 : x = 80 , s = 3 , s 2 = 9
ii)
α α
N .C. = 0.95 = 1 − α → = 0.025, 1 − = 0.975
2 2
iii)
χ (20.025, 24) = 12.4011 , χ (20.975, 24) = 39.3641
iv)
24 × 9 24 × 9
≤σ2 ≤
39.3641 12.4011
v)
5.49 ≤ σ 2 ≤ 17.42
vi)
2.34 ≤ σ ≤ 4.17
Interpretación: Se puede afirmar con un 95% de confianza que la desviación estan-
dar de la longitud de dichos cables se encuentra entrea 2.34 m y 4.17m.
ESTADÍSTICA II
UNIDAD I: MUESTREO Y ESTIMACIÓN DE PARÁMETROSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
37
zσ
2 2
n=
z 2σ 2 N
n=
E2 E ( N − 1) + z 2σ 2
2
n0
n=
n
1+ 0
N
Donde:
E: Es el error permitido;
Z: El valor estándar normal asociado con el grado de confianza elegido,
s: La desviación de la población, obtenida de estudios anteriores, experiencias pre-
vias o se puede estimar la desviación estándar muestral mediante un estudio piloto
no: Tamaño de muestra calculada de una población infinita
N: Tamaño de población
Se dice que una población es finita si la relación n/N > 5%
z 2 pq z 2 pqN
n= n=
E2 E ( N − 1) + z 2 pq
2
Donde:
E: Es el error permitido;
Z: El valor estándar normal asociado con el grado de confianza elegido,
P: La proporción de éxito de la población, obtenida de estudios anteriores, expe-
riencias previas o se puede estimar la proporción de éxito muestral mediante un
estudio piloto.
q: La proporción de fracaso de la población se obtiene por complemento de p: q
=1–p
N: Tamaño de población
Ejemplo
Se desea estimar el peso promedio de los sacos que son llenados por un nuevo ins-
trumento en una industria. Se conoce que el peso de un saco que se llena con este
instrumento es una variable aleatoria con distribución normal. Si se supone que la
desviación típica del peso es de 0,5 kg. Determine el tamaño de muestra aleatoria
necesaria para determinar una probabilidad igual a 0,95 de que el estimado y el
parámetro se diferencien modularmente en menos de 0,1 kg.
ollo
nidos 38
Actividades Autoevaluación UNIDAD I: MUESTREO Y ESTIMACIÓN DE PARÁMETROS
as Glosario Bibliografía
nadas
Solución
0,1
Evidentemente un tamaño de muestra no puede ser fraccionario por lo que se debe
aproximar por exceso. El tamaño de muestra sería de 97.
Ejemplo
La Dirección Regional de Trabajo planea realizar un estudio con el objetivo de
conocer el promedio de horas semanales trabajadas por las mujeres del servicio do-
méstico. La muestra será extraída de una población de 10000 mujeres que figuran
en los registros del seguro social y de las cuales se conoce a través de un estudio
piloto que su varianza es de 9.648. Trabajando con un nivel de confianza de 0.95
y estando dispuestos a admitir un error máximo de 0,1, ¿cuál debe ser el tamaño
muestral requerido?
Solución
0,1
Ejemplo
En un lote de frascos para medicina, con una población de 8000 unidades, se desea
estimar la media de la capacidad en centímetros cúbicos de los mismos. A través
de un premuestro de tamaño 35 se ha estimado que la desviación estándar es de
2 centímetros cúbicos. Si queremos tener una precisión 0.25 cm3, y un nivel de
significancia del 5%. ¿De que tamaño debe de ser la muestra?
Solución
N .σ 2 Z α2 2
iii) n =
Ne + σ 2 Z α2 2
v) n = 122931.2 = 239
515.37
Recordatorio Anotaciones
Solo faltaría muestrear 204 frascos, pues los datos de los 35 frascos del premuestreo
siguen siendo válidos.
Ejemplo
En una investigación, se desea determinar en que proporción los niños de una
región toman leche en el desayuno. Si se sabe que existen 1500 niños y deseamos
tener una precisión del 10 %, con un nivel de significancia del 5%. ¿De que tama-
ño debe de ser la muestra?
Solución
i) N=1500; e=10%=0.1; α = 0.05
ii) p = 0.5 y q = 0.5
N . p.q.Z α2 2
iv) n =
N .e 2 + p.q.Z α2 2
v) n = 1500(0.5)(0.5)(1.96) 2
1500(0.1) 2 + (0.5)(0.5) / 1.96) 2
vi) n = 90
Valores
de Z 3.00 2.58 2.33 2.05 2.00 1.96 1.645 1.28
ACTIVIDAD N° 2:
Desarrollo Actividades Autoevaluación
de contenidos
Esta actividad puede consultarla en su aula virtual.
Objetivos
Inicio
Glosario Bibliografía
s
o Anotaciones
ollo
nidos 40
Actividades Autoevaluación Diagrama Objetivos
UNIDAD
Inicio
I: MUESTREO Y ESTIMACIÓN DE PARÁMETROS
BIBLIOGRAFÍA DE LA UNIDAD I
Lecturas Glosario Bibliografía
seleccionadas
torio Anotaciones
Triola, M. (2012). Estadística. México : Pearson Educación
Berenson, M. y Levine, D. (2010). Estadística Básica en Administración, Conceptos y aplicacio-
nes. México: Prentice Hall
Recordatorio Anotaciones
AUTOEVALUACIÓN DE LA UNIDAD I
Desarrollo Actividades Autoevaluación
de contenidos Resuelva el siguiente cuestionario, marcando la respuesta correcta en cada caso, para
fijar los conceptos e ideas fundamentales tratados en la Unidad:
a) 3,4,5,2,1
b) 5,4,3,2,1
c) 3,5,4,2,1
d) 5,4,2,3,1
e) 5,3,2,1,4
a) II, III y IV
b) I, II, y V
c) I, IV y V
d) II y IV
e) III, IV y V
a) 205
b) 167
c) 135
d) 68
e) 152
as Glosario Bibliografía
nadas
8. Con la siguiente información:
n = 15, s2 = 2.53, α = 0.01
Defina el intervalo de confianza para la desviación estándar:
a) 1.039 < α < 2.775
torio Anotaciones
10. Las Razones por las que no se debe usar la distribución “t”
I. La desviación estándar de la población es conocida.
II. La distribución de la población es normal
III. El tamaño de la muestra es mayor a 30
IV. La muestra es aleatoria simple
V. El tamaño de muestra es menor a 30
a) II y IV
b) III y V
c) I
d) IV
e) III
ESTADÍSTICA II
Desarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
43
Desarrollo
UNIDAD II: PRUEBA DE HIPÓTESIS Y ANÁLISIS DE VARIANZA
Actividades Autoevaluación
de contenidos
Recordatorio Anotaciones
CONTENIDOS
de contenidos
Recordatorio Anotaciones
EJEMPLOS ACTIVIDADES
AUTOEVALUACIÓN BIBLIOGRAFÍA
Recordatorio Anotaciones
Autoevaluación de la Unidad II
ollo
nidos 44
Actividades Autoevaluación UNIDAD II: PRUEBA DE HIPÓTESIS Y ANÁLISIS DE VARIANZA
as Glosario Bibliografía
nadas
TEMA N° 1: PRUEBA DE HIPÓTESIS
Los métodos estudiados en la Unidad anterior usan la información proporcionada por
torio Anotaciones
los estadísticos muestrales para estimar con cierta probabilidad el valor de un paráme-
tro poblacional. En éste Unidad se introducirá la prueba de hipótesis que supone a
priori el valor del parámetro y sobre la base de la información obtenida en una mues-
tra se somete a prueba la suposición, para luego tomar con cierta probabilidad, la
decisión de rechazar o no rechazar la hipótesis. En éste punto es importante señalar que
la expresión “no rechazar” pudiera ser sustituida por “aceptar”, sin embargo antes de
hacerlo es necesario atender cuidadosamente algunas explicaciones que se darán más
adelante. La prueba de hipótesis también conocida como docimasia o contrasta-
ción de hipótesis es uno de los métodos estadísticos más usados en las ciencias naturales
por ser un procedimiento que le proporciona al investigador un criterio objetivo para
tomar decisiones con base a un número limitado de observaciones.
1 DEFINICIONES BÁSICAS1
1.1. Hipótesis
Una hipótesis estadística es una proposición o supuesto sobre los parámetros
de una o más poblaciones.
1) H0: θ = θ0
H1: θ ≠ θ0
2) H0: θ ≤ θ0
H1: θ > θ0
3) H0: θ ≥ θ0
H1: θ < θ0
as Glosario Bibliografía
nadas
Recordatorio Anotaciones
X − µo ó X −µ
Z= t n −1 =
σ/ n s/ n
Ejemplo 2
Fumar cigarros de la marca X produce en promedio 0.6 mg de nicotina. El depar-
tamento de ingeniería del fabricante propone un filtro nuevo que supuestamente
reducirá la producción de nicotina. Se toma una muestra de 50 cigarros con el
nuevo filtro y se encuentra que el promedio de nicotina es de 0.55 mg. Con una
desviación estándar de 0.56. ¿Debe aceptarse la aseveración del departamento de
ingeniería con un nivel de significación de 2.5 por ciento?
Solución
i) El parámetro de interés es la media de la población , se desea probar:
H0: μ = 0.60
H1: μ < 0.60
Donde μ es la verdadera media de la nicotina producida por los cigarros de la
marca X.
La prueba es unilateral izquierda.
ii) Como se conoce la desviación estándar muestral y el valor de n es 50 se utiliza el
as Glosario Bibliografía
nadas
valor crítico z, el cual es al 0.025 acumulado desde la izquierda igual a -1.96.
torio Anotaciones
iv) El valor calculado o estimador -0.6313 se encuentra a la derecha del valor crítico
1.96, o sea se encuentra en la región de aceptación.
v) Por lo tanto existe evidencia estadística para aceptar la hipótesis nula y se con-
cluye que los nuevos filtros no reducen la nicotina que producen los cigarros de la
marca X.
Ejemplo 3
Los científicos han citado al benceno, un disolvente químico de uso común en la
síntesis de plásticos como un posible agente causante de cáncer. Ciertos estudios
han demostrado que las personas que trabajan con benceno durante más de cinco
años tienen una incidencia de leucemia 20 veces mayor que la de la población en
general. En consecuencia el gobierno recomienda que el nivel máximo permisible
de benceno en dicho lugar de trabajo se baje de 10 partes por millón (ppm) a 1
ppm. Supongamos que una fábrica de artículos de acero, que expone diariamente
a sus trabajadores al benceno, está siendo investigada por una certificadora de cali-
dad, para ello se examinan 20 muestras de aire tomadas durante un período de un
mes para determinar el contenido de benceno, obteniendo en el análisis una media
de 2.1 ppm y una desviación estándar de 1.7 ppm.
¿La fábrica de artículos de acero estaría haciendo caso omiso a la recomendación?
Utilice un nivel de confianza del 0.95.
Solución
i) El parámetro de interés es la media de la población , se desea probar:
H0: µ =1
H1: µ >1
La certificadora quiere corroborar la hipótesis de investigación de que el nivel me-
dio de benceno en la planta de fabricación excede a 1 ppm. Donde es la verdadera
media. La prueba es unilateral derecha.
ii) El nivel de significancia es a=0.05, lo que nos permite calcular el valor crítico t
(desviación estándar muestral conocida y n<30) y ubicarlo en la gráfica que corres-
ponde a una prueba de hipótesis unilateral derecha.
2.1 − 1
t= = 2.89
1.7 / 20
iv) El valor calculado t o estadístico de prueba 2.89 se encuentra a la derecha
de 1.729 en la región crítica o de rechazo. Existe evidencia estadística para
rechazar la Ho.
v) La certificadora de calidad por lo tanto llega a la conclusión que >1 ppm y
que la panta está violando las normas gubernamentales con una confiabili-
dad asociada de a=0.05.
pˆ − π HIPOTESIS
Z=
π HIPOTESIS (1 − π HIPOTESIS )
n
as Glosario Bibliografía
nadas
x 54
iii)
pˆ = , por lo que utilizando los datos del problema: pˆ = = 0.9
n 60
torio Anotaciones
pˆ − π HIPOTESIS Z=
0.9 − 0.95
= −1.78
Z=
π HIPOTESIS (1 − π HIPOTESIS ) 0.95.(1 − 0.95)
60
n
v) Se puede rechazar la hipótesis nula con α=0.05, ya que el valor calculado o es-
timador -1.78 cae a la izquierda del -1.645 lo que indica que se encuentra en la
región de rechazo.
vi) Por lo tanto, existe evidencia estadística para sustentar la hipótesis de que la
proporción de puentes de autopista de acero intemperizado que tienen buen des-
empeño es menor que 0.95.
Ejemplo5
Un estudio realizado a fumadores que intentaban dejar el hábito con terapia de
parches de nicotina reveló que 39 de ellos continuaban fumando un año después
de iniciado el tratamiento y 32 habían dejado de fumar (según datos de "High-Dose
Nicotine Patch Therapy", de Dale et al, Journal of the American Medical Associa-
tion, vol. 274, núm. 17). Utilice un nivel de significancia de 0.10 para probar la
aseveración de que, de los fumadores que intentaban dejar el cigarrillo, la mayoría
continúa fumando un año después de iniciar el tratamiento. ¿Sugieren estos resul-
tados que la terapia de parches de nicotina es ineficaz?
Solución
i) El parámetro de interés es una proporción de la población π , se desea probar:
H0: π = 0.50
H1: π > 0.50
Donde es la verdadera proporción de todos los que continúan fumando un año
después de iniciar el tratamiento, siendo la prueba unilateral derecha.
ii) El nivel de significancia es α=0.1, lo que nos permite calcular el valor crítico z y
ubicarlo en la gráfica:
iii) x
pˆ = , por lo que utilizando los datos del problema: pˆ =
39
= 0.5
n 39 + 32
0.5 − 0.5
Z= = 0.84
0.5.(1 − 0.5)
71
v) El estadístico de prueba 0.84 cae a la izquierda del valor crítico 1.645 en la región
de aceptación, por lo que existe evidencia estadística para aceptar la hipótesis nula.
vi) Como el 50% o menos deja de fumar, la terapia de parches no es eficaz.
(n − 1)s 2
χ2 =
σ2
El proceso que sigue una prueba de hipótesis para la varianza es el mismo que
utilizamos en las anteriores secciones, es muy usual aplicar esta prueba cuando se
require comprobar el grado de variabilidad de un proceso.
Ejemplo 6
Se sabe que el contenido en gramos de un producto fabricado por una
compañía, no reúne las especificaciones si la varianza de un lote de producción
se aleja demasiado hacia arriba o hacia debajo de 6.5. Comprobar si un gran lote
de producción reúne las especificaciones, si una muestra aleatoria de 20 unidades
extraída aleatoriamente de dicho lote arrojó una varianza de 7.3. Utilizar un
nivel de significación del 5%. Se sabe que el contenido del producto se distribuye
normalmente.
Solución
i) H0 : 2
= 6.5
Hα : 2
6.5
ii) La prueba es bilateral con un nivel de significación: = 0.05, el valor crítico ji-
cuadrado es:
(n − 1) s 2 (20 − 1).x7.3
χ2 = = = 21.34
σ2 6.5
v) Como el estadístico de prueba 21.34 se encuentra en la región de confianza o
de aceptación. Entonces con podemos afirmar con un nivel de significancia del
5% que existe evidencia estadística para aceptar que la varianza del contenido del
producto es el mismo.
Ejemplo 7
Un supervisor de control de calidad en una enlatadora sabe que la cantidad exac-
ta contenida en cada lata varía, pues hay ciertos factores imposibles de controlar
que afectan la cantidad de llenado. El llenado medio por lata es importante pero
igualmente importante es la variación 2 de la cantidad de llenado. Si 2 es grande,
algunas latas contendrán muy poco y otras, demasiado. Las agencias reguladoras
especifican que la desviación estándar de la cantidad de llenado debe ser menor
que 0.1 onzas. El supervisor de control de calidad muestreó n=10 latas y midió la
cantidad de llenado en cada una. Los datos se reproducen a continuación.
as Glosario Bibliografía
nadas
7.96
7.9 7.98 8.01 7.97 7.96 8.03 8.02 8.04 8.02
¿Esta información proporciona con un nivel de significancia del 0.05 pruebas sufi-
cientes de que la desviación estándar de las mediciones de llenado es menor que
torio Anotaciones 0.1 onzas?
Solución
i) H0 : 2
= 0.1
Ha : 2
< 0.1
ii) La prueba es unilateral izquierda, con α = 0.05, por lo que el valor crítico es:
iii) El estadístico de prueba se calcula utilizando la desviación estándar de la mues-
tra s=0.043 y n=10.
(n − 1) s 2 (10 − 1) x 0.043 2
χ2 = = = 1.6
σ2 0.12
iv) Como el estadístico de prueba 1.66 es menor que 3.325 y cae en la región de
rechazo, existe evidencia estadística para rechazar la hipótesis nula. Entonces el
supervisor puede llegar a la conclusión con un nivel de significación del 0.05 de
que la varianza de la población de todas las cantidades de llenado es menor que
0.01, o sea <0.1.
- Si las dos poblaciones son normales, las diferencias de las medias muestrales tam-
bién se distribuirán normalmente cualquiera sea el tamaño de las muestras. No
obstante, si no se conocen las desviaciones estándar poblacionales ( 1 y 2), éstas
pueden ser remplazadas por la desviaciones estándar de las muestras (s1 y s2), si los
tamaños de las muestras son mayores que 30 (n1 >30 y n2 >30 o n1 +n2 >60).
- Según el teorema central del límite, si las dos poblaciones no son normales o
no sabemos si se cumple o no éste comportamiento, las diferencias de las medias
muestrales se distribuirán aproximadamente como una distribución normal, si los
tamaños de las muestras son mayores que 30 (n1 >30 y n2 >30 o n1 +n2 >60)
- Si las dos poblaciones son normales o están muy cerca de éste comportamiento
ESTADÍSTICA II
UNIDAD II: PRUEBA DE HIPÓTESIS Y ANÁLISIS DE VARIANZADesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
53
Con el fin de resolver las pruebas de hipótesis para la diferencia de medias, debe-
mos tener en cuenta el mismo procedimiento y las mismas reglas que seguimos para
las pruebas de hipótesis para la media.
PRUEBA ESTADÍSTICO
μ1 – μ2 = d0 (x 1 − x 2 ) − d 0
z=
y conocidas
1 2 σ 12 σ 22
+
n1 n 2
μ1 – μ2 = d0
( x1 − x 2 ) − d 0
1= 2 desconocidas t= (n 1 − 1)s 12 + (n 2 − 1)s 22
1 1 s 2p =
sp +
n1 n2 n1 + n 2 − 2
Ejemplo
Una compañía de transportes requiere comprar un gran lote de buses para el trans-
porte urbano con el fin de reemplazar su parque automotor y para tal fin desea
comprobar la afirmación hecha por el proveedor de la marca B, en el sentido de
que la marca A es menos ahorradora de combustible. Para tal fin la empresa toma
una muestra aleatoria de 35 vehículos marca A y encuentra que la misma tiene un
promedio en el rendimiento de 18 kilómetros/galón con una desviación estándar
de 8 kilómetros/galón, mientras que una muestra de 32 vehículos marca B presenta
un promedio de 22 kilómetros/galón con desviación estándar de 3 kilómetros /
galón. ¿Qué decisión debe tomar el gerente de la compañía con un nivel de signi-
ficación del 5%?
Solución
i) Las desviaciones estándar se asumen conocidas puesto que los tamaños de mues-
tra son mayores que 30; por lo cual según el teorema central del límite, las diferen-
cias de las medias muestrales, se distribuirán aproximadamente como una distribu-
ción normal.
ii) H0 : μ A -- μ B = 0
Ha : μ A -- μ B = < 0
La prueba es unilateral a la izquierda.
iii) El nivel de significancia es 0.05 por lo que z=1.645.
iv) El criterio de decisión será el siguiente: “Si el valor de z calculado es menor que
–1.64 se rechaza la hipótesis nula de que el rendimiento en ambas marcas es igual”
v) Para calcular el estadístico de prueba se tiene: nA =35; =18; SA =8; nB =32; =22
y SB =3.
(x 1 − x 2 ) − d 0
z= =-2.75
σ12 σ 22
+
n1 n 2
vi) Como el valor de z calculado (-2.75) se encuentra en la zona de rechazo, entonces,
con un nivel de significación del 5%, debemos rechazar la hipótesis nula de que el
ahorro en ambas marcas es igual y en éstas condiciones debemos aceptar la hipótesis
alternativa de que la marca A es menos ahorradora de combustible que la marca B.
ollo
nidos 54
Actividades Autoevaluación UNIDAD II: PRUEBA DE HIPÓTESIS Y ANÁLISIS DE VARIANZA
as Glosario Bibliografía
nadas
Ejemplo
Una compañía de transportes requiere comprar un gran lote de buses para el trans-
porte urbano con el fin de reemplazar su parque automotor y para tal fin desea
torio Anotaciones comprobar la afirmación hecha por el proveedor de la marca B, en el sentido de
que la marca A es menos ahorradora de combustible. Para tal fin la empresa toma
una muestra aleatoria de 13 vehículos marca A y encuentra que la misma tiene un
promedio en el rendimiento de 18 kilómetros/galón con una desviación estándar
de 8 kilómetros/galón, mientras que una muestra de 15 vehículos marca B presenta
un promedio de 22 kilómetros/galón con desviación estándar de 3 kilómetros /
galón. ¿Qué decisión debe tomar el gerente de la compañía con un nivel de signi-
ficación del 1%?
Solución
i) Se sabe que las poblaciones se distribuyen aproximadamente a la ley normal,
pero ambos tamaños de muestran son menores que 30 y no se conocen las desvia-
ciones estándar poblacionales; por lo cual, las diferencias de las medias muestrales,
se distribuirán según a la ley t-student.
ii) H0 : μ A -- μ B = 0
Ha : μ A -- μ B = < 0
La prueba es unilateral a la izquierda.
iii) Nivel de significación: α = 0.01, por lo que el valor crítico t con 26 grados de
libertad es -2.479.
iii) El criterio de decisión será el siguiente: “Si el valor de t calculado es menor
que –2.479, se rechaza la hipótesis nula de que el rendimiento en ambas marcas es
igual”.
iv) Para calcular el estadístico de prueba se tiene: nA =13; =18; SA =8; nB =15; =22
y SB =3.
(n1 − 1) s1 + (n2 − 1) s 2 ( x1 − x 2 ) − d 0
sp = = 5.86 y t = = −1.80
n1 + n2 − 2 1 1
sp +
n1 n2
v) Como el valor de t calculado (-1.80) se encuentra en la zona de aceptación, en-
tonces, con un nivel de significación del 1%, debemos aceptar la hipótesis nula de
que el ahorro en ambas marcas es igual y en éstas condiciones debemos rechazar
la hipótesis alternativa de que el rendimiento es menor en la marca A que en la
marca B.
Ejercicio
El jefe de personal de una gran empresa afirma que la diferencia de los promedios
de antigüedad entre los obreras y obreros de la compañía es de 3.5 años. El presi-
dente de la compañía considera que ésta diferencia es superior. Para comprobar
dicha situación, se toma una muestra aleatoria de 40 obreras cuyo promedio de
antigüedad es de 12.4 años con desviación estándar de 1.5 años y de un grupo de 45
obreros cuyo promedio de antigüedad es de 8.3 años con desviación estándar de 1.7
años. Comprobar la hipótesis con un nivel de significación del 5%.
Ejercicio
Se está investigando la resistencia de dos alambres, con la siguiente información
de muestra.
Recordatorio Anotaciones
Suponiendo que las dos varianzas son iguales, ¿qué conclusiones puede extraerse
respecto a la resistencia media de los alambres?
Ejercicio
Se están investigando dos métodos para producir gasolina a partir de petróleo cru-
do. Se supone que el rendimiento de ambos procesos se distribuye normalmente.
Los siguientes datos de rendimiento se han obtenido de la planta piloto.
Proceso Rendimiento %
¿Hay alguna razón para creer que el proceso 1 tiene un rendimiento medio mayor?
PRUEBA ESTADÍSTICO
(p̂ 1 − p̂ 2 )
z=
p1= p2 1 1 y x1 + x 2
p̂q̂ + p̂ =
n1 n 2 n1 + n 2
Ejemplo
Una compañía asegura que el mercado para su producto X tiene una aceptación
de iguales proporciones en la ciudad A que en la ciudad B. Un especialista en mer-
cado pone en duda dicha afirmación y para tal fin tomó una muestra aleatoria de
500 amas de casa en la ciudad A y encontró que el 59.6% de las mismas prefería
el artículo X. Por otra parte tomó una muestra aleatoria de 300 amas de casa en la
ciudad B y encontró que el 50% de las mismas preferían el artículo X. ¿Existe una
diferencia real entre las dos ciudades? Nivel de significación 5%
Solución
i) H0 : PA =PB ,
Ha : PA ≠ PB;
La prueba es bilateral, puesto que el especialista en mercado no está afirmando que
ciudad tiene más proporción que la otra.
ii) Nivel de significación = 0.05, por lo que z=±1.96
iii) Como las diferencias de las proporciones muestrales se distribuyen normalmen-
te y la prueba es bilateral entonces el criterio de decisión será “Si el valor z es mayor
que 1.96 o menor que -1.96 se rechaza la hipótesis nula de que la proporción es
idéntica en ambas ciudades”.
iv) Con los datos n1 =500, p1 =0.596, n2=300, p2 =0.50 se puede calcular el estadístico
de prueba:
ollo
nidos 56
Actividades Autoevaluación UNIDAD II: PRUEBA DE HIPÓTESIS Y ANÁLISIS DE VARIANZA
as Glosario Bibliografía
nadas
x1=0.956x500 ; x2=0.5x300
( pˆ 1 − pˆ 2 )
z=
x + x2 1 1
torio Anotaciones pˆ = 1 = 0.56; =0.44 y pˆ qˆ + =2.56
n1 + n2 n
1 n 2
Ejercicio
La fracción de productos defectuosos producidos por dos líneas de producción se
está analizando. Una muestra aleatoria de 1000 unidades de la línea 1 tiene 10 de-
fectuosas, en tanto que una muestra aleatoria de 1200 unidades de la línea 2 tiene
25 defectuosas. ¿Es razonable concluir que la línea de producción 2 produce una
fracción más alta de producto defectuoso que la línea 1? Use α = 0.01
H0 : µD = 0
H1 : µ D ≠ µ0
Dónde: D =
∑D j
y SD =
(D j − D)
2
n n −1
Rechazaríamos H 0 : µ D = 0 si t 0 > tα 2 , n −1 o si t 0 < −tα 2,n −1 . Las alternativas
de un lado se tratarían de manera similar.
Ejemplo
Un fabricante desea comparar el proceso de armado común para uno de sus pro-
ductos con un método propuesto que supuestamente reduce el tiempo de armado.
Se seleccionaron ocho trabajadores de la planta de armado y se les pidió que arma-
ran las unidades con ambos procesos. Los siguientes son los tiempos observados en
minutos.
Cuadro N° 13: TIEMPOS OBSERVADOS EN MINUTOS.
2 32 32
3 41 34
4 35 37 Recordatorio Anotaciones
5 42 35
6 32 26
7 45 38
8 37 32
En α = 0.05 , ¿existe alguna razón para creer que el tiempo de armado para el pro-
ceso actual es mayor que el del método propuesto por más de dos minutos?
Solución
2 32 32 0 22.5625
3 41 34 7 5.0625
4 35 37 -2 45.5625
5 42 35 7 5.0625
6 32 26 6 1.5625
7 45 38 7 5.0625
8 37 32 5 0.0625
4.75 95.5
iii) D = ∑D j = 4.75 y S D =
(D j − D)
2
= 3.69
n n −1
D 4.75 − 2
iv) El estadístico de prueba sería: t 0 = = = 2.107
SD n 3 .69 8
v) Finalmente, tα ,n −1 = t .05, 7 = 1.895 , debido a que 2.107 > 1.895 rechazamos H0,
y aceptamos la H1: el tiempo de armado para el proceso actual es mayor en dos
minutos que el método propuesto.
H 1 : σ 12 ≠ σ 22
S2
Utilizamos el hecho de que la estadística F0 = 12 se distribuye como F, con n1-1 y
n2 –1 grados de libertad. S2
as Glosario Bibliografía
nadas
sólo los puntos de la cola superior de F, por lo que para determinar F1−α 2,n1 −1,n2 −1
1
F1−α 2,n1 −1,n2 −1
debemos emplear = Fα 2,n1 −1,n2 −1 .
torio Anotaciones
La misma estadística de prueba puede utilizarse para probar hipótesis alternativas
de un lado. La hipótesis alternativa de un lado es:
H 0 : σ 12 = σ 22
H 1 : σ 12 > σ 22
Ejemplo
Los siguientes son tiempos de quemado (en minutos) de señales luminosas de dos
tipos diferentes.
1 63 81 57 66 82 82 68 59 75 73
2 64 72 83 59 65 56 63 74 82 82
Pruebe la hipótesis de que las dos varianzas sean iguales. Use α = .05
Solución
i) H 0 : σ 12 = σ 22
H 1 : σ 12 ≠ σ 22
Ejemplo8
Una pequeña empresa que elabora botanas (papas fritas, cacahuates, etc.) tiene 4 rutas
para el reparto de sus productos dentro de la ciudad. Para cubrir estas rutas tiene 4 con-
ductores básicos y uno complementario, el conductor complementario sirve para cubrir
las ausencias o vacaciones o enfermedad de los otros 4 y se le ocupa para otros menes-
teres si no se le requiere como conductor. El puesto de conductor complementario se
rota entre todos los choferes sobre una misma base mensual. Es importante tanto desde
el punto de vista de eficiencia, como de justicia, que todas las rutas tengan la misma du-
ración, también es importante que todos los conductores sean igualmente eficientes en
todas las rutas para que los conductores puedan sustituirse el uno al otro sin pérdida de
tiempo, por ello la gerencia de distribución implementó un programa de capacitación
para que los conductores se familiaricen con todas las rutas. Al cabo de esta capacitación
se hicieron recorridos de prueba con el objetivo de investigar, por una parte, si todas las
rutas se recorrían en el mismo tiempo y por otra parte si los conductores eran igualmen-
te eficientes en todas. La gerencia de distribución desea saber si el tiempo medio de las
cuatro rutas es igual y si la eficiencia de todos los conductores en las rutas es igual. La
información de los recorridos y los conductores se da a continuación:
En este ejemplo se tienen datos se clasifican de acuerdo con dos variables: el conductor
y la ruta que son, entonces, los 2 factores. Aquí las hipótesis que se prueban son:
Ho: µ A = µ B = µC = µ D
H1: Por lo menos una de las medias poblacionales de los tratamientos no es igual las
otras.
as Glosario Bibliografía
nadas
En donde las diferentes medias son las medias de las 4 rutas.
En este ejemplo, el tratamiento son las diferentes rutas y a la variable del conductor,
cuyos datos están en los renglones, se le conoce como grupos, a su vez, tratamientos y
grupos son los dos factores a los que se refiere el nombre de esta técnica de análisis de
varianza de dos factores.
Un detalle que vale la pena tener presente respecto a este ANOVA de 2 factores es que se
tiene un solo dato para cada conductor y para cada ruta, ya que el análisis de varianza de
este par de factores, se refiere también a conjuntos de datos clasificados de acuerdo con 2
variables, pero en este caso, con cuando menos 2 observaciones para cada par de factores.
Los supuestos en que se basa la prueba t de dos muestras que utiliza muestras inde-
pendientes son:
1 Anova de un factor.
Como el ANOVA de un criterio es una generalización de la prueba de t para dos
muestras, los supuestos para el ANOVA de un criterio son:
- σ 12 = σ 22 = σ 32 = ..... = σ k2 (= σ 2 )
El método de ANOVA con un criterio o factor requiere del cálculo de dos estima-
PROCEDIMIENTO9
1. Determinar si las muestras provienen de poblaciones normales.
2. Proponer las hipótesis.
3. Encontrar las medias poblacionales y las varianzas.
4. Encontrar la estimación de la varianza al interior de las muestras y sus grados
de libertad asociados glw.
5. Calcular la gran media para la muestra de las medias muéstrales.
6. Determinar la estimación de la varianza entre muestras y sus grados de libertad
asociados.
Grados de libertad
Gl. Totales = n – 1
Gl. Tratamientos = c -1
Gl. Error = n – c
Estadístico calculado Fc
Fcalculado = PCTr / PCE
Regla de decisión
Si Fcalculado es mayor al Fcrítico se rechaza Ho indicando que los efectos de los
diferentes niveles del factor tienen efecto significativo en la respuesta.
as Glosario Bibliografía
nadas
Ejemplo10
Una empresa ensambla cuadros para un solo modelo de bicicleta. La planta trabaja
3 turnos: el matutino, el vespertino y el nocturno. Los trabajadores se rotan cada
torio Anotaciones uno de los turnos, por lo que, al cabo de un trimestre, todos ellos laboraron los
tres turnos. El director de producción quisiera saber si existe diferencia entre la
producción promedio de los 3 turnos, ya que la fábrica trabaja a plena capacidad
desde hace más de un año y no hay variaciones significativas en el número de em-
pleados, en la maquinaria, ni en los procesos productivos; el director considera que
con un análisis de varianza puede contestar esta pregunta; para ello obtiene una
muestra aleatoria de la producción de 6 días de cada turno. Los datos se muestran
a continuación:
TURNO
Solución
i) Las hipótesis son:
Ho: µ1 = µ 2 = µ 3
H1: Por lo menos una de las medias poblacionales de los bloques (conductores) no
es igual las otras.
ii) X 1 = 137; X 2 = 141; X 3 = 127 , siendo la media global
129 + 141 + ... + 138
X Global = = 135
18
iii) Se obtiene la suma de cuadrados totales:
SCT = (129 − 135) 2 + ... + (144 − 135) 2 + (138 − 135) 2 + ... + (148 − 135) 2 + (118 − 135) 2 + ... + (138 − 135) 2
SCT=1608
iv) Se obtiene la suma de cuadrados de las variaciones entre los tratamientos:
SCTR = 6(137 − 135) 2 + 6(141 − 135) 2 + 6(127 − 135) 2 = 624
v) Se obtiene la suma de cuadrados de la variación aleatoria también llamada suma
de cuadrados del error, y es la variación dentro del tratamiento.
SCE = (129 − 137) 2 + ... + (144 − 137) 2 + (138 − 141) 2 + ... + (118 − 127) 2 + ... + (138 − 127) 2 = 984
624
PCTR = = 312
2
viii) Se obtienen la media de los cuadrados del error PCE, para ello se divide SCE
Recordatorio Anotaciones
entre los grados de libertad totales gtotales. Éste es el segundo promedio de cua-
drados.
984
PCE = = 65.6
18 − 3
ix) Se obtiene el valor empírico de F, o sea el F calculado, que es el cociente de estos
dos últimos promedios de cuadrados.
PCTR 312
FCalculado = = = 4.76
PCE 65.6
Fcrítico = 3.68
xi) La regla de decisión; se rechaza la Ho si el Fcalculado es mayor que el Fcrítico.
Por lo tanto como 4.76 es mayor que 3.68 rechazamos la hipótesis nula y conclui-
mos que por lo menos una de las medias no es igual a las otras.
as Glosario Bibliografía
nadas
torio Anotaciones
Donde encontramos el valor calculado y valor crítico para tomar la misma decisión.
Ejercicio11
Se diseñaron 4 tipos diferentes de examen para evaluar el aprovechamiento en un
curso de capacitación y, para probar si existen diferencias significativas en el diseño
de los exámenes se eligió un conjunto de 40 trabajadores en capacitación y se les
asignó uno de los 4 exámenes al azar, los tratamientos. Los resultados se muestran
a continuación y se incluyen los promedios de cada tratamiento:
EXÁMENES
A B C D
71 84 79 92
72 94 92 70
80 77 73 74
70 84 86 70
85 96 82 74
77 84 98 85
79 86 98 70
95 99 82 75
63 96 91 62
80 86 64 90
77.2 88.6 84.5 76.2
PROMEDIO
Como los exámenes se asignaron aleatoriamente a los trabajadores, se pensaría
que las diferencias entre los promedios de las calificaciones en los 4 subconjuntos
se deben a diferencias entre los propios exámenes, salvo diferencias aleatorias o
errores normales de muestreo que en este caso pueden deberse a diferencias per-
sonales entre los examinados. Verifique Ud si hay diferencias entre las medias de
los 4 exámenes.
TRATAMIENTOS
A
1 2 3 MEDIAS (HORIZONTAL)
1
BLOQUES
2
3
MEDIAS (VERTICAL) MEDIA GLOBAL
En este caso la desviación cuadrática total puede ser desdoblada en tres sumandos
debido a razones intergrupales (por efectos del tratamiento) simbolizada como
DCT, en un sumando debido a razones intergrupales (por efectos de errores aleato-
rios) DCE y en otro sumando debido a razones de bloque DCbloque. La desviación
cuadrática intrabloque DCbloque es similar a la desviación cuadrática de los trata-
mientos sólo que en vez de trabajar a nivel de los términos de una fila, se trabaja
a nivel de los términos de una columna. De manera análoga, el cuadrado medio
intrabloque es similar al cuadrado medio intragrupo sólo que en vez de trabajar a
nivel de los términos de una fila se hace a nivel de los términos de una columna.
DCE
El cuadrado medio de los errores se define como: CME =
(r − 1)(k − 1)
Se generan entonces las siguientes razones:
CMtrat CMbloque
Ftrat = Fbloques = Fcalculado =
CMerr y CMerr
El criterio de decisión es: si Fcalculado < Fα ,k −1,( k −1)( r −1) , no rechazar la
hipótesis nula.
Ejemplo
La tabla que se presenta a continuación corresponde a una muestra aleatoria del
proceso de producción de una empresa metal mecánica que registra la producción
obtenida durante cinco días consecutivos. Los bloques corresponden a los cinco
días de la semana y los tratamientos a la producción en unidades físicas obtenidas
de cada máquina.
Para un nivel de significancia del 5% se requiere determinar si las diferencias entre
la producción de las máquinas son significativas.
DIAS MÁQUINAS
DIAS Prof. 1 2 3 4
1 30 31 32 33
2 30 35 34 36
3 28 32 35 37
4 29 36 37 35
5 30 34 34 33
Solución
i) La solución la realizaremos íntegramente utilizando el Excel, para ello co-
piamos la tabla dada a una hoja de Excel, vamos a Datos…Análisis de Datos…y
Análisis de Varianza de dos factores con una sola muestra por grupo.
ii)
ollo
nidos 66
Actividades Autoevaluación UNIDAD II: PRUEBA DE HIPÓTESIS Y ANÁLISIS DE VARIANZA
as Glosario Bibliografía
nadas
torio Anotaciones
iii) Luego:
Ejercicio
El Jefe de Departamento de la universidad está desarrollando un programa de evalua-
ción de docentes que debe ser efectuado por los alumnos. Para estos efectos se seleccio-
nó aleatoriamente a 5 alumnos de un salón de clases y se pidió que evalúen a sus cuatro
profesores del ciclo que está a punto de concluir. La calificación de los docentes sobre
un escala vigesimal se presenta en el siguiente cuadro:
DIAS TRATAMIENTO
ALUMNOS Prof. 1 Prof. 2 Prof. 3 Prof. 4
1 13.2 15.0 18.6 15.8
LECTURA SELECCIONADA N° 1
Lecturas Glosario Bibliografía
seleccionadas
as Glosario Bibliografía
nadas
• De un total de sólo 19 monarcas españoles desde los reyes Católicos, coinciden
Carlos II con Carlos IV (11 de noviembre) y José I con Juan Carlos I (5 de enero).
• De los 40 presidentes de USA hasta Reagan: Polk y Harding nacieron un 2 de no-
torio Anotaciones viembre.
Puedes creer que esto puede ser casualidad o si eres mal pensado que está preparado,
por eso nada mejor que hacer un estudio probabilístico riguroso de esta paradoja
Estimación de la probabilidad
¿Cuál es la probabilidad de que en un grupo de n personas, por lo menos dos de ellas
coincidan en su cumpleaños?, desechamos los años bisiestos y los gemelos, y asumimos
que existen 365 cumpleaños que tienen la misma probabilidad.
Solución
Utilizando la regla de Laplace y la combinatoria:
El truco es calcular primero la probabilidad de n personas tengan cumpleaños diferen-
tes
Sea el suceso:
A = {"al menos dos personas celebran su cumpleaños a la vez"}
y su complementario:
Ac = {"no hay dos personas que celebren su cumpleaños a la vez"}
Caso particular: n=5
El número de casos posibles de celebración de cumpleaños, suponiendo el año de 365
días, es:
3655 = 6,478 × 10 12
El número de casos favorables : como la primera de las personas puede haber nacido
uno de los 365 días del año, la siguiente unos de los 364 días restantes y así sucesiva-
mente, resultan365 × 364 × 363 × 362 × 361 = 6,303 × 10 12 casos de que no existan dos
personas que hayan nacido el mismo día .
Aplicando la regla de Laplace
P(Ac) =casos favorables/casos posibles =6,303 / 6,478 = 0,973
p(A) = 1 - p(Ac) = 1 - 0,973 = 0,027
El problema puede generalizarse para una reunión de n personas.
La probabilidad de que al menos dos de ellas cumplan años el mismo día es:
ACTIVIDAD N° 1
Desarrollo Actividades Autoevaluación
de contenidos
Esta actividad puede consultarla en su aula virtual.
Diagrama Objetivos Inicio
Actividades Autoevaluación
os Lecturas Glosario Bibliografía
seleccionadas
AUTOEVALUACIÓN DE LA UNIDAD II
Actividades Autoevaluación
s En los últimos años se han registrado un gran número de lavadoras de ropa, tanto elec-
trónicas como mecánicas, con serias fallas en su funcionamiento. Se desea analizar y
comparar el costo de reparación de cada tipo de artefacto. Para ello se ha seleccionado
una muestra aleatoria de cada tipo de lavadora y se han registrado en la tabla los costos
Glosario Bibliografía
s de reparación en soles. Se sabe que el número de fallas tiene distribución normal.
N° 1 2 3 4 5 6 7 8 9 10 11
o Anotaciones
Electrónico 178 161 194 204 185 179 173 172 108 181 185
H1: 2
1
≠ 2
2
S 12
B) Fexp = = 0,2491
S 22
C) F1 = 0,2688
D) F2 = 3,72
E) = 615,87273
2.- En los últimos años se han registrado un gran número de lavadoras de ropa,
tanto electrónicas como mecánicas, con serias fallas en su funcionamiento. Se desea
analizar y comparar el costo de reparación de cada tipo de artefacto. Para ello se
ha seleccionado una muestra aleatoria de cada tipo de lavadora y se han registrado
en la tabla los costos de reparación en soles. Se sabe que el número de fallas tiene
distribución normal.
N° 1 2 3 4 5 6 7 8 9 10 11
Electrónico 178 161 194 204 185 179 173 172 108 181 185
A) Ho: 1 2
H1: 1
> 2
Texp =
(x − x )− (µ − µ )
1 2 1 2 o
= 2,10512
B) S12 S 22
+
n1 n2
ollo
nidos 70
Actividades Autoevaluación UNIDAD II: PRUEBA DE HIPÓTESIS Y ANÁLISIS DE VARIANZA
as Glosario Bibliografía
nadas
2
S12 S 22
+
n1 n2
v= 2 2
≈ 16
torio Anotaciones C) S12 S 22
n1 n2
+
n1 − 1 n2 − 1
D) Tcrítico= 1,75305
E) A un nivel de significación del 5%, se puede afirmar que el costo de reparación
de las lavadoras electrónicas es significativamente superior al costo de reparación
de las lavadoras mecánicas.
a) F calculado = 0.9622
b) F crítico = 6.82
c) t calculado= 1.8695
d) t critico = 1.98229
e) Se rechaza lo que afirma el ingeniero.
4.- Un fabricante de impresoras desea estimar la vida media de sus margaritas de im-
presión. La estimación ha de estar dentro de 2 horas en torno a la media y tener un
nivel de confianza del 90%. Si una muestra piloto revela una desviación típica de 25
horas, ¿cuál debe ser el tamaño de la muestra?
a) 164
b) 423
c) 24
d) 115
e) 625
5.- En los últimos años se han registrado un gran número de lavadoras de ropa, tan-
to electrónicas como mecánicas, con serias fallas en su funcionamiento. Se desea
analizar y comparar el costo de reparación de cada tipo de artefacto. Para ello se
ha seleccionado una muestra aleatoria de cada tipo de lavadora y se han registrado
en la tabla los costos de reparación en soles. Se sabe que el número de fallas tiene
distribución normal.
N° 1 2 3 4 5 6 7 8 9 10 11
Electrónico(1) 178 161 194 204 185 179 173 172 108 181 185
N° Cruces
A B C D E F G H
Antes de la modificación 5 7 6 4 8 9 8 10
Después de la modificación 3 7 7 0 4 6 8 2
a) = 0.005
b) Tcalculado=2.3152
c) T critico = 2.798
d) Sd = 2.8277
e) d = 2.5
a) cdba
b) cbda
c) acbd
d) acdb
e) dcba
VARIEDADES DE PAPA
V1 V2 V3 V4
55 52 53 52
53 58 55 50
60 50 57 51
52 60 51 49
53 52 54 53
Al nivel de significación del 5% ¿se puede inferir que existen diferencias significati-
vas entre las producciones medias de las 4 variedades de papa?
Luego señale lo incorrecto.
a) α=0.05
b) Ho: µ1 = µ 2 = µ 3 = µ 4
c) SCA=42.6
d) SCT=189
e) Fcrítico=3.16
ollo
nidos 72
Actividades Autoevaluación UNIDAD II: PRUEBA DE HIPÓTESIS Y ANÁLISIS DE VARIANZA
as Glosario Bibliografía
nadas
9.- La empresa de transportes “DEL VALLE” va a adquirir una de 4 marcas de neu-
máticos que hay en el mercado. El ingeniero de pruebas de la empresa diseñó un
experimento escogiendo al azar seis neumáticos de cada marca de características
torio Anotaciones
similares. En el laboratorio de pruebas, con una carga específica simulada, observó
la duración de cada neumático hasta que se deteriore. Los datos redondeados en
miles de kilómetros se dan en la tabla siguiente.
MARCAS DE NEUMÁTICOS
N1 N2 N3 N4
55 63 48 59
53 67 50 68
50 55 59 57
60 62 50 66
55 70 47 71
65 75 61 73
Al nivel de significancia del 5% ¿indican estos datos que las marcas de neumáticos
producen efectos significativos en el rendimiento?
Luego marque lo incorrecto.
a) Fcalculado=6.77
b) SCT=1550.96
c) SCA=781.46
d) SCE=769.5
e) Fcrítico=3.10
10.- Una empresa de confecciones textiles realiza un estudio para determinar el mejor
de tres métodos de montaje de una prenda específica. Con este fin diseñó un ex-
perimento para comparar los tres métodos seleccionando cinco operarios que se
supone son de velocidad homogénea para reducir la variación debido a los opera-
rios, asignando a cada operario los tres métodos por tiempos iguales. El número de
prendas terminadas por cada operario y con cada método en el tiempo fijado se da
en la tabla que sigue.
MÉTODO
OPERARIO I II III
1 3 9 5
2 4 8 6
3 3 7 8
4 5 9 7
5 4 6 9
Desarrollo
UNIDAD III: ESTADÍSTICA NO PARAMÉTRICAS
Actividades Autoevaluación
de contenidos
Recordatorio Anotaciones
Lecturas
seleccionadas DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD III
Glosario Bibliografía
CONTENIDOS
Recordatorio
Desarrollo
Anotaciones
Actividades Autoevaluación EJEMPLOS ACTIVIDADES
de contenidos
Lecturas
seleccionadas
Glosario AUTOEVALUACIÓN
Bibliografía BIBLIOGRAFÍA
Recordatorio Anotaciones
as Glosario Bibliografía
nadas
TEMA N° 1: PRUEBAS DE SIGNOS
Como has podido observar la mayoría de las pruebas que hemos realizado se refiere al
torio Anotaciones
análisis del parámetro poblacional como la media, varianza y proporción para lo cual
se hicieron supuestos sobre las poblaciones a quienes pertenecían las muestras, dichos
supuestos por ejemplo era que provenían de poblaciones con comportamiento normal.
Pero en la práctica no siempre las poblaciones son normales por lo que ya no podría-
mos aplicar los métodos anteriormente estudiados, se necesita para ello algún método
alternativo que requiera dicha suposición. Estos métodos son conocidos como Pruebas
no paramétricas o sin distribución, los cuáles nos permiten realizar inferencias en situa-
ciones donde no conocemos el comportamiento probabilístico de la variable en análisis.
Su gran ventaja respecto a los métodos paramétricos es que utiliza cálculos que no son
tan laboriosos además de no tener en cuenta la forma de la distribución (función de
probabilidad). Hay que tener en cuenta que las pruebas no paramétricas se ven limita-
das por la pérdida de información al trabajar sólo con los rangos por lo que a menudo
no son tan claras o eficientes pero esto se ve recompensado por la sencillez, rapidez y
necesidad de utilizar poca información.
En realidad existe una gran cantidad de pruebas de las cuáles desarrollaremos las más
conocidas y utilizadas, de las cuáles podemos observar su eficiencia respecto a las prue-
bas paramétricas:
TASA DE EFICIENCIA
APLICACIÓN PRUEBA PARAMÉTRICA PRUEBA NO PARAMÉTRICA DE LA PRUEBA NO
PARAMÉTRICA CON
POBLACIÓN NORMAL
Datos apareados de los Prueba t o prueba z Prueba del signo 0.63
datos muestrales Prueba de rangos con 0.95
signo de Wilcoxon
Para las pruebas de signos y alguna otra prueba no paramétrica, al lugar que ocupa cada
dato ordenado de menor a mayor se le conoce como rango, y si hay algún empate entre
los rangos se utiliza la media de dichos rangos en cada uno de los datos, de la siguiente
forma:
Análisis de rangos:
Dato 3 6 6 6 11 14 14 16
Posición 1 2 3 4 5 6 7 8
Se supone que se tienen datos antes y después para una muestra y se desean compa-
rar estos conjuntos de datos correspondientes. Se hace restando las observaciones
por pares, y se anota el signo algebraico resultante. No es importante la magnitud
de la diferencia, sino solo si resulta un signo más o un signo menos.
2 Fuente: Tomado de Estadística, Mario Triola, 10°Ed., Capítulo 13, pág. 679
ollo
nidos 76
Actividades Autoevaluación UNIDAD III: ESTADÍSTICA NO PARAMÉTRICA
as Glosario Bibliografía
nadas
La hipótesis nula establece que no existe diferencia en los conjuntos de datos. Si
esto es cierto, entonces un signo más y un signo menos son igualmente probables.
La probabilidad (π) de que ocurra cualquiera es de 0.50. Una prueba de dos ex-
torio Anotaciones
tremos es:
H0: m = p o Med1=Med2
H1: m ≠ p o Med1≠Med2
Ejemplo3
Se le pidió a un grupo de 20 alumnos que calificaran el desempeño de 2 profesores,
de acuerdo con varios criterios y en una escala de 1 a 10. Se obtuvieron los resulta-
dos que se muestran a continuación:
CALIFICACIÓN
iii) Al encontrar las diferencias igual a cero, eliminamos sus respectivos pares por lo
que el nuevo tamaño de muestra es n=16. Importante recordar que el cero no tiene
signo, por lo que no se le puede asignar el signo positivo.
v) Contrastando con la tabla de valores críticos para la prueba del signo de Mario
Triola, el valor crítico con un nivel de significancia de 0.05 y n=16, es: 3. La tabla de
valores críticos se presenta a continuación.
as Glosario Bibliografía
nadas
mial con P=0.5 y n=16 y comparar la probabilidad acumulada generada por la mues-
tra y el nivel de significancia.
torio Anotaciones CUADRO Nº 17: VALORES CRÍTICOS PARA LA PRUEBA DEL SIGNO4
Notas
1. * Indica que no es posible obtener un valor en región crítica
2. Rechace la hipótesis nula si el número del signo menos frecuente (x) es mejor
que o igual al valor en la tabla
3. Para valoresde n mayores que 25, se utiliza una aprox. normal con :
(x+0.5) - n
Z= 2
n
2
cional y se registran de nuevo las ventas. El cuadro siguiente muestra los niveles de
ventas, del primer y segundo mes.
Se desea probar con un nivel de significancia de 0.05 que la campaña promocional
incrementó las ventas.
Solución
i) Planteamos las hipótesis:
H0: m = p
H1: m > p
Se entiende que para que la promoción sea exitosa se requiere que el número de dife-
rencias negativas sea pertinentemente grande, o sea interesa que el número de signos
menos sea mayor que el número de signos positivos. Planteando de otra manera utili-
zando la probabilidad:
H0: π1 = 0.5
H1: π1 > 0.5
as Glosario Bibliografía
nadas
iii) Eliminando los ceros, el valor de n=10. El estadístico de prueba es x=3
iv) Utilizando la tabla de valores críticos para la prueba del signo al 0.05 en una cola
el valor crítico es 1.
torio Anotaciones v) Como el estadístico de prueba es mayor que el valor crítico no se rechaza la hi-
pótesis nula. Por lo tanto existe evidencia estadística para aceptar la hipótesis nula,
y se concluye que la campaña promocional no fue exitosa.
x + 0.5 − 0.5n
Z=
0.5 n
Ejemplo
Se ha pedido a una muestra aleatoria de 100 niños que comparen dos nuevos sabo-
res de helado: mantequilla de maní y fresa. Cincuenta y seis miembros de la mues-
tra prefieren el helado de mantequilla de maní, 40 el de fresa y 4 no manifiestan
ninguna preferencia. Averigüe si existe una preferencia general por cualquiera de
los dos sabores con un nivel de significancia de 0.05
Solución
i) Sea P la proporción de la población que prefiere el helado de fresa, por lo que
x=40, siendo el valor de n=96
H0: P = 0.5 H1: P≠0.5
ii) El valor del estadístico de prueba es:
40 + 0.5 − 0.5.x96
Z= =-1,53
0.5 x 96
iii) Analizando el valor crítico:
antes 8 7 6 9 7 10 8 6 5 8 10 8
después 6 5 8 6 9 8 10 7 5 6 9 8
Ejercicio
Un taller de reparación para CPUs de computadoras cambió el método de pago
de salario por hora a salario por hora más un bono calculado sobre el tiempo re-
querido para desmontar, reparar y volver a ensamblar el CPU. Los siguientes son
datos recabados para 25 CPUs antes del cambio y 25 después para el número de
horas requeridas. A un nivel de significancia de 0.10, ¿el nuevo plan incrementó la
productividad?
ESTADÍSTICA II
UNIDAD III: ESTADÍSTICA NO PARAMÉTRICADesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
81
antes 29 34 32 19 31 22 28 31 32 44 41 23 34
después 32 19 22 21 20 24 25 31 18 22 24 26 41
Recordatorio Anotaciones
antes 25 42 20 25 33 34 20 21 22 45 43 31
después 34 27 26 25 31 19 22 32 31 30 29 20
Ejercicio
Se ha examinado una muestra de 50 empresas peruanas que compraron franquicias
el año 2012. Los rendimientos de las acciones en torno a la fecha de compra fue-
ron positivos 31 veces, negativos 12 y cero 3. Contraste la hipótesis de que hay una
mayor probabilidad de rendimientos positivos alrededor de la fecha de compra de
una franquicia.
n(n + 1)
T−
4
- Si n>30, el estadístico de prueba es: Z = n(n + 1)(2n + 1) y el valor crítico en la
tabla de valores críticos z. 24
ollo
nidos 82
Actividades Autoevaluación UNIDAD III: ESTADÍSTICA NO PARAMÉTRICA
as Glosario Bibliografía
nadas
Cuadro N°18: VALORES CRÍTICOS T PARA LA PRUEBA DE RANGOS CON SIGNO
Valores críticos de T para la prueba de rangos con signo de wilcoxon5
Notas
1. * Indica que no es posible obtener un valor en región crítica
2. Rechace la hipótesis nula si el estadístico de prueba T es menor que o igual al
valor crítico que se encontró en esta tabla. No rechace la hipotesis nula si el estadís-
tico de prueba T es mayor que el valor crítico que se encontro en la tabla.
Ejemplo
Una pizzería cercana al campus universitario está considerando la posibilidad de
utilizar una nueva receta para hacer la salsa que echa a las pizzas. Se elige una mues-
tra aleatoria de ocho estudiantes y se pide a cada uno que valore en una escala de 1
a 10 su opinión sobre la salsa original y sobre la salsa propuesta. El cuadro siguiente
muestra las puntuaciones obtenidas en la comparación; los números más altos indi-
can que gusta más el producto.
¿Indican los datos una tendencia general a preferir la nueva salsa a la original?
B 3 8
C 4 3
D 7 6
E 2 8
F 5 8
G 6 6
H 4 8
Solución
i) Planteamos las hipótesis:
H0: P = 0.5 (No hay preferencia por alguna de las dos salsas)
H1: P < 0.5 (Existe preferencia por el nuevo producto)
DIFERENCIA
estudiante salsa original salsa propuesta (ORIGINAL-NUEVO)
A 5 7 -2
B 3 8 -5
C 4 3 1
D 7 6 1
E 2 8 -6
F 5 8 -3
G 6 6 0
H 4 8 -4
iii) Luego hallamos los rangos de los valores absolutos de las diferencias y
-2 2 3 -3
-5 5 6 -6
1 1 1.5 1.5
1 1 1.5 1.5
ollo
nidos 84
Actividades Autoevaluación UNIDAD III: ESTADÍSTICA NO PARAMÉTRICA
as Glosario Bibliografía
nadas
-6 6 7 -7
-3 3 4 -4
torio Anotaciones 0 0 -- --
-4 4 5 -5
Ejemplo
En un estudio se compararon empresas que tenían sofisticados métodos de postau-
ditoría y empresas que no tenían métodos de ese tipo. Se examinó una muestra de
31 pares de empresas. Se calculó el cociente entre la valoración de mercado y los
costes de reposición de los activos de cada una y se utilizó como medida de los re-
sultados de las empresas. En cada uno de los 31 pares, una de las empresas utilizaba
un sofisticado método de postauditoría y la otra no. Se calcularon las 31 diferencias
entre los cocientes y se ordenaron las diferencias absolutas. La menor de las sumas
de los rangos, 189, correspondió a los pares en los que el cociente era mayor en el
caso de la empresa que carecía de sofisticados métodos de postauditoría. Contraste
la hipótesis nula de que la distribución de las diferencias entre los cocientes está
centrada en 0 frente a la hipótesis alternativa de que tiende a ser menor en las em-
presas que carecen de sofisticados métodos de postauditoría.
Solución
i) Como la muestra es n=31, y T=189, calculamos el estadístico de prueba con la
fórmula:
n(n + 1)
T−
Z calculado = 4
n(n + 1)(2n + 1)
24
31(31 + 1)
189 −
Z calculado = 4
ii)
31(31 + 1)(2.31 + 1) = -1.16
24
iii) La prueba es de una sola cola, por lo que Zcrítico=1.645
iv) Al ser el Zcalculado menor que el Zcrítico, no existe evidencia estadística para
rechazar la hipótesis nula.
Ejercicio
Se pide a una muestra aleatoria de 10 estudiantes que valoren en una cata a ciegas
la calidad de dos marcas de cerveza, una nacional y una importada. Las valoraciones
se basan en una escala de 1 (mala) a 10 (excelente). La tabla adjunta muestra los
resultados. Utilice el contraste de Wilcoxon para contrastar la hip6tesis nula de que
la distribución de las diferencias pareadas está centrada en 0 frente a la hipótesis
alternativa de que la población de todos los estudiantes bebedores de cerveza pre-
fiere la marca importada.
ESTUDIANTE A B C D E F G H I J
NACIONAL 2 3 7 8 7 4 3 4 5 6
IMPORTADA 6 5 6 8 5 8 9 6 4 9
ESTADÍSTICA II
UNIDAD III: ESTADÍSTICA NO PARAMÉTRICADesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
85
menos del 50% utiliza este medio para planear viajes. ¿Los resultados son importan-
tes para los agentes de viajes?
Por lo que cuando n1≥10 y n2≥10 la distribución normal es una excelente aproxima-
ción a la distribución de la variable aleatoria:
T − µT
Zcalculado =
σT
Ejemplo
En un estudio que pretendía comparar los resultados de empresas que revelan las
predicciones de la dirección sobre los beneficios con los resultados de las que no
las revelan, se tomaron muestras aleatorias de 80 empresas de cada una de las po-
blaciones. Se midió la variabilidad de la tasa de crecimiento de los beneficios en
los 10 periodos anteriores en cada una de las 160 empresas y se ordenaron estas
variabilidades. La suma de los puestos de las empresas que no revelan las predic-
ciones de la dirección sobre los beneficios era 7287. Contraste la hipótesis nula de
que las posiciones centrales de las distribuciones poblacionales de las variabilidades
de los beneficios son las mismas en los dos tipos de empresas frente a la hipótesis
alternativa bilateral.
ollo
nidos 86
Actividades Autoevaluación UNIDAD III: ESTADÍSTICA NO PARAMÉTRICA
as Glosario Bibliografía
nadas
Solución
i) Como T=7.287, calculamos los demás indicadores, siendo n1=80 y n2=80
n1 (n1 + n2 + 1) 80(161)
torio Anotaciones
ii) µ T = 2
=
2
= 6440
Ejemplo
La tabla siguiente muestra el número de horas semanales que los estudiantes afir-
man que dedican a estudiar las asignaturas de introducci6n a la economía financie-
ra y a la contabilidad. Los datos proceden de muestras aleatorias de 10 estudiantes
de economía financiera y 12 de contabilidad. ¿Indican los datos la existencia de una
diferencia en el numero mediano de horas semanales que dedican los estudiantes
a estudiar las asignaturas de introducci6n a la economía financiera y a la contabi-
lidad?
ECONOMÍA 10 6 8 10 12 13 11 9 5 11
FINANCIERA
CONTABILIDAD 13 17 14 12 10 9 15 16 11 8 9 7
Solución
i) Planteamos las hipótesis.
Ho: Med(1)=Med(2) Los estudiantes dedican la misma cantidad de tiempo para
ambas asignaturas.
H1: Med(1)≠Med(2) Los estudiantes no dedican la misma cantidad de tiempo para
ambas asignaturas.
ii) Unimos en un solo conjunto a las dos muestras y ordenamos los datos de forma
ascendente, luego en el cuadro inicial indicamos los rangos al lado de cada dato.
10 10 13 17.5
6 2 17 22
8 4.5 14 19
10 10 12 15.5
12 15.5 10 10
ESTADÍSTICA II
UNIDAD III: ESTADÍSTICA NO PARAMÉTRICADesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
87
13 7.5 9 7
11 13 15 20
9 7 16 21 Recordatorio Anotaciones
5 1 11 13
11 13 8 4.5
9 7
7 3
SUMA DE SUMA DE
RANGOS = 93.5 RANGOS = 159.5
n1 (n1 + n2 + 1) 10(10 + 12 + 1)
iii) µ T = = = 115
2 2
n1 n2 (n1 + n2 + 1) 10 x12(10 + 12 + 1)
iv) σ T =
2
= = 230
12 12
Ejercicio
Se pregunta a una muestra aleatoria de 50 estudiantes de una facultad que sueldo
debería estar dispuesta la universidad a pagar para atraer a la persona idónea para
hacerse cargo de la Coordinación Académica. Se hace la misma pregunta a una
muestra aleatoria independiente de 50 profesores. A continuación, se juntan las
100 cifras sobre el sueldo y se ordenan (asignándose 1 al sueldo más bajo). La suma
de los rangos de los profesores es 2024.
Contraste la hipótesis nula de que no existe ninguna diferencia entre las posiciones
centrales de las distribuciones de los sueldos propuestos por los estudiantes y por
los profesores frente a la hipótesis alternativa de que en conjunto los estudiantes
propondrían un sueldo más alto para atraer al Coordinador Académico.
Ejercicio
Un estudio utilizó tomografía computarizada (TC) por rayos X para reunir datos de
volúmenes cerebrales de un grupo de pacientes con trastorno obsesivo-compulsivo
y un grupo de control de personas saludables. La lista adjunta presenta los resulta-
dos muestrales (en mililitros) para volúmenes del hemisferio derecho (según datos
de “Neuroanatomical Abnormalities in Obsesive-Compulsive Disorder Detected
with Quantitative X-Ray Computed Tomography”, de Luxenberg et al., American
Journal of Psychiatry, vol. 145, núm. 9). Utilice un nivel de significancia de 0.01
y pruebe la aseveración de que los pacientes obsesivo-compulsivos y las personas
saludables tienen la misma mediana de volúmenes cerebrales. Con base en este
resultado, ¿podemos concluir que el trastorno obsesivo-compulsivo tiene una base
biológica?6
as Glosario Bibliografía
nadas
TEMA N° 2: EXPERIMENTOS MULTINOMIALES Y TABLAS DE CONTINGENCIA
1 BONDAD DE AJUSTE (Triola, 2009).
torio Anotaciones
A menudo la toma de decisiones requiere que se pruebe alguna prueba de hipótesis
a cerca del comportamiento que tiene la distribución poblacional desconocida, o si
dicha distribución se comporta de manera similar a alguna otra distribución cono-
cida como la normal, la de Poisson, u otras.
Podríamos plantear entonces las siguientes hipótesis:
Ho: La distribución poblacional tiene comportamiento normal.
Hi: La distribución no tiene comportamiento normal.
La prueba de bondad de ajuste por lo tanto es aquella que determinará si la dis-
tribución en cuestión tiene o se ajusta a la distribución particular planteada en la
hipótesis (en el ejemplo la distribución normal), utilizando datos muestrales toma-
dos a partir de la población que representan constituyéndose estos en evidencia.
El estadístico de prueba para la prueba de bondad es:
χ2 = ∑
k
(Oi − Ei )2
i =1 Ei
donde:
O representa la frecuencia observada de un resultado.
E representa la frecuencia esperada de un resultado.
k representa el número de categorías diferentes o resultados.
n representa el número total de ensayos.
Es importante indicar que los valores críticos se calculan en la tabla de distribución
chi-cuadrada utilizando k-1 grados de libertad. Todas las pruebas son de cola dere-
cha.
DIAGRAMA N°02: PRUEBAS DE BONDAD DE AJUSTE 7
7 Fuente: Tomado de Estadística, Mario Triola, 10°Ed., Capítulo 11, página 594
ESTADÍSTICA II
UNIDAD III: ESTADÍSTICA NO PARAMÉTRICADesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
89
viles bajo la premisa de que los cuatro tipos son igualmente populares y la demanda
de cada tipo es la misma. Sin embargo, recientemente las existencias se han vuelto
más difíciles de controlar, y considera que debería probar su hipótesis respecto a
una demanda uniforme.
¿Qué podemos concluir acerca de los datos observados?
Solución
i) Planteamos las hipótesis.
H0: La demanda es uniforme para los cuatro tipos de autos.
H1: La demanda no es uniforme para los cuatro tipos de autos.
ii) Como el total de ventas es 48, si la demanda es uniforme se espera de que cada
marca debe vender 12 unidades, por lo que nuestro tablero quedaría:
iii) Calculamos el estadístico de prueba utilizando las frecuencias observadas y las fre-
cuencias esperadas.
k
(Oi − Ei )2
χ2 = ∑
i =1 Ei
χ2 =
(15 − 12)2 + (11 − 12)2 + (10 − 12)2 + (12 − 12)2 = 1.17
12 12 12 12
iv) Ubicamos el valor crítico en la tabla de valores críticos de chi cuadrado, utilizando
k-1 grados de libertad, siendo k=4, por lo que los grados de libertad son 3 y un nivel de
significancia del 0.05.
χ 02.05,3 = 7.815
v) La regla de decisión la podemos observar en el siguiente gráfico, teniendo en cuenta
lo siguiente:
as Glosario Bibliografía
nadas
torio Anotaciones
vi) Como 1.17 < 7.815, la hipótesis de que la demanda no es uniforme no se rechaza.
Ejemplo
Un ingeniero de control de calidad toma una muestra de 10 neumáticos que salen
de una línea de ensamblaje y desea verificar sobre la base de los datos que siguen,
los números de llantas con defectos observadas en 200 días, si es cierto que el 5%
de todos los neumáticos tienen defecto; es decir, si el muestrea una población bi-
nomial con n = 10 y .
Solución
i) Planteamos las hipótesis:
Ho: La población es binomial
Ha: La población no es binomial
ii) Hallamos las frecuencias esperadas utilizando la distribución binomial:
f ( x) = ( )π
n
x
x
(1 − π ) n − x , con n = 10 y π = 0.05
iii) Reemplazando los valores:
f (0) = ( )0.05
10
0
0
(1 − 0.05)10 −0 = 0.599
f (1) = ( )0.05
10
1
1
(1 − 0.05)10 −1 = 0.315
y la probabilidad de 2 ó más = 1.0 - 0.599 - 0.315 = 0.086
iv) Con estos valores podemos encontrar las frecuencias esperadas:
200 (0.599) = 119.8
200 (0.315) = 63
200 (0.086) = 17.2
Número de unidades fo fe
con defecto
0 138 119.8
1 53 63
2 ó más 9 17.2
ESTADÍSTICA II
UNIDAD III: ESTADÍSTICA NO PARAMÉTRICADesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
91
χ = 8.26
2
viii) Como 8.26 es mayor que 5.99, rechaza la hipótesis nula con un nivel de signi-
ficancia de 0.05. Por lo que se concluye que el verdadero porcentaje de neumáticos
con defecto no es el 5%.
Ejercicio
Una moneda fue lanzada al aire 1000 series, de 5 veces cada serie y se observó el
número de caras de cada serie. El número de series en los que se presentaron 0, 1,
2, 3, 4 y 5 caras se muestra en la siguiente tabla.
Número de series
Número de caras
(frecuencia observada)
0 38
1 144
2 342
3 287
4 164
5 25
Total 1000
Ajuste los datos a una distribución binomial con un nivel de significancia del 0.05.
Use n=5.
Nota: Para hallar π recuerde que µ = nπ , entonces primero halle la media y
luego divídala entre n.
2 INDEPENDENCIA Y HOMOGENEIDAD
Los datos categóricos representan atributos o categorías, cuando en un análisis se
consideran dos variables categóricas, entonces los datos se organizan en tablas lla-
madas tablas de contingencia o tablas de clasificación cruzada. Primero se discute
la relación entre las variables que definen las filas y las columnas de tablas de con-
tingencia y luego las medidas que dan una idea del grado de asociación entre las
dos variables categóricas.
ollo
nidos 92
Actividades Autoevaluación UNIDAD III: ESTADÍSTICA NO PARAMÉTRICA
as Glosario Bibliografía
nadas
Las hipótesis de independencia son:
Ho: No hay asociación entre las variables A y B (hay independencia)
Ha: Sí hay relación entre las variables A y B
torio Anotaciones
χ2 = ∑
k
(Oi − Ei )2
i =1 Ei
Oi = Valor observado en la i-ésimo celda.
Ei = Valor esperado en la i-ésimo celda.
k = Categorías o celdas.
Con n renglones y m columnas en la tabla de contingencia, el estadístico de
prueba tiene una distribución ji cuadrada con (n – 1).(m – 1) grados de liber-
tad, siempre y cuando las frecuencias esperadas sean 5 o más para todas las
categorías. En consecuencia proseguimos con el cálculo de la estadística de
prueba ji cuadrada.
En situaciones como las siguientes, se puede estar interesado en determinar si
dos variables están relacionadas:
¿Están relacionados los hábitos de lectura con el sexo del lector?
¿Es independiente la opinión sobre la política exterior de la política partidista?
¿Es independiente el sexo de una persona de su preferencia en colores?
¿Son independientes el tamaño de una familia y el nivel de educación de los
padres?
¿Está relacionado el desempleo con el incremento de la criminalidad?
¿El precio está asociado con la calidad de un producto electrodoméstico?
¿El estado nutricional está asociado con el desempeño académico?
χ2 =
(38 − 32.43)2 + (31 − 36.57 )2 + (9 − 14.57 )2 + (22 − 16.43)2
32.43 36.57 14.57 16.43
χ 2 = 5.8227
as Glosario Bibliografía
nadas
torio Anotaciones
vi) Como el valor calculado 5.8227 es mayor que el valor crítico 3.8414 se rechaza
la hipótesis nula de independencia de las variables por lo que se concluye que la
práctica de algún deporte disminuye la depresión.
Ejercicio
La oficina de Recursos Humanos de la universidad quiere determinar si la satis-
facción en el trabajo es independiente del puesto de trabajo. Para ello realizó un
estudio entre los docentes administrativos y encontró los resultados mostrados en
la tabla siguiente. Con un nivel de significancia de 0.05, pruebe si son dependientes
la satisfacción en el trabajo y el puesto de trabajo.
Ejercicio
En un experimento para estudiar la dependencia de la hipertensión de los hábitos
de fumar, se tomaron los siguientes datos de 180 individuos:
Con hipertensión 21 36 30
Sin hipertensión 48 26 19
Nº niños Nº niños
Comunidad
sin caries con caries
Huancayo 38 87
Cercado de 8 117
lima
Cajamarca 30 95
Ica 44 81
Arequipa 64 61
Trujillo 32 93
Se desea saber si la incidencia de caries es la misma en las seis ciudades.
Solución
i) Planteamos las hipótesis:
Ho: Hay homogeneidad en la incidencia de caries en las seis ciudades
Ha: No hay un comportamiento homogéneo en la incidencia de caries en las ciu-
dades analizadas.
ii) Calculamos las frecuencias esperadas.
Nº niños Nº niños
Comunidad
sin caries con caries
Huancayo 38 87 125
Cercado de 8 117 125
lima
Cajamarca 30 95 125
Ica 44 81 125
Arequipa 64 61 125
Trujillo 32 93 125
216 534 750
Nº niños Nº niños
Comunidad
sin caries con caries
Huancayo 216x125/750=36 534x125/750=89
Cercado de 36 89
lima
Cajamarca 36 89
Ica 36 89
Arequipa 36 89
Trujillo 36 89
χ2 =
(38 − 36)2 + (8 − 36)2 + (30 − 36)2 + ... +
(93 − 89)2
36 36 36 89
χ 2 = 65.85
as Glosario Bibliografía
nadas
Nivel de significancia=0.05
torio Anotaciones
v) Como el estadístico de prueba 65.85 es mayor que el valor crítico 11.07 hay
evidencia estadística para rechazar la hipótesis nula. Se concluye entonces que el
contenido de flúor en el agua puede ser la causa de la diferencia en la incidencia
de caries en las ciudades analizadas.
Ejercicio
Un investigador estudia la efectividad de tres remedios R1, R2 y R3 para aliviar
cierta enfermedad. Para esto escogió tres muestras aleatorias de tamaños 50, 70 y
60 de pacientes con dicha enfermedad, suministrando a la primera el remedio R1,
a la segunda el remedio R2 y a la tercera el remedio R3 midiendo la efectividad de
los remedios en tres niveles: Sin alivio, cierto alivio y alivio total. Los resultados del
experimento se presentan en la tabla siguiente:
¿Puede usted inferir con un nivel de significancia del 0.01, que los tres remedios
para la alergia son igualmente efectivos?9
donde
ni es el número de observaciones en la i-ésima muestra
n es el número total de observaciones en todas las muestras.
Ejemplo
Un nuevo gerente de un proveedor de supermercados debe comparar el tiempo
que toma a tres clientes pagar por los productos entregados. Se seleccionan alea-
toriamente varias compras de cada cliente, junto con el número de días que cada
uno se tomó en liquidar su cuenta. Los resultados aparecen en la tabla siguiente:
Han pasado más de diez años desde el colapso de los regímenes stalinistas de Eu-
ropa Oriental. 1989 es recordado por la ola de protestas y huelgas que se expandió
plementadas desde arriba.
as Glosario Bibliografía
nadas
portation Safety Administration de USA. Se compraron automóviles nuevos, se
impactaron contra una barrera fija a 35 mi/h y se registraron las mediciones en
un maniquí en el asiento del conductor. Utilice los datos muestrales listados abajo
torio Anotaciones
para probar las diferencias en las mediciones de heridas en la cabeza (de acuerdo
con el Head Injury Criterion, HIC) en cuatro categorías de peso. ¿Existe evidencia
suficiente para concluir que las mediciones de heridas en la cabeza para las cuatro
categorías de peso de
automóviles no son las mismas? ¿Sugieren los datos que los automóviles más pesa-
dos son más seguros en un choque?10
rs = 1 −
n(n 2 − 1)
Donde:
n: número de pares de datos muestrales.
di: son las diferencias entre los puestos de los miembros de los distintos pares.
Si existieran empates, el estadístico de prueba se calcula con la siguiente fórmula:
n∑ xy − (∑ x )(∑ y )
rs =
( )
n ∑ x 2 − (∑ x )
2
( )
n ∑ y 2 − (∑ y )
2
Recordatorio Anotaciones
as Glosario Bibliografía
nadas
9 95 93
10 91 94
11 92 95
torio Anotaciones
3 PRUEBA DE RACHAS
Cuando no existe aleatoriedad, muchas de las herramientas estadísticas en las cua-
les se confía son de poco uso o de ningún uso. Para comprobar la aleatoriedad se
utiliza la prueba de rachas, que es una prueba no paramétrica de aleatoriedad en
el proceso de muestreo.
Una racha es una serie continua de uno o más símbolos, así se tiene una sucesión
en que intervienen dos tipos de símbolos:
AAAABBAAABBBAAAAAAABB
Entonces definimos una racha como una sucesión de uno o más símbolos idénticos
que están precedidos o seguidos por un símbolo diferente o por ninguno, siendo la
as Glosario Bibliografía
nadas
longitud de una racha el número de símbolos iguales que incluye.
La sucesión anterior presenta 6 rachas, las cuales se pueden separar por barras
verticales:
torio Anotaciones AAAA/BB/AAA/BBB/AAAAAAA/BB
Se observa entonces que hay una racha de longitud 4, 4(A), dos rachas de longitud
2, (2B), una racha de longitud 3, (3A), etc.
Estadístico de prueba:
Donde
NOTA: Para analizar datos numéricos, o sea la aleatoriedad por arriba o por debajo
de la media o de la mediana, se prueba la aleatoriedad por la forma como los datos
numéricos fluctúan por encima o por debajo de una media o mediana.
ESTADÍSTICA II
UNIDAD III: ESTADÍSTICA NO PARAMÉTRICADesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
103
Recordatorio Anotaciones
as Glosario Bibliografía
nadas
CUADRO N°21: VALORES CRÍTICOS PARA LA PRUEBA DE RACHAS15
torio Anotaciones
Ejemplo
El principal diario de la localidad mantenía un registro del sexo de las personas que
llamaban a la oficina de circulación para quejarse de los problemas con la entrega de la
revista sabatina. Para un sábado reciente, estos datos fueron los siguientes:
M, F, F, F, M, M, F, M, F, F, F, F, M, M, M, F, M, F, M, F, F, F, F, M, M, M, M, M
Usando el nivel de significancia de 0.05, pruebe la aleatoriedad de esta secuencia. ¿Hay
algo respecto a la naturaleza de este problema que nos lleve a la conclusión que una
secuencia así no es aleatoria?
Solución
i) Planteamos las hipótesis:
H0: Existe aleatoriedad en la muestra.
H1: No existe aleatoriedad en la muestra.
ii) Identificamos las rachas:
M/FFF/MM/F/M/FFFF/MMM/F/M/F/M/FFFF/MMMMM
Encontramos un total de G=13 rachas.
iii) El estadístico de prueba es 13 y el valor crítico lo ubicamos en la tabla de valores
críticos para la prueba de rachas con n1= 14 para los varones y n2=14 para las mujeres
siendo de 9 a 21 rachas.
iv) Como el estadístico de prueba se encuentra entre los valores críticos se acepta la
hipótesis nula de existencia de aleatoriedad. Por lo que no hay evidencia para pensar
que la secuencia no es aleatoria.
15 Tomado de Estadística, Mario Triola, 10°Ed., Apéndice A, página 784, tabla A10
ESTADÍSTICA II
UNIDAD III: ESTADÍSTICA NO PARAMÉTRICADesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
105
recurrente en las máquinas. ¿Habrá algún indicio para pensar que existe algún
problema cíclico en las máquinas?
Solución
i) Siendo la mediana de 37, se utiliza como valor de referencia.
ii) Las observaciones caen o por arriba (A) o por abajo (B) de 37, se representan
de la siguiente manera:
31 57 52 22 24 59 25 29 27 44 43 32 40 37 60
B A A B B A B B B A A B A A
Ejercicio
Pruebe la aleatoriedad de la siguiente muestra usando un nivel de significancia de
0.05:
A, B, A, A, A, B, B, A, B, B, A, A, B, A, B, A, A, B, B, B, B, A, B, B, A, A, A, B, A, B, A, A
Ejercicio
La municipalidad provincial recibe diariamente solicitudes para matrimonios civi-
les. Un estudio registra las solicitudes de los últimos 30 días hábiles.
Diagrama Objetivos Inicio
3, 4, 6, 8, 4, 6, 7, 2, 5, 7, 4, 8, 4, 7, 9, 5, 9, 10, 5, 7, 4, 9, 8, 9, 11, 6, 7, 5, 9, 12
Con un nivel de significancia del 0.01 ¿existen motivos para pensar que la serie
registrada proviene de alguna característica del entorno?
Desarrollo Actividades Autoevaluación
de contenidos
LECTURA SELECCIONADA N° 1
Lecturas Glosario Bibliografía
seleccionadas
¿LOS ESTUDIANTES CLASIFICAN A LAS UNIVERSIDADES DE LA MISMA MANERA
QUE EL U.S. NEWS AND WORLD REPORT?
Mario
RecordatorioTriola. Página 675.
Anotaciones
Cada año, la revista U.S. News and World Report publica una clasificación de uni-
versidades con base en estadísticos tales como las tasas de admisión, las tasas de
graduación, el tamaño de los grupos, la razón entre profesores y estudiantes, los sa-
larios de los profesores y las calificaciones de los administradores otorgadas por sus
compañeros. Los economistas Christopher Avery, Mark Glickman, Caroline Minter
Hoxby y Andrew Metrick usaron un método alternativo para analizar la selección
de universidades de 3240 estudiantes del último año de preparatoria con alto ren-
dimiento escolar. Examinaron las universidades que ofrecen admisión junto con
las universidades que los estudiantes eligen. La tabla siguiente lista el orden de
una pequeña muestra de universidades, así como también cierto acuerdo entre el
orden de preferencia de los estudiantes y las calificaciones de la revista, aunque
también indica cierto desacuerdo. Por ejemplo, de las ocho universidades conside-
radas, Harvard ocupó el primer lugar tanto para los estudiantes como para la revista
U.S. News and World Report. Sin embargo, de las ocho universidades incluidas, la
ollo
nidos 106
Actividades Autoevaluación UNIDAD III: ESTADÍSTICA NO PARAMÉTRICA
as Glosario Bibliografía
nadas
Universidad de Pennsylvania fue considerada en séptimo lugar por los estudiantes
pero en tercer lugar por la revista.
torio Anotaciones Consideremos el tema de una correlación entre la clasificación de los estudiantes
y la clasificación de la revista. El coeficiente de correlación lineal r se utiliza para
medir la asociación entre dos variables y requieren datos apareados, y los datos de
la tabla están apareados. Sin embargo, existe una diferencia muy importante: los
métodos de correlación y regresión tienen requisitos como las distribuciones nor-
males, y los rangos como los que aparecen en la tabla no satisfacen estos requisitos.
En dichos métodos no se pueden utilizar los datos muestrales presentados. En este
capítulo se presentan varios métodos que se utilizan con datos que no satisfacen el
requisito de una distribución normal. En particular, varios métodos de esta sección
pueden emplearse con datos muestrales en el formato de rangos, como los de la
tabla. En una de las secciones se estudiará un método para poner a prueba una
correlación con datos apareados que no tienen el formato de rangos. Entonces,
seremos capaces de analizar el grado de acuerdo y desacuerdo entre las clasificacio-
nes de los estudiantes y de la revista, como aparecen en la tabla. Así, probaremos si
existe una correlación entre las preferencias de los estudiantes y la clasificación de
la revista, y podremos contestar la siguiente pregunta importante: ¿Los estudiantes
coinciden con la revista?
Diagrama
Objetivos Inicio
ACTIVIDAD N° 1
Desarrollo Actividades Autoevaluación
de contenidos
Esta actividad puede consultarla en su aula virtual.
ACTIVIDAD N° 2
Desarrollo Actividades Autoevaluación
de contenidos
Recordatorio Esta actividad puede consultarla en su aula virtual.
Anotaciones
Diagrama Objetivos
Inicio
Lecturas Glosario Bibliografía
seleccionadas
CONTROL DE LECTURA N° 2
Desarrollo Actividades Autoevaluación
de contenidos
Recordatorio Anotaciones
Esta actividad puede consultarla en su aula virtual.
Recordatorio Anotaciones
ESTADÍSTICA II
Objetivos Inicio
UNIDAD III: ESTADÍSTICA NO PARAMÉTRICADesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
107
Actividades Autoevaluación
os Lecturas Glosario Bibliografía
seleccionadas
Son correctas:
a) Sólo I y II
b) Sólo I
c) Sólo I y III
d) Ninguna.
e) I; II y III
Son correctas
a) I; II y III
b) Sólo I y II
c) Sólo I
d) Sólo II
e) Sólo III
as Glosario Bibliografía
nadas
d) No se puede determinar porque son datos de intervalo de frecuencias
e) No se puede utilizan la prueba debido a que son pocas clases
torio Anotaciones
4. En un estudio realizado por Harris Interactive, Inc. se evaluaron las principales em-
presas de Internet y se evaluó también su reputación. En la lista siguiente se muestra
el ranking de 10 empresas de internet en relación, por un lado, con su reputación
y por el otro con el porcentaje de entrevistados que dijeron estar dispuestos a com-
prar acciones de esa empresa.
Empresas Micro- Intel Dell Lu- Texas Cisco Hewlett IBM Moto- Yahoo
soft cent Instru- Sys- Packard rola
ment tems
Reputación 1 2 3 4 5 6 7 8 9 10
Probable 3 4 1 2 9 5 10 6 7 8
compra
Haga una prueba para determinar si existe una correlación por rangos signi-
ficativa, emplee un nivel de significancia de 0.05,¿cuál es su conclusión?
A) H0: rs=0, H1:rs≠ 0, rs= 0.6727, VC=0.648. Se rechaza H0, existe correlación entre
la reputación y la probable compra de acciones.
B) H0: s =0, H1: s ≠ 0, rs= -0.6727, VC=0.648. Se rechaza H0, existe correlación
entre la reputación y la probable compra de acciones.
C) H0: s =0.6727, H1: s ≠ 0, rs= 0.6727, VC ± 0.648. Se rechaza H0, existe corre-
lación entre la reputación y la probable compra de acciones.
D) H0: s =0, H1: s ≠ 0, rs= 0.6727, VC=0.648. No se rechaza H0, existe correlación
entre la reputación y la probable compra de acciones.
E) H0: s =0, H1: s ≠ 0, rs= 0.6727, VC=0.648. Se rechaza H0, existe correlación
entre la reputación y la probable compra de acciones.
5. Las calificaciones dadas a tres productos por un panel de 15 consumidores son las
siguientes:
PRODUCTOS
A B C
50 80 60
62 95 45
75 98 30
48 87 58
65 90 57
Use la prueba de Kruskal Wallis y un nivel de significancia del 0.05 para determinar
si existe diferencia significativa entre las calificaciones dadas a los tres productos
a) H0: No hay diferencia entre las calificaciones dadas a los tres productos, H1:
Hay diferencia entre las calificaciones dadas a los tres productos, H=10.22,
VC=5.991, Conclusión: No se acepta H0 y se concluye que hay diferencia entre
las calificaciones dadas a los productos.
b) H0: No hay diferencia entre las calificaciones dadas a los tres productos, H1:
No hay diferencia entre las calificaciones dadas a los tres productos, H=10.22,
VC=5.991, Conclusión: No se acepta H0 y se concluye que hay diferencia entre
las calificaciones dadas a los productos.
ESTADÍSTICA II
UNIDAD III: ESTADÍSTICA NO PARAMÉTRICADesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
109
d) H0: No hay diferencia entre las calificaciones dadas a los tres productos, H1:
Hay diferencia entre las calificaciones dadas a los tres productos, H=10.22,
VC=24.996, Conclusión: Se acepta H0 y se concluye que no hay diferencia entre
las calificaciones dadas a los productos.
e) H0: No hay diferencia entre las calificaciones dadas a los tres productos, H1:
Hay diferencia entre las calificaciones dadas a los tres productos, H=10.22,
VC=2.575, Conclusión: No se acepta H0 y se concluye que hay diferencia entre
las calificaciones dadas a los productos.
110
ESTADÍSTICA II
Desarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
111
CONTENIDOS
Recordatorio Anotaciones
EJEMPLOS ACTIVIDADES
Desarrollo Actividades Autoevaluación
de contenidos
AUTOEVALUACIÓN BIBLIOGRAFÍA
Lecturas Glosario Bibliografía
seleccionadas
Recordatorio Anotaciones
Lectura seleccionada N° 1
¿Podemos predecir el momento
de la siguiente erupción del géi-
ser Old Faithful?
Mario Triola. Página 515.
Autoevaluación de la Unidad IV
ollo
nidos 112
Actividades Autoevaluación UNIDAD IV: CORRELACIÓN, REGRESIÓN Y CONTROL ESTADÍSTICO DE PROCESOS
as Glosario Bibliografía
nadas
TEMA N° 1: CORRELACIÓN Y REGRESIÓN
La regresión y la correlación son dos técnicas estrechamente relacionadas que com-
torio Anotaciones
prenden una forma de estimación de una relación existente en la población. Este aná-
lisis, comprende el análisis de los datos muestrales para saber si se relacionan y cómo
se relacionan entre sí dos o más variables de una población. El objetivo principal de la
correlación es determinar la fuerza en que las variables están relacionadas y el objetivo
principal de la regresión es descubrir el modo en que se relacionan.
Una herramienta importante para el análisis de correlación y regresión es el diagrama
de dispersión, el cual nos muestra visualmente la manera como las variables analizadas
se relacionan, y a partir de ahí definir el tipo de análisis que se va a realizar.
A continuación se presenta una serie de gráficos que nos ilustrarán las distintas maneras
en que se relacionan dos variables.
Los diagramas de dispersión que acabas de ver te muestran las diferentes relaciones
entre la variable independiente (X) y la variable dependiente (Y), por lo que podemos
señalar que si tanto los valores de X como los valores de Y tienden a seguir un patrón,
entonces existe una correlación.
Ejemplo
Se tiene los valores registrados de las visitas realizadas y los pedidos hechos por
10 vendedores de una empresa. Calcula el coeficiente de correlación de Pear-
son.
as Glosario Bibliografía
nadas
Solución
i) Calculamos ∑x,∑y, ∑x.y, ∑x2 y ∑y2.
ii)
torio Anotaciones
N° VISITAS PEDIDOS EN
VENDE- REALIZADAS MILLONES x.y X2 Y2
DOR (X) S/. (Y)
1 245 13.4 3283 60025 179.56
H0 : ρ = 0 H1 : ρ ≠ 0
ESTADÍSTICA II
UNIDAD IV: CORRELACIÓN, REGRESIÓN Y CONTROL ESTADÍSTICO DE PROCESOSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
115
r n−2
Estadístico de Prueba: t=
1− r2
Recordatorio Anotaciones
FIGURA N°06: PRUEBA DE HIPÓTESIS PARA EL COEFICINETE DE CORRE-
LACIÓN2
as Glosario Bibliografía
nadas
FIGURA N°07: DIAGRAMA DE DISPERSIÓN
torio Anotaciones
b = ∑ 2 ∑ ∑2
n x y− x y
a=
∑ y −b ∑x
n ∑ x − (∑ x ) n n
ERROR ESTÁNDAR DE ESTIMACIÓN
En una medida de dispersión de los valores observados alrededor de la línea
de regresión:
s y,x =
∑(y − y est )2
n−2
S y. X =
∑Y 2
− a ∑ Y − b∑ XY
n−2
INTERVALO DE CONFIANZA
Estima el valor medio de y para una x dada:
1 ( x − x) 2
yest ± tα / 2;n−2 .s yx . +
n (∑ x) 2
∑x 2
−
n
INTERVALO DE PREDICCIÓN
Estima el rango de valores de y para una x dada:
1 ( x − x) 2
yest ± tα / 2;n−2 .s yx . 1 + +
n (∑ x ) 2
∑ x 2
−
n
Ejemplo
El gerente municipal de construcción considera que la demanda de camiona-
das de hormigón puede estar relacionada con el número de permisos de cons-
trucción emitidos en el municipio durante el trimestre anterior.
El gerente ha recolectado los datos que se muestran en la tabla.
ESTADÍSTICA II
UNIDAD IV: CORRELACIÓN, REGRESIÓN Y CONTROL ESTADÍSTICO DE PROCESOSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
117
Permisos de Camionadas de
construcción hormigón (Y)
(X)
Recordatorio Anotaciones
15 6
9 4
40 16
20 6
25 13
25 9
15 10
35 16
Se pide determinar una estimación del número de camionadas cuando el nú-
mero de permisos de construcción es 30.
Solución
i) Realizamos el gráfico de dispersión para el análisis visual
n X Y XY X2 Y2
1 15 6 90 225 36
2 9 4 36 81 16
3 40 16 640 1600 256
4 20 6 120 400 36
5 25 13 325 625 169
6 25 9 225 625 81
7 15 10 150 225 100
8 35 16 560 1225 256
Totales 184 80 2146 5006 950
n∑ XY − ∑ X ∑ Y
r=
[n∑ X 2
][
− (∑ X ) n∑ Y 2 −(∑ Y ) 2
2
]
8(2146) − (184)(80)
r=
[8(5006) − (184) ][8(950) − (80) ]
2 2
ollo
nidos 118
Actividades Autoevaluación UNIDAD IV: CORRELACIÓN, REGRESIÓN Y CONTROL ESTADÍSTICO DE PROCESOS
as Glosario Bibliografía
nadas
2448
r= =
7430400
0.90 Por lo tanto podemos indicar que existe bue-
na relación entre las dos variables, siendo el 81% de la variación
torio Anotaciones
total explicado por el análisis de regresión.
b = ∑ 2 ∑ ∑2
n x y− x y
b = 0.395
n ∑ x − (∑ x )
a=
∑ y −b ∑x a = 0.915
n n
y = a + bx
y = 0.915 + 0.395 x
S y. X =
∑Y 2
− a ∑ Y − b∑ XY
n−2
950 − (0.91)(80) − (0.396)(2146)
SY . X =
8−2
S Y . X = 2.2 embarques
1 ( x − x) 2
yest ± tα / 2;n−2 .s yx . 1 + +
n (∑ x) 2
∑ x 2
−
n
1 ( x − x) 2
s yx . 1 + + = 2.4
n (∑ x) 2
∑x − n
2
ESTADÍSTICA II
UNIDAD IV: CORRELACIÓN, REGRESIÓN Y CONTROL ESTADÍSTICO DE PROCESOSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
119
tα / 2;n−2 = 2.447
Intervalo de predicción (inferior) = 13 – 5.87 = 7.1
Recordatorio Anotaciones
X altura en Y temperatura en ºC
metros
1642 18
2242 12
1000 19
937 21
1178 18
1502 16
2043 0
1502 14
1603 10
975 16
1549 15
1066 20
1495 15
1508 18
1000 23
1000 19
1971 19
982 23
1173 18
907 21
1790 12
2109 11
1410 14
1777 6
910 19
as Glosario Bibliografía
nadas
REGRESIÓN EXPONENCIAL
y = ab x
torio Anotaciones
REGRESIÓN POTENCIAL
y = ax b
REGRESIÓN POLINOMIAL
y = a 0 + a1 x + a 2 x 2 + ... + a k x k
REGRESIÓN CUADRÁTICA
y = a0 + a1 x + a2 x 2
y X1 X2
8 4 20
10 3 22
12 6 23
13 6 26
15 7 27
18 8 30
Realice el ajuste de regresión múltiple.
Solución
i) Llevamos los datos a una hoja del Excel.
ESTADÍSTICA II
UNIDAD IV: CORRELACIÓN, REGRESIÓN Y CONTROL ESTADÍSTICO DE PROCESOSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
121
Recordatorio Anotaciones
as Glosario Bibliografía
nadas
iv) Luego de presionar Aceptar, se muestran los siguientes resultados:
torio Anotaciones
Ejemplo
Elija el mejor modelo para el comportamiento de los siguientes datos:
x y
5 69
9 68
10 45
15 48
15 53
16 50
23 45
25 40
26 23
28 36
29 21
31 32
33 21
34 15
35 26
36 10
ESTADÍSTICA II
UNIDAD IV: CORRELACIÓN, REGRESIÓN Y CONTROL ESTADÍSTICO DE PROCESOSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
123
ii) Haciendo click derecho en cualquier punto activar el comando Agregar línea
de tendencia.
ollo
nidos 124
Actividades Autoevaluación UNIDAD IV: CORRELACIÓN, REGRESIÓN Y CONTROL ESTADÍSTICO DE PROCESOS
as Glosario Bibliografía
nadas
iii) Se muestran las opciones donde debemos realizar la prueba en cada modelo
para poder observar el coeficiente de correlación.
torio Anotaciones
iv) Activamos también Presentar el valor R en el gráfico asi como Presentar ecua-
ción en el gráfico.
ESTADÍSTICA II
UNIDAD IV: CORRELACIÓN, REGRESIÓN Y CONTROL ESTADÍSTICO DE PROCESOSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
125
as Glosario Bibliografía
nadas
torio Anotaciones
Ejercicio
Elija el mejor modelo para el comportamiento de los siguientes datos:
x y
48 1
56 1.25
58 1
58 3
59 4.5
62 3
67 2.5
68 3
69 6
69 4
75 1.5
78 3.6
79 5
102 1.25
109 3
110 4
Recordatorio Anotaciones
as Glosario Bibliografía
nadas
CUADRO N° 22: COEFICIENTES PARA LAS CARTAS DE CONTROL3
torio Anotaciones
LSC R = D4 R LSC X = X + A2 R
LIC R = D3 R LIC X = X − A2 R
Donde D4, D3, A2 son constantes que varían según el tamaño de muestra.
p (1 − p ) p (1 − p )
LSC p = p + 3 LIC p = p − 3
n n Recordatorio Anotaciones
np1 + np 2 + .... + np k
Donde: p=
n1 + n2 + ..... + nk
Para ambos casos se debe tener en cuenta en el análisis de las gráficas que los pro-
cesos estarán fuera de control si tienen los siguientes comportamientos:
Ejemplo
Se toman las medidas de los diámetros de una pieza cilíndrica, el tamaño de mues-
tra de cada subgrupo es de cinco, y se toman 25 subgrupos a intervalos de 1 hr.
Realice la carta de control X--R
as Glosario Bibliografía
nadas
torio Anotaciones
Solución
i) Calculamos el rango y el promedio para cada grupo:
v) Luego graficamos:
Ejemplo
Un fabricante de latas de aluminio registra el número de partes defectuosas, toman-
do muestras cada hora de n = 50, con 30 subgrupos. Realizar la gráfica de control
para la siguiente serie de datos obtenida durante el muestreo.
Solución
i) Calculamos la fracción defectuosa de cada muestra:
p (1 − p ) 0.23 * 0.77
LSC p = p + 3 = 0.2313 + 3 =0.4102
n 50
ollo
nidos 132
Actividades Autoevaluación UNIDAD IV: CORRELACIÓN, REGRESIÓN Y CONTROL ESTADÍSTICO DE PROCESOS
as Glosario Bibliografía
nadas
iv) Finalmente trazamos la gráfica:
LECTURA SELECCIONADAS N° 1
Lecturas Glosario Bibliografía
seleccionadas
¿PODEMOS PREDECIR EL MOMENTO DE LA SIGUIENTE ERUPCIÓN DEL GÉISER
OLD FAITHFUL? Mario Triola. Página 515
El géiser Old
Recordatorio Faithful es la atracción más visitada del Parque Nacional Yellowstone. Está
Anotaciones
ubicado cerca del hotel Old Faithful Inn, que tal vez sea la segunda atracción más vi-
sitada de Yellowstone. Los turistas disfrutan la comida, las bebidas, el alojamiento y las
tiendas del hotel, pero quieren asegurarse de ver al menos una erupción del famoso
géiser Old Faithful. Los guardabosques del parque ayudan a los turistas publicando el
momento predicho de la siguiente erupción. ¿Cómo hacen esas predicciones?
Cuando el Old Faithful hace erupción, se registran las siguientes mediciones: duración
(en segundos) de la erupción, el intervalo de tiempo (en minutos) entre la erupción
anterior y la erupción actual, el intervalo de tiempo (en minutos) entre la erupción
actual y la siguiente, y la altura (en pies) de la erupción. En la tabla adjunta se incluyen
mediciones de ocho erupciones. (Las mediciones de la tabla son ocho de las 40 erupcio-
nes incluidas en el conjunto de datos 11 del apéndice B del libro Estadística de Mario
Triola). La tabla incluye una muestra pequeña con el fin de que los cálculos sean más
fáciles cuando los datos se utilicen para analizar los métodos de las siguientes secciones.
Una vez que ocurre una erupción, queremos predecir el momento de la siguiente, que
es el “intervalo de tiempo posterior” a la erupción. Para ver cuáles variables afectan los
“intervalos de tiempo posteriores”, podríamos comenzar construyendo diagramas de
dispersión como los que genera el Excel. Al examinar los patrones de los puntos en los
tres diagramas de dispersión, podemos plantear las siguientes conclusiones subjetivas:
1. Al parecer hay una relación entre el intervalo de tiempo posterior a una erupción y
la duración de la erupción.
2. Parece que no existe una relación entre el intervalo de tiempo posterior a una erup-
ción y la altura de la erupción.
3. Parece que no existe una relación entre el intervalo de tiempo posterior a una erup-
ción y el intervalo de tiempo previo a la erupción.
Este tipo de conclusiones basadas en diagramas de dispersión son subjetivas, y en este
capítulo presentamos herramientas para analizar temas como éstos:
-¿De qué manera se pueden utilizar métodos estadísticos para determinar objetivamen-
te si hay una relación entre dos variables, como los intervalos de tiempo posteriores a las
erupciones y la duración de éstas?
ESTADÍSTICA II
UNIDAD IV: CORRELACIÓN, REGRESIÓN Y CONTROL ESTADÍSTICO DE PROCESOSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
133
ACTIVIDAD N° 1:
Desarrollo Actividades Autoevaluación
de contenidos
Esta actividad puede consultarla en su aula virtual.
Diagrama Objetivos Inicio
TAREA ACADEMICA N° 2
Desarrollo Actividades Autoevaluación
de contenidos
Recordatorio Anotaciones
Esta actividad puede consultarla en su aula virtual.
Recordatorio Anotaciones
ollo
nidos 134
Actividades Autoevaluación
Diagrama
UNIDAD IV:InicioCORRELACIÓN, REGRESIÓN Y CONTROL ESTADÍSTICO DE PROCESOS
Objetivos
GLOSARIO5
Lecturas Glosario Bibliografía
seleccionadas
torio Anotaciones
Análisis de contingencia: Es el estudio que se realiza con las tablas de contingencia y
consiste en analizar el grado de asociación o dependencia entre dos variables cualitativas;
para medir el grado de dependencia se utiliza el coeficiente de contingencia. (Ver coefi-
Recordatorio
ciente de contingencia).
Anotaciones
Análisis de varianza: Es un método para comparar dos o más medias (Ver media) de «n»
grupos analizando la varianza de los datos, tanto entre «n» grupos como dentro de ellos.
Bondad de ajuste: Es un indicador que permite discernir acerca de qué tan buena es
la ecuación obtenida. Para determinar la bondad de un ajuste se utilizan diferentes
criterios en la regresión lineal. Unos se refieren a los residuales como son el valor de
la sumatoria de residuales al cuadrado, la varianza, la desviación estándar del ajuste y
el coeficiente de correlación al cuadrado. Otro indicador de la bondad de ajuste es el
realizado mediante el test de bondad de ajuste utilizando la prueba Ji-Cuadrada (X2),
Kolgomorov -Smirnov (K-S) entre otras.
Coeficientes de regresión: Son los valores constantes de una ecuación de regresión li-
neal. En el modelo de regresión lineal siguiente los coeficientes son a y b.
Diagrama de dispersión: Es un gráfico utilizado para representar la relación entre los va-
lores observados de dos variables numéricas. También se conoce como nube de puntos.
des, en el cual cada elemento de la población total o universo tiene una probabilidad
conocida de selección. (Ver muestreo aleatorio).
Muestreo sistemático: Es una variante del método aleatorio simple de selección de cada
elemento de la muestra. Se aplica cuando la población está listada en algún orden. Con-
siste en seleccionar un número aleatorio menor que N/n y luego los (n-1) elementos
de la muestra se eligen agregando al primer aleatorio: el entero K obtenido por K=N/n
y así sucesivamente. El primer elemento de la muestra es seleccionado al azar. Por lo
tanto, una muestra sistemática puede dar la misma precisión de estimación acerca de
la población que una muestra aleatoria simple cuando los elementos en la población
están ordenados al azar.
as Glosario Bibliografía
nadas
PRUEBA DE HIPÓTESIS: Es una técnica que permite rechazar o aceptar la hipótesis
en base de la información proporcionada por la muestra. (Ver contraste de hipótesis).
torio Anotaciones PRUEBA JI-CUADRADO: Es una prueba que permite contrastar si la hipótesis H0 es
coherente con los datos obtenidos en la muestra. Se puede utilizar para:
1. Bondad de un ajuste.
2. Criterio de independencia.
3. Criterio de homogeneidad.
REGIÓN DE RECHAZO: Conocida también como región crítica, está formada por el
conjunto de valores con los cuales se rechaza la hipótesis nula.
BIBLIOGRAFÍA DE LA UNIDAD IV
Lecturas Glosario Bibliografía
seleccionadas
Triola, M.(2012). Estadística. México: Pearson Educación
Berenson, M. y Levine, D. (2010).Estadística Básica en Administración, Conceptos y aplicacio-
nes. Mexico: Prentice Hall
Recordatorio Anotaciones
Mendenhall-Sincich .Probabilidad y Estadística para Ingeniería y Ciencias. Prentice Hall. Cuar-
ta Edición.
Díaz, A. (2013). Estadística Aplicada a la Administración y Economía. Mc Graw Hill. Primera
Edición
ESTADÍSTICA II
UNIDAD IV: CORRELACIÓN, REGRESIÓN Y CONTROL ESTADÍSTICO DE PROCESOSDesarrollo
de contenidos
Actividades Autoevaluación
MANUAL AUTOFORMATIVO
137
AUTOEVALUACIÓN DE LA UNIDAD IV
Actividades Autoevaluación
s
Recordatorio Anotaciones
alquitrán.
ii. Elija la ecuación de regresión que exprese la variable de respuesta (y) de la can-
tidad de nicotina en términos de la variable de predicción (x) de la cantidad de
o Anotaciones monóxido de carbono.
iii. Elija la ecuación de regresión que exprese la variable de respuesta (y) de la canti-
dad de nicotina en términos de las variables de predicción (x) de la cantidad
de alquitrán y la cantidad de monóxido de carbono.
iv. De las ecuaciones de regresión elegidas en los incisos i), ii) e iii), ¿cuál es la mejor
ecuación para predecir la cantidad de nicotina?
v. ¿La mejor ecuación de regresión identificada en el inciso es una buena
ecuación para predecir la cantidad de nicotina? ¿Por qué?
Monóxido
de carbono, 0.9661 0.9333 0.9282 y´=0.182 - 0.0186 X1 + 5.16523E-16
Alquitrán 0.0818X2
Monóxido de
carbono 0.8633 0.7453 0.7358 y´=0.1916+0.0606 X 1.67085E-09
A) i) Y´=0.1540 + 0.0650X
ii) Y´=0.1916 +0.0606X
iii) Y´=0.182 - 0.0186X1+0.0818X2
iv) La mejor ecuación para hacer predicciones es la tercera
v) Sólo tiene una variable.
B) i) Y´=0.1916 +0.0606X
ii) Y´=0.1540 + 0.0650X
iii) Y´=0.182 - 0.0186X1+0.0818X2
iv) La mejor ecuación para hacer predicciones es la tercera
v) Por el tipo de variable
C) i) Y´=0.1540 + 0.0650X
ii) Y´=0.1916 +0.0606X
iii) Y´=0.182 +0.0818X2
iv) La mejor ecuación para hacer predicciones es la primera
v) Tiene más variables dependientes
D) i) Y´=0.1540+0.0650X
ii) Y´=0.1916+0.0606X
iii) Y´=0.182-0.0186X1+0.0818X2
iv) La mejor ecuación para hacer predicciones es la primera
v) Tiene más variables independientes.
E) i) Y´=0.1540 + 0.0650X
ii) Y´=0.1916+0.0606X
iii) Y´=0.182-0.0186X1+0.0818X2
iv) La mejor ecuación para hacer predicciones es la segunda
v) Contiene las variables más importantes.
ollo
nidos 138
Actividades Autoevaluación UNIDAD IV: CORRELACIÓN, REGRESIÓN Y CONTROL ESTADÍSTICO DE PROCESOS
as Glosario Bibliografía
nadas
2. Señale V o F para cada enunciado:
I. Una gráfica de rachas es una gráfica secuencial de valores de datos individuales a
lo largo del tiempo.
torio Anotaciones II. Un proceso está bajo control estadístico si varía de forma natural, en patrones, sin
ciclos o puntos fuera de lo común.
III. La variación aleatoria se debe al azar; es el tipo de variación inherente a cual-
quier proceso que no es capaz de producir un bien o servicio exactamente de la
misma forma cada vez.
IV. La variación asignable resulta de causas identificables como; maquinaria
defectuosa, empleados etc.
a) VVVV
b) FVVV
c) VFVV
d) VFFV
e) FVFF
4. Ud. tiene dos diagramas de dispersión que servirán para que identifique el modelo
matemático que se ajusta mejor a los datos indicados. Suponga que el modelo se
va a emplear únicamente para el alcance que tienen los datos y considere sólo los
modelos lineal, cuadrático, logarítmico, exponencial y potencial.
Experimento de física: Un experimento para una clase de física implica dejar caer
una pelota de golf y registrar la distancia (en metros) que cae en diferentes tiempos
(en segundos) después de ser soltada. Los datos se incluyen en la siguiente tabla.
Proyecte la distancia para un tiempo de 12 segundos, dado que la pelota de golf se
dejo caer de un edificio con una altura de 50 m con el modelo de regresión más
apropiado. Debe responder a: i)¿Cuál es el mejor modelo?, ii) ¿Cuál es el estimado?
y iii) ¿Cómo interpreta los resultados?
b) i) Y= 4.8952X2 – 0.0286X+0.0048
ii) 705 metros
iii) La distancia de 705 metros sobrepasa la altura de 50 metros que tiene el edificio.
c) i) Y= 0.0286X +0.0048
ii) 705 metros
iii) La distancia de 705 metros sobrepasa la altura de 50 metros que tiene el edificio.
d) i) Y= 14.657X – 6.1143
ii) 169.67 metros
iii) La distancia de 169.77 metros sobrepasa la altura de 50 metros que tiene el edi-
ficio, el experimento está errado.
e) i) Y= 14.657X – 6.1143
ii) 169.67 metros
iii) La distancia de 169.77 metros sobrepasa la altura de 50 metros que tiene el
edificio.
5. Construya una gráfica para las medias y determine si la media del proceso está bajo
control estadístico. Si no es así, identifique cuál de los tres criterios para establecer
una falta de control conduce al rechazo de una media estadísticamente estable. ¿Ne-
cesita este proceso una acción correctiva?6
Marque lo incorrecto.
a) Hay un patrón de variación creciente.
b) Hay puntos que se ubican fuera del límite superior de control.
c) Existen ocho puntos consecutivos que están por debajo de la línea central.
d) La media del proceso se encuentra bajo control estadístico.
e) El proceso necesita acciones correctivas.
as Glosario Bibliografía
nadas
ANEXO Nº 1
Solucionario de las Autoevaluaciones
torio Anotaciones
AUTOEVALUACIÓN DE LA UNIDAD I
No de pregunta RESPUESTA
1 D
2 A
3 E
4 B
5 E
6 B
7 D
8 D
9 A
10 C
AUTOEVALUACIÓN DE LA UNIDAD II
No de pregunta RESPUESTA
1 E
2 C
3 C
4 B
5 D
6 E
7 A
8 E
9 E
10 C
No de pregunta RESPUESTA
1 C
2 D
3 A
4 E
5 E
AUTOEVALUACIÓN DE LA UNIDAD IV
No de pregunta RESPUESTA
1 D
2 E
3 A
4 D
5 D