Академический Документы
Профессиональный Документы
Культура Документы
ASIGNATURA
ESTADSTICA
Septiembre, 2015
ndice de contenido
Objetivos
.
Introduccin ..
1. Unidad I: Estadstica Descriptiva
...
Ramas de la estadstica..
Conceptos
.
Escalas de medicin
Actividad de Autoaprendizaje N 1
.
Organizacin de datos
Representacin Grfica ..
Actividad de Autoaprendizaje N 2
Medidas de posicin central ..
Media
Mediana..
Moda .
Medidas de posicin no central.
Cuartiles y Percentiles ..
Medidas de variacin ..
Varianza, Desviacin estndar ..
Coeficiente de variacin..
Actividad de Autoaprendizaje N 3
2. Unidad II: Probabilidades
..
Enfoques de probabilidad y Conceptos .
Reglas de Probabilidad
..
Actividad de Autoaprendizaje N 4 .
Teorema de Bayes
Actividad de Autoaprendizaje N 10 ..
Estimacin por intervalo y tamao de muestra .
Actividad de Autoaprendizaje N 11 ..
Prueba de Hiptesis .
Actividad de Autoaprendizaje N 12 ..
Prueba de independencia...
Actividad de Autoaprendizaje N 13 ..
4
4
4
6
7
9
11
13
17
19
21
21
23
25
25
26
26
27
27
30
31
31
33
37
43
45
47
47
49
50
52
53
55
56
62
63
65
66
67
73
76
86
87
89
91
91
92
92
94
95
95
96
97
99
102
105
107
108
112
113
114
117
122
Objetivos
1. Apropiarse de la terminologa usada en el rea estadstica, con el fin de impulsar la
adquisicin de cultura estadstica por parte de los estudiantes.
2. Identificar maneras adecuadas para la presentacin de informacin y adquirir las
destrezas para construir tablas y grficos estadsticos.
3. Se pretende lograr un aprendizaje significativo con la construccin de objetos de
aprendizaje en cada una de las unidades, adems, del apoyo de herramientas de software
estadstico.
4. Se espera que el curso sea ameno y provechoso para todos (as), logrando potenciar al
estudiante en la aplicacin de la estadstica y fortaleciendo adems, otros valores como: la
honestidad, solidaridad y el trabajo en grupo.
Introduccin
El presente material de estudio no pretende sustituir a ningn texto de Estadstica, por el
contrario es un esfuerzo que trata de resumir los temas que se requieren para cursar la
asignatura; los estudiante que deseen profundizar en el contenido del programa, deben realizar
las consultas necesarias para completar el conocimiento de esta disciplina.
El material cuenta con cuatro unidades donde se presenta una introduccin, el desarrollo
terico, ejercicios resueltos paso a paso, ejercicios propuestos y un formulario creado para
cada unidad. La temtica se resume en: Estadstica descriptiva, Probabilidades, Distribuciones
de Probabilidad y Prueba estadsticas y Regresin y Correlacin Lineal Simple.
UNIDAD I
ESTADSTICA DESCRIPTIVA
de 1880) a 2,5 aos. Cre la firma Computing Tabulating Recording Corporation (CTR),
que bajo la presidencia de Thomas J. Watson fue renombrada a International Business
3.7
3.8
3.9
4. Ramas de la estadstica
Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es la
Descriptiva. Esta parte se dedica nica y exclusivamente al ordenamiento y tratamiento de
la informacin para su presentacin por medio de tablas y de representaciones grficas,
as como de la obtencin de algunos parmetros tiles para la explicacin de la informacin
(la media y la desviacin estndar). Es un primer acercamiento a la informacin.
Estadstica Descriptiva
4.1
Estadstica Inferencial
4.2
5. Conceptos bsicos
Poblacin
Son todos y cada uno de los elementos que se quieren analizar. Puede ser finita o infinita
(en realidad las poblaciones infinitas no existen, pero cuando se trata de un nmero
grande se supone como si lo fuera).
Ej. 1
Muestra
2.1
Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos
sealar:
1. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.
2. Como consecuencia del punto anterior ahorraremos costos.
3. Estudiar la totalidad de las personas con una caracterstica determinada en muchas
ocasiones puede ser una tarea inaccesible o imposible de realizar.
4. Aumentar la calidad del estudio. Al disponer de ms tiempo y recursos, las observaciones y
mediciones realizadas a un reducido nmero de individuos pueden ser ms exactas y
plurales que si las tuvisemos que realizar a una poblacin.
5. La seleccin de muestras especficas nos permitir reducir la heterogeneidad de una
poblacin al indicar los criterios de inclusin y/o exclusin.
Parmetro
Caracterstica numrica de una poblacin.
Estadstico
Caracterstica numrica de una muestra.
Variable
Es una forma de expresar una caracterstica de un grupo de elementos de
estudio, como el peso de una persona, su estatura, el color de sus ojos,una
poblacin o de una muestra.
Ej. 3
Categrica
Variable
Numrica
Continua
Discreta
Ej. 4
Variable
Nacionalidad
Resistencia a la tensin
N de artculos defectuosos
Temperatura (F)
Tipo de variable
Cuando se estudia el comportamiento de una variable hay que distinguir el siguiente concepto:
Individuo
Cualquier elemento que porte informacin sobre el fenmeno que se estudia. As, si
estudiamos la altura de los nios de una clase, cada alumno es un individuo; si estudiamos
el precio de la vivienda, cada vivienda es un individuo.
6. Etapas del anlisis estadstico
R ec ogi d a d e d a tos.
Ordenacin de los mismos en tablas.
Resumen de la informacin recogida a travs de las medidas (Descriptiva).
Analizar los datos provenientes de una muestra para sacar conclusiones sobre la poblacin
de la que proviene la muestra (Inferencial).
7. Niveles o Escalas de medicin
Medir en el campo de las ciencias exactas es comparar una magnitud con otra, tomada de
manera arbitraria como referencia, denominada patrn y expresar cuntas veces la
contiene. En el campo de las ciencias sociales medir es el proceso de vincular conceptos
abstractos con indicadores empricos. Al resultado de medir lo se le llama medida. La
medicin de las variables puede realizarse por medio de cuatro escalas de medicin: la
nominal, ordinal, de intervalo y de razn. Se utilizan para ayudar en la clasificacin de las
variables, el diseo de las preguntas para medir variables, e incluso indican el tipo de
anlisis estadstico apropiado para el tratamiento de los datos. Una caracterstica esencial
de la medicin es la dependencia que tiene de la posibilidad de variacin. La validez y la
confiabilidad de la medicin de una variable depende de las decisiones que se tomen para
operarla y lograr una adecuada comprensin del concepto evitando imprecisiones y
ambigedades, en caso contrario, la variable corre el riesgo inherente de ser invalidada
debido a que no produce informacin confiable.
7.1 Escala nominal
Se establecen categoras con dos o ms niveles que implican un orden inherente entre s.
La escala de medicin ordinal es cuantitativa porque permite ordenar a los eventos en
funcin de la mayor o menor posesin de un atributo o caracterstica. Por ejemplo, en las
instituciones escolares de nivel bsico suelen formar por estatura a los estudiantes, se
desarrolla un orden cuantitativo pero no suministra medidas de los sujetos. Estas escalas
admiten la asignacin de nmeros en funcin de un orden prescrito. Las formas ms
comunes de variables ordinales son tems (reactivos) actitudinales estableciendo una serie
de niveles que expresan una actitud de acuerdo o desacuerdo con respecto a algn
referente. Por ejemplo, ante el reactivo: ENACAL debe privatizarse, el respondiente
puede marcar su respuesta de acuerdo a las siguientes alternativas:
Totalmente de acuerdo
En desacuerdo
De acuerdo
Totalmente en desacuerdo
Indiferente
Las anteriores alternativas de respuesta pueden codificarse con nmeros que van del uno al
cinco que sugieren un orden preestablecido pero no implican una distancia entre un nmero
y otro.
7.3
Escala de intervalos
La medicin de intervalo posee las caractersticas de la medicin nominal y ordinal.
Establece la distancia entre una medida y otra. La escala de intervalo se aplica a variables
continuas pero carece de un punto cero absoluto. El ejemplo ms representativo de este
tipo de medicin es un termmetro, cuando registra cero grados centgrados de
temperatura indica el nivel de congelacin del agua y cuando registra 100 grados
centgrados indica el nivel de ebullicin, el punto cero es arbitrario no real, lo que significa
que en este punto no hay ausencia de temperatura.
Una escala de medicin de razn incluye las caractersticas de los tres anteriores niveles
de medicin (nominal, ordinal e intervalo). Determina la distancia exacta entre los
intervalos de una categora. Adicionalmente tiene un punto cero absoluto, es decir, en el
punto cero no existe la caracterstica o atributo que se mide. Las variables de ingreso,
edad, peso, estatura, nmero de hijos, etc. son ejemplos de este tipo de escala. El nivel de
medicin de razn se aplica tanto a variables continuas como discretas.
Ej. 5
Tipo de variable
Nivel de medicin
10
ACTIVIDAD DE AUTOAPRENDIZAJE N 1
1.
11
2. Describa con sus palabras cada uno de los siguientes trminos, proporcionando adems tres
ejemplos diferentes a los vistos en clase.
2.1
2.2
Variable
2.3
Estadstico
Poblacin
2.4
2.5
Muestra
Atributo
2.6
2.7
Dato
Parmetro
3. Ilustracin
Un estudiante de estadstica desea tener una idea acerca del valor (en unidades
monetarias) del automvil tpico que poseen los profesores de su universidad. Para esto se
aplica cada uno de los trminos bsicos que se han definido.
3.1
3.2
Una muestra es una porcin o parte de una poblacin. Por ejemplo el nmero de
automviles cuyos propietarios son los profesores del departamento de matemticas,
es una muestra.
3.3
3.4
3.5
3.6
3.7
Los datos son el conjunto de valores que corresponden a la muestra obtenida (8, 10,
12, miles de $)
El parmetro acerca del cual se busca informacin es el valor promedio en la
poblacin.
El estadstico que se encontrar es el valor promedio de la muestra
6.
Nmero
69
32
11
7.
8.
8.1
8.2
Variable
8.4
8.5
Estado civil
8.6
Precio de un producto
8.7
8.3
8.8
8.9
8.10
8.11
8.13
8.14
8.12
8.15
8.16
8.17
Tipo de variable
Nivel de medicin
12
8.19
8.20
N de bits transmitidos.
8.21
Satisfaccin de un producto.
8.18
8.22
8.23
9.
Tiempo de reparacin de un
componente electrnico.
Capacidad de almacenamiento de un
disco duro.
10. El gerente de una compaa ha formulado una serie de preguntas al responsable del
11. Suponga que el gerente de la divisin de servicios al cliente de Xenith est interesado
principalmente en determinar si los clientes que han comprado una computadora durante
los ltimos 12 meses quedaron satisfechos con el producto. Usando las tarjetas de garanta
entregadas despus de la compra, el gerente planea encuestar a 1425 de estos clientes.
11.1
Describa tanto la poblacin como la muestra de inters para el gerente.
11.2
Describa el tipo de dato que el gerente desea recolectar principalmente.
11.3
Desarrolle un primer borrador del cuestionario escribiendo una serie de siete
11.4
preguntas categricas y cinco numricas que piensa serian apropiadas para esta
encuesta.
8. Organizacin de datos
Muchas veces uno se pregunta, para qu sirven las encuestas que a veces se hacen en la
calle?, Cmo saber si una estacin de radio se escucha ms que otra? , Cul candidato
puede ganar? La respuesta se comienza con la recaudacin de datos. Los datos son
informacin que se recoge, esto puede ser opinin de las personas sobre un tema, edad o
sexo de encuestados, dnde viven, cuntas personas viven en una casa, qu tipo de sangre
tiene un grupo de personas, etc. Hay datos que pueden ser de mucha utilidad a diferentes
13
Distribucin de frecuencia
Es la representacin estructurada, en forma de tabla, de toda la informacin
que se ha recogido sobre la variable que se estudia.
Variable
(Valor)
X1
Frecuencias absolutas
Simple (f)
Acumulada (fa)
Xn-1
f1
f2
...
fn-1
f1 + f2
...
f1 + f2 +..+ fn-1
Xn
fn
fa = n
X2
...
f1
Frecuencias relativas
Simple (fr)
Acumulada (fra)
fr1 = f1 / n
fr2 = f2 / n
...
frn-1 = fn-1 / n
frn = fn / n
fr1
fr1 + fr2
...
fr1 + fr2 +..+frn-1
fra = 1
14
Ej. 6
Emisiones
radiactivas.
8
12
13
15
16
23
30
N de emisiones
(f)
2
3
2
3
2
2
1
(fa)
2
5
7
10
12
14
15
% de emisiones
(fr)
0,1333
0,2000
0,1333
0,2000
0,1333
0,1333
0,0666
(fra)
0,1333
0,3333
0,4666
0,6666
0,8000
0,9333
1,0000
Tabla de frecuencias
Una distribucin de frecuencias es una tabla en la que se organizan los datos en
clases, es decir, en grupos de valores que describen una caracterstica de los datos
y muestra el nmero de observaciones del conjunto de datos que caen en cada una
de las clases.
1. Distribucin de frecuencias agrupadas
1.1 La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si la
variable toman un nmero grande de valores o la variable es continua.
1.2 Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases.
A cada clase se le asigna su frecuencia correspondiente.
1.3
1.4
Si se decide que el ancho de cada clase sea uniforme, deber calcularse por medio de
la expresin,
c
1.5
1.6
Lmites de clase: Cada clase est delimitada por el lmite inferior de la clase y el
lmite superior de la clase.
LS Li c u
En todos los casos debe comprobarse que la diferencia entre el lmite superior e
inferior de cada clase sea igual al ancho de la clase menos una unidad de variacin.
15
16
97
91
78
86
86
98
76
87
88
93
71
96
87
94
72
98
77
79
78
92
97
84
76
83
88
85
79
73
83
92
76
84
93
76
85
94
77
86
96
78
86
97
78
87
97
79
87
98
79
88
98
Clasificacin ordenada.
71
79
88
72
81
91
Calificacin
70
75
80
85
90
95
74
79
84
89
94
99
N de
solicitantes (f)
3
8
3
7
4
5
(98 71)
1 3,322log30
(fa)
3
11
14
21
25
30
4,57085061 6 5
% de solicitantes
(fr)
0,1000
0,2666
0,1000
0,2333
0,1333
0,1666
(fra)
0,1000
0,3666
0,4666
0,7000
0,8333
1,0000
Marca
de clase
72
77
82
87
92
97
Limites reales
69,5
74,5
79,5
84,5
89,5
94,5
7.2
7.3
74,5
79,5
84,5
89,5
94,5
99,5
7.4
17
7.5
7.6
9. Representacin grfica
Una grfica es la representacin de datos, generalmente numricos, mediante lneas,
superficies o smbolos, para ver la relacin que esos datos guardan entre s. Sirven para
analizar el comportamiento de un proceso, o un conjunto de elementos o signos que
permiten la interpretacin de un fenmeno.
9.1
Histograma
9.2
Polgono de frecuencias
Es un grfico de lneas que se usa
para presentar las frecuencias
absolutas de los valores de una
distribucin en el cual la altura del
punto medio asociado a un valor de
la variable es proporcional a la
frecuencia de dicho valor.
9.3
Ojiva
La diferencia fundamental entre las ojivas y los polgonos de frecuencias es que en el eje
horizontal (x) en lugar de colocar las marcas de clase se colocan las fronteras de clase.
Para el caso de la ojiva mayor que es la frontera menor y para la ojiva menor que, la
mayor.
Una grfica similar al polgono de
frecuencias es la ojiva, pero sta se
obtiene al aplicar parcialmente la
misma tcnica a una distribucin
acumulativa y de igual manera que
stas, existen las ojivas mayores que
y las ojivas menores que.
9.4
Grficas de barras
18
9.5
Grfica de lneas
Son ideales para representar tendencias de ventas, importaciones y otra serie de valores
durante un cierto perodo.
9.6
Grfica circular
ACTIVIDAD DE AUTOAPRENDIZAJE N 2
1.
Los siguientes datos representan el tiempo (en horas) que dedican 50 estudiantes de una
universidad a actividades de horas libres, durante una semana comn de asistencia a clase.
23
16
29
16
30
1.1
1.2
1.3
1.4
17
21
38
24
15
22
28
17
12
20
16
18
19
07
19
22
15
23
18
14
20
28
18
22
24
18
20
20
17
34
12
29
25
27
23
24
14
32
24
18
21
25
19
29
13
15
18
17
22
25
19
13
12
13
16
23
24
12
16
18
19
11
20
15
09
14
12
12
15
24
10
16
23
09
11
13
18
20
24
18
15
19
2.1
2.2
2.3
2.4
N de
estudiantes
4
8
10
20
8
4. Los siguientes datos representan las acciones de mercado (en porcentaje) propiedad de un
fabricante de software de aplicaciones de negocios de Windows durante el ao 2014.
Fabricante
Aldus
Lotus
Microsoft
Software Publishing
Otros
4.1
4.2
5.
Fabricante
Motorola
Sony Ericsson
Nokia
Samsung
Otros
20
Fuente
Papel
Basura de jardn
Desechos slidos
Vidrio
Metales
Plstico
Madera
Otros
%
20
10
26
6
9
10
5
14
Su frmula es:
Ej: 9
x
n
21
2010
6%
2011
8%
2012
10,5%
2013
12,3%
2014
13,1%
Es decir el incremento porcentual promedio del costo del algodn fue de 9,59%
aproximadamente, durante ese periodo.
Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la media
geomtrica. Esta se suele utilizar en series de datos como tipos de inters anuales, inflacin,
etc., donde el valor de cada ao tiene un efecto multiplicativo sobre el de los aos anteriores.
En todo caso, la media aritmtica es la medida de posicin central ms utilizada. Lo ms
positivo de la media es que en su clculo se utilizan todos los valores de la serie, por lo que no
se pierde ninguna informacin. Sin embargo, presenta el problema de que su valor (tanto en el
caso de la media aritmtica como geomtrica) se puede ver muy influido por valores extremos,
que se aparten en exceso del resto de la serie. Estos valores anmalos podran condicionar en
gran medida el valor de la media, perdiendo sta representatividad.
22
23
w x
w
i
Ej: 12
En una agencia de viajes se han vendido 200 pasajes a los precios siguientes:
Precio de venta (cientos de $)
Nmero de pasajes.
xw
w x
w
i i
i
xi
wi
12
60
14
100
16
40
13,8 cientos de $
60 100 40
200
media aritmtica de los datos, donde ninguno toma el valor cero. Este promedio se
utiliza para que los valores extremos no afecten al valor del promedio. Los valores
extremos s afectan cuando se usa el promedio aritmtico o el promedio geomtrico.
H
n
1
Ej: 13
n
1
x
i
A
50
B
62,4
C
77,6
3
3
61,33434215
1
1
1
0,048912238
50 62,4 77,6
de la muestra (un 50% de valores son inferiores y otro 50% son superiores).
No presentan el problema de estar influida por los valores extremos, pero en cambio no
utiliza en su clculo toda la informacin de la serie de datos (no pondera cada valor por
el nmero de veces que se ha repetido).
Para su clculo los datos deben estar ordenados.
Posicin: M e X n 1
2
Ordenar datos,
X1
X2
295 300
X3
350
X4
400
X5
495
X6
520
X7
520
X8
520
X9
680
X10
700
n = 10 (par)
Posicin: M X
e
101 X 5, 5
2
495 520
507,5 508
2
En este ejemplo, la mediana se sita exactamente entre el quinto y sexto dato de este grupo,
ya que entre estos dos valores se encuentra la divisin entre el 50% inferior y el 50% superior.
Ej: 15 Los tiempos en minutos que necesitan varias empresas de seguro para revisar
solicitudes de servicios de cobertura mdica son: 230 50 180 63 120
Determine el tiempo mediano de servicio de cobertura de las empresas de seguro.
Ordenar datos,
X1
50
X2
63
X3
120
X4
180
X5
230
n = 5 (impar)
Posicin: M e X 51 X 3
2
Me X 120 mi nutos
3
24
Q1 : X n 1
Q3 : X 3( n 1)
Q2 : M e
Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o
decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los
resultados. Los deciles y percentiles se calculan de igual manera.
Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma
creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra
el 1% de los resultados. La posicin para determinar los percentiles es:
Pp : X
( n 1)
p
100
Ej: 17 Los siguientes datos se refieren a las ganancias por accin de 10 compaas de la
industria de las comunicaciones.
4,62
1,34
1,62
2,11
1,29
6,04
9,56
4,90
0,84
7,25
17.1 Cul es la ganancia mxima por accin del 25% de las compaas?
X2
1,29
X3
1,34
X4
1,62
X5
2,11
X6
4,62
X7
4,90
X8
6,04
X9
7,25
X10
9,56
25
n = 10
26
Q1 : X 101 X 2,75
Posicin: Q1 : X n 1
4
Es decir el 25% de las compaas tienen como ganancia mxima 1,33 por accin.
17.2
X2
1,29
X3
1,34
Posicin: Pp : X
( n 1)
X4
1,62
p
100
X5
2,11
X6
4,62
P60 : X
(101)
X7
4,90
60
100
X8
6,04
X9
7,25
X10
9,56
X 6, 6
17.3
Lo que nos muestra es, el 60% de las compaas tienen como ganancia mxima
4,79 por accin.
Cul es la ganancia mxima por accin del 75% de las compaas?
17.4
s2
(x
x) 2
n 1
(x
x) 2
n 1
Interpretacin
La desviacin estndar es una medida del grado de dispersin de los datos con respecto
al valor promedio. Dicho de otra manera, la desviacin estndar es simplemente el
"promedio" o variacin esperada con respecto a la media aritmtica.
Por ejemplo, las tres muestras
0
Muestras
0
14
14
14
Cada una tiene una media de 7. Sus desviaciones estndar muestrales son 8,0829,
5,7735 y 1,1547 respectivamente. La tercera muestra tiene una desviacin mucho
menor que las otras dos porque sus valores estn ms cerca de 7.
Coeficiente de variacin: se calcula como el cociente entre la desviacin tpica
(estndar) y la media. El inters del coeficiente de variacin es que al ser un
porcentaje permite comparar el nivel de dispersin de dos muestras. Esto no ocurre
con la desviacin tpica, ya que viene expresada en las mismas unidas que los datos de
la serie.
27
Por ejemplo, para comparar el nivel de dispersin de una serie de datos, como la
altura de los alumnos de una clase y otra serie con el peso de dichos alumnos, no se
puede utilizar las desviaciones tpicas (una se expresa en cm y la otra en kg). En
cambio, sus coeficientes de variacin son ambos porcentajes, por lo que s se pueden
comparar.
s
CV (100%)
x
Coeficiente de asimetra: Karl Pearson desarroll una medida para calcular el sesgo de
una distribucin, llamado Coeficiente de Asimetra. El concepto de asimetra se
refiere, si la curva que forman los valores de la serie presenta la misma forma a la
izquierda y la derecha de un valor central (media aritmtica).
Para medir el nivel de asimetra se utiliza la frmula que viene definida por:
CA
3( x M e )
s
Caractersticas.
Vara de 3.0 a + 3.0
Un valor cero indica una distribucin simtrica.
Si el extremo largo de la distribucin esta a la derecha, se dice que tiene sesgo
positivo.
Si el extremo largo de la distribucin esta a la izquierda, el sesgo es negativo.
Ej: 18 Tomando el Ej. 9.
La gerente de una tienda de equipos electrnicos, desea estudiar el trnsito en su
tienda, descubre que 295, 300, 520, 350, 400, 520, 495, 680, 520, 700 personas
entraron a la tienda durante los pasados diez das.
18.1
28
(x x)
(x x)2
295
(-183)2 = 33489
300
(-178)2 = 31684
520
520 478 = 42
(42)2 = 1764
350
(-128)2 = 16384
400
(-78)2 = 6084
520
520 478 = 42
(42)2 = 1764
495
495 478 = 17
(17)2 = 289
680
(202)2 = 40804
520
520 478 = 42
(42)2 = 1764
700
(222)2 = 49284
Total
183310
Sustituimos en la frmula,
s
(x x)
i
n 1
183310
20367,77778 142,7157237 143
10 1
18.2
Conocemos x 478
s 142,7157237
Sustituimos en la frmula.
s
142,7157237
CV (100%)
(100%) 0,298368459(100%) 29,86%
x
478
Es decir
29
18.3
30
3( x M e ) 3(478 507,5)
CA
0,620113872 0,62
s
142,7157237
Este valor indica un grado menor de asimetra negativa, provocando que el nmero
promedio de personas que visitan la tienda sea menor que el nmero mediano.
ACTIVIDAD DE AUTOAPRENDIZAJE N 3
1.
5 913
3 420
3 750
9 530
5 520
8 735
5 000
8 900
4 500
4 900
5 010
7 012
5 400
datos.
2.
3. Se toma una muestra de seis resistores y se mide su resistencia (en ohm). Los resultados son
los siguientes:
3.1
45
38
47
41
35
43
Calcule:
La varianza y la desviacin estndar muestral.
3.2
y s.
3.3
Reste 30 de cada valor y luego multiplique las diferencias por 10. Ahora calcule s
para
y la de los datos
4.1
4.2
4.3
Muestra 1:
10
10
Muestra 2:
10
10
10
Calcule el rango de ambas muestras. Es posible concluir que las dos muestras exhiben
la misma variabilidad?
Calcule la desviacin estndar de cada una de las muestras. Estas cantidades indican
que las dos muestras tienen la misma variabilidad?
Calcule el coeficiente de variacin de cada una de las muestra y diga cul de las
muestras presenta menor variabilidad relativa.
UNIDAD II
PROBABILIDADES
Introduccin
Para la mayora de las personas, probabilidad es un trmino vago utilizado en el lenguaje
cotidiano para indicar la posibilidad de la ocurrencia de un evento futuro. Esta interpretacin
prctica del trmino puede considerarse aceptable, pero se pretende lograr una comprensin
ms precisa del contexto de su aplicacin, como se mide y de que manera se utiliza la
probabilidad para hacer inferencias. El concepto de probabilidad es necesario cuando se opera
con procesos fsicos, biolgicos y sociales que generan observaciones que no es factible
predecir con exactitud. Adems, la probabilidad y la estadstica se relacionan en una forma
muy curiosa. En esencia la probabilidad es el vehculo que le permite al estadstico usar la
informacin contenida en una muestra para hacer inferencias o para describir la poblacin de
la cual se ha obtenido la muestra.
1.
Enfoques de Probabilidad
Ej: 1.
2.
N de resultados favorables
N total de resultados
31
Probabilidad subjetiva
Se refiere a la probabilidad de ocurrencia asignada a un evento por un individuo
particular.
Ej: 1. La probabilidad que tenga xito un nuevo producto en el mercado.
2. La probabilidad que un conservador gane la prxima eleccin presidencial.
S.
Ej: 2.2 Con referencia a E1 : Suponga que la capacidad productiva del obrero se
Evento (o Suceso)
Un evento simple es el que se puede describir con una caracterstica.
Se simboliza por A, B, C...
Ej: 2.3 Para E 2 existen 3 eventos simples.
32
El complemento de un evento
evento A . Su smbolo es A .
E3
P( A) 0
0 P( A) 1
P( A) 1 P( A)
3.4
3.5
P( S ) 1
P( ) 0
Avance en la organizacin
Si [B]
No [B]
96
70
20
14
116
84
B
A
70
96
20
A B 14
A B 186
Total
166
34
200
166
0,83
200
El resultado 0,83 nos indica la probabilidad que un empleado escogido al azar este
satisfecho con su trabajo.
3.3.2
..
4. Probabilidad Conjunta
4.1.2
70
0,35
200
14
0,07
200
34
5. Regla de la Adicin
P( A B) P( A o B) P( A) P( B) P( A B)
Y se le llama regla general de la adicin.
Ej: 5.1 Refirindonos al ejemplo 3.3
5.1.1 Calcule la probabilidad que un empleado seleccionado al azar este satisfecho
con su trabajo o no haya avanzado en la organizacin.
P( A B )
5.1.2
166
84
70
180
0,90
200 200 200 200
34
84
14 104
0,52
200 200 200 200
P( A B) P( A o B) P( A) P( B)
Ej: 5.2 Un estudio de 200 tiendas de abarrotes revel los siguientes ingresos, despus
del pago de impuestos.
Ingresos despus de los impuestos
Menos de 10 millones de C$
C$10 millones - C$20 millones
Mas de C$20 millones
Sucesos
A
B
C
Total
N de empresas
102
61
37
61
37
98
0,49
200 200 200
35
6. Probabilidad Condicional
P( A B)
P( B)
P( B) 0
96
P( A B)
200 0,8276
116
P( B)
200
6.1.2
96
P( B A)
200 96 0,5783
166
P( A)
166
200
7. Independencia estadstica
P( A)
96
200 96 0,8276
116
116
200
166
0,83
200
36
8. Regla de la Multiplicacin
La frmula para la probabilidad condicional se puede manejar algebraicamente, con lo que
la probabilidad conjunta (A y B) se puede determinar la probabilidad condicional de un
evento.
Se le llama regla general de la Multiplicacin.
P( A B) P( A) P( B / A)
Ej: 8
20 19 380
P( A B) P( A) P( B)
P( A / B) P( A)
P( A B) P( A) P( B)
ACTIVIDAD DE AUTOAPRENDIZAJE N 4
1.
Presente una descripcin del espacio muestral para cada uno de los experimentos aleatorios.
1.1 Cada una de tres piezas maquinadas se clasifica como arriba o abajo de las
especificaciones.
1.2 Cada uno de cuatro bits transmitidos se clasifica como error o sin error.
1.3 En la inspeccin final de fuentes de poder electrnicas podran ocurrir tres tipos de
disconformidades: funcionales, secundarias y de acabado. Las fuentes de poder
defectuosas se clasifican adems segn sea el tipo de disconformidad.
1.4 En la fabricacin de cinta para grabacin digital, cada una de 24 pistas se clasifica de
acuerdo a si contiene o no uno o ms bits con error.
1.5 En un proceso de fabricacin pueden producirse algunas piezas que no son aceptables.
Cada una de tres partes se clasifica como aceptable o no aceptable.
1.6 En el pedido de una computadora puede especificarse memoria de 4, 8 12 megabytes
y capacidad de almacenamiento de disco duro de 200, 300 400 megabytes.
37
B
A
C
6.2
A
A B
6.3
( A B) C
6.1
6.5
( B C )
( A B) C
6.6
( A B)
6.4
38
7. Muestras de una pieza de aluminio forjado se clasifica con base en el acabado de la superficie
(en micro-pulgadas) y en las mediciones de la longitud. Los resultados de 100 piezas se
resumen a continuacin.
Acabado de la
Longitud
superficie
Total
Excelente
Bueno
Excelente
75
7
Bueno
10
8
Total
Sea A denote el evento que una muestra tiene un acabado de la superficie excelente y
sea B el evento que una muestra tiene una longitud excelente. Determine el
B y A B .
nmero de muestras en A B,
8. El anlisis de las flechas para un compresor se resumen por su cumplimiento con las
especificaciones.
El acabado de la
superficie cumple
Si
No
Total
8.1
8.2
La redondez cumple
Si
No
345
57
12
8
Total
Si se sabe que una flecha cumple con los requerimientos de redondez. Cul es la
probabilidad que cumpla con los requerimientos del acabado de la superficie?
Si se sabe que una flecha no cumple con los requerimientos de redondez. Cul es
la probabilidad que cumpla con los requerimientos del acabado de la superficie?
9. Un lote de 100 chips semiconductores contiene 20 que estn defectuosos. Se seleccionan dos
chips del lote, al azar, sin reemplazo.
9.1 Cul es la probabilidad de que el primero que se seleccione este defectuoso?
9.2 Cul es la probabilidad de que el segundo que se seleccione este defectuoso, dado
que el primero estuvo defectuoso?
9.3 Cmo cambia la respuesta del inciso (b) si los chips seleccionados se reemplazaron
antes de la siguiente seleccin?
10. Se clasifican muestras de hule espuma de tres proveedores de acuerdo a si cumplen o no con
las especificaciones. Los resultados de 100 muestras se resumen a continuacin.
Proveedor
1
2
3
Total
Cumple
Si
18
17
50
Total
No
2
3
10
Sea que A denote el evento de una muestra del proveedor 1 y sea que B denote el
evento de una muestra cumpla con las especificaciones. Si se selecciona una muestra de
hule espuma al azar, determine las siguientes probabilidades.
10.1
P(A)
10.4
P(B)
39
10.2
10.3
P(A)
P ( A B)
10.5
10.6
P ( A B)
P( A B)
11. Durante un perodo determinado, aument el valor de mercado de las acciones comunes en
circulacin en una industria, que incluye solamente 12 acciones. Si un inversionista escoge dos
de esas acciones al azar. Cul es la probabilidad de que ambos hayan experimentado un
aumento en su valor de mercado durante ese perodo, si se sabe que 8 aumentaron su valor?
12. Se selecciona una muestra de tres calculadoras de una lista de fabricacin y cada una de ellas
se clasifica como defectuosa o aceptable. Sean A, B y C los eventos de la primera, la segunda
y la tercera calculadora esta defectuosa, respectivamente.
12.1 Describa el espacio muestral para este experimento
12.2 Describa cada uno de los eventos siguientes: A, B , A B , B C
13. De 600 empleados de una compaa, 300 participan en un plan de reparto de utilidades,
400 tienen una cobertura de gastos mdicos y 200 empleados participan en ambos programas.
13.1 Describa cada uno de los sucesos involucrados y presente estos datos en una tabla
de contingencia.
13.2 De un ejemplo de un evento simple.
13.3 De un ejemplo de un evento conjunto.
13.4 Cul es el complemento del suceso Empleado participa en cobertura de gastos
mdicos?
13.5 Cul es la probabilidad que un empleado elegido al azar:
13.5.1 Participe por lo menos en uno de los programas?
13.5.2 No participe en ninguno de los programas?
13.5.3 Participe en el plan de reparto de utilidades considerando que tiene
seguro de gastos mdicos?
13.6 Determine si los eventos empleado participa en el programa de reparto de
utilidades es independiente a tener cobertura de gastos mdicos.
14. De 100 personas que solicitan empleo de operador de computadoras en una firma, 40 tenan
experiencia profesional, 30 maestra y 20 tenan experiencia y maestra.
14.1 Describa cada uno de los sucesos involucrados y presente estos datos en una tabla
de contingencia.
14.2 Cul es la probabilidad que un solicitante escogido aleatoriamente tenga experiencia
o maestra?
14.3 Tenga maestra dado que tiene alguna experiencia profesional.
14.4 Determine si la experiencia y poseer maestra son sucesos independientes.
15. Quinientos clientes de crdito de Credicom. S.A. estn categorizados segn el nmero de
aos que han tenido cuenta de crdito y por su promedio de saldo. De estos clientes 210 han
tenido saldos menores a $100, otros 260 han tenido cuenta de crdito cuando menos 5 aos,
80 han tenido saldos mayores de $100 y cuentas de crdito por menos de 5 aos. Presente
estos datos en una tabla de contingencia.
15.1 Describa cada uno de los sucesos involucrados y presente estos datos en una tabla
de contingencia.
40
15.2.1
16.3
P(A)
P ( A B)
16.4
P( A / B )
P ( A B)
17. Durante una semana determinada se estima que la probabilidad de que el precio de una accin
especfica aumente (A), permanezca sin cambio (C) o se reduzca (R) es de 0,35, 0,20 y 0,45
respectivamente.
17.1 Cmo son los sucesos A, C y R?
17.2 Cul es la probabilidad de que el precio de la accin aumente o permanezca sin
cambio?
17.3 Cul es la probabilidad de que el precio de la accin cambie durante la semana?
18. Si P( A / B) 0,4
P( A) 0,6
independientes?
19. Se estima que la probabilidad de que aumenten las ventas de automviles en el siguiente mes
es de 0,40. Se estima que la probabilidad de que aumenten las ventas de refacciones es de
0,50. Se estima que la probabilidad de que ambas industrias experimenten un aumento en
ventas es de 0,10. Cul es la probabilidad de que:
19.1 Hayan aumentado las ventas de automviles durante el mes, dado que existe
informacin de que han aumentado las ventas de refacciones.
19.2 Hayan aumentado las ventas de refacciones, dado que existe informacin de que
aumentaron las ventas de automviles durante ese mes.
20. La proporcin general de artculos defectuosos en un proceso continuo de produccin es 0,08.
Cul es la probabilidad de que:
20.1 Dos artculos elegidos al azar ninguno tenga defecto?
20.2 Dos artculos escogidos al azar tengan defecto?
41
Total
21.1 Construya una tabla de probabilidad conjunta en base a estos datos muestrales.
21.2 Determine las siguientes probabilidades:
P(A y S)
P(S)
P(B/S)
P(I)
P(D)
P(B o I)
P(C/I)
P(I/S)
P(D y S)
22. La probabilidad de que haya escasez de cemento es 0,28 y la probabilidad de que no habr
escasez y que una obra de construccin se termine a tiempo es 0,64. Cul es la probabilidad
de que la obra se termine a tiempo dado que no habr escasez de cemento?
23. Un estudiante est tomando dos cursos, historia y matemticas. La probabilidad de que
apruebe el curso de historia es 0,60 y matemticas es 0,70. La probabilidad que apruebe
ambas es 0,50. Cul es la probabilidad que pase por lo menos una? Qu regla de
probabilidad aplic?
24. Las probabilidades de dos eventos A y B son 0,20 y 0,30, respectivamente. Los sucesos no
son mutuamente excluyentes. La probabilidad de que ambos A y B ocurran es 0,15 Cul es
la probabilidad de que sucedan A o bien B?
25. Un estudio de las opiniones de los diseadores en lo referente al color primario ms
conveniente para aplicar en oficinas ejecutivas indic:
Color primario
Blanco
Amarillo
Violeta
Verde
Total
N de opiniones
92
86
70
14
42
26. Cada vendedor de una empresa se califica como por debajo del promedio. Promedio o
Arriba del promedio, con respecto a su habilidad para las ventas. Adems, cada vendedor
tambin se califica con respecto a su posibilidad de promocin en: regular, buena o
excelente. En la tabla que sigue se presentan las clasificaciones de estos rasgos para 500
vendedores.
Habilidades en ventas
Por debajo del promedio
Promedio
Arriba del promedio
Total
Posibilidades de promocin
Regular
Buena Excelente
16
12
22
45
60
45
93
72
135
Total
27. Suponga que P(A) = 0,40, P(B/A) = 0,30 Cul es la probabilidad conjunta de A y B?
28. Una encuesta a ejecutivos de alto nivel revel que 45% leen con regularidad el diario La
Prensa, 35% El Nuevo Diario y 25% ambos diarios.
28.1 Qu porcentaje de ejecutivos no lee ninguno de los diarios?
28.2 Cmo se le llama a la probabilidad 0,25?
28.3 Los eventos son mutuamente excluyentes? Explique su respuesta.
9. Teorema de Bayes
La probabilidad condicional toma en cuenta la informacin en cuanto a la ocurrencia de un
evento para predecir la probabilidad de otro evento. Este concepto se puede ampliar para
la revisin de las probabilidades basadas en nueva informacin y para determinar la
probabilidad de que un evento particular se debi a una causa especfica. El procedimiento
para la revisin de estas probabilidades se conoce como Teorema de Bayes y la
composicin de los eventos para resolver los problemas de la probabilidad se facilita
algunas veces al considerar el espacio muestral S como una unin de subconjuntos que son
mutuamente excluyentes.
Es decir,
S B1 B2 .... Bk con Bi B j , i j luego cualquier subconjunto A de S se
puede escribir como,
P( A) P( A B1 ) P( A B2 ) ... P( A Bk )
P( A) P( B1 ) P( A / B1 ) P( B2 ) P( A / B2 ) ... P( Bk ) P( A / Bk )
k
P( A) P( Bi ) P( A / Bi )
i 1
43
44
P ( Bi ) P ( A / Bi )
k
P( B ) P( A / B )
i 1
A : Informa desfavorable.
A : Informe favorable.
0,8
0,2
B1
0,4
S
0,3
0,6
B2
0,7
Probabilidades
a priori.
Probabilidades
condicionales.
P( B1 / A)
P( B1 ) P( A / B1 )
P( B1 ) P( A / B1 ) P( B2 ) P( A / B2 )
P( B1 / A)
(0,4)(0,8)
0,32
0,32
0,64
(0,4)(0,8) (0,6)(0,3) 0,32 0,18 0,50
Probabilidades
conjuntas.
ACTIVIDAD DE AUTOAPRENDIZAJE N 5
1.
El software para detectar fraudes con tarjetas telefnicas personales rastrea el nmero de
reas donde se originan las llamadas cada da. Se ha encontrado que 1% de los usuarios
legtimos hacen llamadas de dos o ms reas en un solo das. Sin embargo, 30% de los
usuarios fraudulentos hacen llamadas de dos o ms reas en un solo da. La proporcin de
usuarios fraudulentos es 0,01%.
1.1 Describa cada uno de los sucesos involucrados y presente esta informacin en un
diagrama de rbol.
1.2 Si el mismo usuario hace llamadas de dos o ms reas en un solo da. Cul es la
probabilidad de que el usuario sea fraudulento?
2.
En una fbrica de zapatos, se sabe por experiencia que la probabilidad es 0,82 de que un
trabajador que ha asistido a un programa de capacitacin de la fbrica cumplir con la cuota
de produccin y que la probabilidad correspondiente es 0,53 para un trabajador que no
asisti al programa de capacitacin. Si el 60% de los trabajadores asisten al programa de
capacitacin de la fbrica.
2.1 Describa cada uno de los sucesos involucrados y presente esta informacin en un
diagrama de rbol.
2.2 Suponga que el trabajador cumpli con la cuota de produccin. Cul es la
probabilidad de que haya asistido al curso?
3.
Suponga que 2% de los rollos de tela de algodn y 3% de los rollos de tela de nylon
contienen defectos. De los rollos usados por un fabricante, 70% son de algodn y 30% son de
nylon.
3.1 Describa cada uno de los sucesos involucrados y presente estos datos en un diagrama
de rbol.
3.2 Cul es la probabilidad que uno de los rollos de tela de nylon usados por el
fabricante seleccionado al azar contenga defectos?
4.
5.
El dueo de una tienda de discos divide a los clientes que entran a su tienda en clientes
en edad escolar, clientes en edad universitaria y clientes mayores y observa que el 30,
50 y 20 por ciento de todos los clientes, respectivamente, pertenecen a estas
categoras. Tambin observa que compran discos el 20 por ciento de los clientes en
45
edad escolar, el 60 por ciento de los clientes en edad universitaria y el 80 por ciento
de los clientes mayores.
5.1 Describa cada uno de los sucesos involucrados y presente esta informacin en un
diagrama de rbol.
5.2 Si un cliente seleccionado aleatoriamente compra un disco. Cul es la probabilidad
que est en edad escolar?
6.
El departamento de crdito de una casa comercial, inform que 30% de sus ventas son en
efectivo, 30% se pagan con cheque en el momento de la adquisicin y 40% se pagan con
tarjetas de crdito. Se tiene que 29% de las compras en efectivo, 90% en cheques y 60% de
las compras con tarjeta de crdito son por ms de $100.
6.1
Describa cada uno de los sucesos involucrados y presente esta informacin en un
diagrama de rbol.
6.2
Alba Marn acaba de comprar un vestido nuevo que cuesta $150. Cul es la
probabilidad de que haya pagado en efectivo?
7.
Tres mquinas M1, M2, M3 producen respectivamente 50%, 30%, 20% del total de artculos
de una fbrica. Las mquinas producen artculos defectuosos en un porcentaje de 7%, 6%,
4% respectivamente. Al colocar la produccin de las tres mquinas en fila y escoger un
artculo.
7.1
Describa cada uno de los sucesos involucrados y presente esta informacin en un
diagrama de rbol.
7.2
Si el artculo escogido es defectuoso. Cul es la probabilidad que haya sido
producido en cualesquiera de las tres mquinas? Tome como decisin el elemento
mayor probabilidad de producir artculos defectuosos.
8.
9.
46
UNIDAD III
Introduccin
La preparacin de un proyecto de investigacin es una tarea compleja, ya que se han de tener
en cuenta multitud de aspectos para que el documento final contemple todos los apartados que
cualquier estructura estndar considera y para que todos los investigadores sepan con qu y
cmo deben proceder en todas las etapas de ejecucin del estudio planteado. Uno de los
dilemas que se presenta cuando se inicia la elaboracin del proyecto es decidir sobre los
individuos o elementos que se incluirn en el estudio: qu caractersticas tendrn criterios de
inclusin y exclusin, a cuntos individuos se estudiar tamao de la muestra y cmo se
elegirn para que entren a formar parte del estudio tcnica de muestreo. Estudiar a toda la
poblacin, que sera la manera ms exacta de conocer lo que se pretende estudiar, es casi
imposible en la prctica. Entre los motivos que lo impiden se encuentran la falta de tiempo, la
escasez de recursos humanos y econmicos, la dificultad para acceder a todos los sujetos, etc.,
por lo que se estudia slo a una parte de ellos, para, posteriormente, generalizar o inferir
los resultados obtenidos a toda la poblacin. Por tanto, cuando se habla de sujetos de estudio,
se ha de diferenciar claramente entre poblacin, muestra e individuo.
1. Distribucin de probabilidad
Una distribucin de probabilidad indica toda la gama de valores que pueden representarse
como resultado de un experimento. Es decir, describe la probabilidad de que un evento
se realice en el futuro y constituye una herramienta fundamental para la prospectiva,
puesto que se puede disear un escenario de acontecimientos futuros considerando las
tendencias actuales de diversos fenmenos naturales. Recordemos inicialmente que
existen las variables aleatorias, siendo aquellas que se asocian a la ocurrencia de un
fenmeno aleatorio. Cuando una de estas variables aleatorias toma diversos valores, la
probabilidad asociada a cada uno de tales valores puede ser organizada como una
distribucin de probabilidad. Las distribuciones de probabilidad pueden representarse a
travs de una tabla, una grfica o una frmula, en cuyo caso tal regla de correspondencia
se le denomina funcin de probabilidad. Toda distribucin de probabilidad es generada por
una variable aleatoria x, y puede ser de dos tipos:
2. Variable aleatoria discreta (x)
Porque solo puede tomar valores enteros y un nmero finito de ellos.
Ej: 2.1 xVariable que nos define el nmero de alumnos aprobados en la asignatura
de Estadstica en un grupo de 40 estudiantes (1, 2 ,3 los 40). Consideraremos
primero las distribuciones de probabilidad para variables discretas. Las propiedades de
las distribuciones de variables discretas son dos, y que posteriormente, al hablar de las
distribuciones de variables continuas, se repetirn de manera muy similar:
0 P(X = x) 1.
P(X = x) = 1, o que es lo mismo: la suma de todas las probabilidades de los
eventos posibles de una variable aleatoria es igual a la unidad.
47
Hay que hacer notar que estas propiedades se enuncian suponiendo que conocemos el
valor de la probabilidad, pero en la realidad esto no ocurre, es decir que no sabemos la
probabilidad y lo que se hace es trabajar con estimaciones. Precisamente esto nos lleva
a modelos tericos que estiman los resultados, los principales son los que a continuacin
se presentan.
3. Valor esperado de una variable aleatoria (v.a)
Para tener una medida del punto central de una distribucin de probabilidad, introducimos
el concepto de esperanza de una variable aleatoria, el valor esperado es la medida
correspondiente del punto central de una variable aleatoria.
Su frmula es:
E ( x) xP( x)
(x )
P( x)
Ej: 4.1 Un contratista est interesado en saber cul es el costo total de un proyecto
para el que pretende presentar una oferta. Estima que los materiales costarn
$25000 y su trabajo $900 al da. Si el proyecto tarda en realizarse X das, el costo
laboral total ser 900X $ y el costo total del proyecto (en $) ser
C ( x) 25000 900 x El contratista estima unas probabilidades subjetivas de la
duracin probable del proyecto.
Duracin X (das)
Probabilidad
4.1.1
10
0,1
11
0,3
12
0,3
13
0,2
14
0,1
E ( x) xP( x)
E( x) 10(0,1) 11(0,3) 12(0,3) 13(0,2) 14(0,1) 11,9 das
Este valor indica que sobre un gran nmero de das, el contratista espera que la
duracin promedio de la obra sea de 11,9 das.
48
V ( x ) 2 ( x ) 2 P( x )
2 (10 11,9) 2 (0,1) (11 11,9) 2 (0,3) (12 11,9) 2 (0,3) (13 11,9) 2 (0,2)
49
ACTIVIDAD DE AUTOAPRENDIZAJE N 6
1.
0
0,05
1
0,10
2
0,20
3
0,20
4
0,20
5
0,15
6
0,10
3.
Contenido de humedad.
3%
4%
5
14
57
4
14
0,25
15
0,10
5.
5. Distribucion Binomial
Consideremos los llamados ensayos de Bernoulli, stos son aquellos experimentos cuyo
resultado es uno de dos posibles y mutuamente excluyentes. Es decir aquel modelo que
sigue un experimento que se realiza una sola vez y que puede tener dos soluciones: xito
(acierto) o fracaso:
Cuando es acierto la variable toma el valor 1
Cuando es fracaso la variable toma el valor 0
Ej: 5.1 Los siguientes son ensayos Bernoulli.
El saldo de una cuenta por cobrar esta correcta o incorrecta.
Un tornillo, puede estar defectuoso o no defectuoso.
El sexo de un beb al nacer: nio o nia.
La respuesta correcta o incorrecta en un examen.
Si consideramos una serie de ensayos Bernoulli que tiene como caractersticas:
La probabilidad de xito permanece constante, ensayo tras ensayo; y
Los ensayos son independientes entre s.
La distribucin binomial se aplica cuando se realizan un nmero "n" de veces el experimento de
Bernoulli, siendo cada ensayo independiente del anterior. La variable puede tomar valores
entre 0 y n
Entonces se tiene lo que se denomina experimento binomial, donde el nmero de ensayos se
denota con n, la probabilidad de xito con
282,5
c.
300
d.
290,5
La mediana es:
a.
280
b.
290
c.
320
d.
240
La varianza es:
a.
1650
b.
1560
c.
1565
d.
1625
50
P( X x ) n C x p x q n x
para x = 0, 1,2,, n.
E( x) np , npq
Nota:
La eleccin de xito o fracaso es subjetiva y queda a opcin de la persona que resuelve el
problema, pero teniendo cuidado de plantear correctamente lo que se pide.
Ej: 5.3 Suponga que Susana Fermn es agente de seguros y contacta a 5 personas y cree
que la probabilidad de vender un seguro a cada una es de 0,4.
5.3.1 Halle la probabilidad de que no venda seguro.
Es decir, P( X 0)
X: # de seguros a vender.
n=5
p = 0,4 q = 0,6
Sustituyendo en la frmula.
P( X x ) n C x p x q n x
P( X 0) 5 C0 (0,4) 0 (0,6) 50
(1)(1)(0,07776) 0,07776
5.3.2
Lo que indica que hay una probabilidad de 0,337 de que venda cuando mucho un
seguro.
5.3.3
51
5.3.4
52
ACTIVIDAD DE AUTOAPRENDIZAJE N 7
1.
2. Una mquina de cierta marca est produciendo 10% de piezas defectuosas. El ingeniero de
control de calidad ha estado verificando la produccin por medio de muestreo casi continuo
desde que empez la condicin anormal. Cul es la probabilidad que en una muestra de 10
piezas:
2.1
Exactamente 5 estn defectuosas?
2.2
5 o ms estn defectuosas?
2.3
A lo sumo una esta defectuosa?
3. Un inspector encargado del control de calidad de los camiones de juguete producidos por una
fbrica, ha observado que cierto defecto en las llantas se presenta en el 5% de los vehculos.
En cada uno se colocan seis llantas. Cul es la probabilidad de que en un conjunto de seis
llantas seleccionadas aleatoriamente no se presente el defecto?
4. Un circuito electrnico contiene 10 circuitos integrados. La probabilidad de que cualquier
circuito integrado este defectuoso es 0.05, y los circuitos integrados son independientes.
El artculo trabaja slo si no contiene circuitos defectuosos. Cul es la probabilidad que el
artculo trabaje?
5. En un proceso de produccin se examinan lotes de 50 resortes helicoidales para
determinar si cumplen con los requerimientos del cliente. El nmero promedio de resortes
helicoidales que no cumplen con los requerimientos es de 5 por lote. Suponga que el nmero
de resortes que no cumplen con los requerimientos en un lote, denotado por X, es una v.a.
binomial.
5.1
Que valor tiene n y p?
5.2
Calcule P(X 2) y P(X 49)
6. Las observaciones durante un largo perodo muestran que un vendedor determinado puede
concluir una venta en una sola entrevista con una probabilidad de 0,30 Suponga que el
vendedor entrevista a 6 prospectos (o compradores prospectivos).
6.1
Cul es la probabilidad que exactamente dos prospectos compren el producto?
6.2
Cul es la probabilidad de que todos los prospectos compren el producto?
6.3
Cul es la probabilidad que al menos dos prospectos compren el producto?
6. Distribucin de Poisson
La distribucin de Poisson es tambin un caso particular de probabilidad de variable
aleatoria discreta, el nombre se debe a Simen Denis Poisson (1781-1840), un francs que
la desarroll a partir de los estudios que realiz durante la ltima etapa de su vida, como
una forma lmite de la distribucin binomial que surge cuando se observa un evento raro
despus de un nmero grande de repeticiones. En general, la distribucin de Poisson se
puede utilizar como una aproximacin de la binomial, si el nmero de pruebas n es grande,
pero la probabilidad de xito p es pequea; una regla es que la aproximacin PoissonBinomial es buena si n 20 y p 0,05 y muy buena si n 100 y p 0,01. La distribucin
de Poisson tambin surge cuando un evento o suceso raro ocurre aleatoriamente en el
espacio o el tiempo. La variable asociada es el nmero de ocurrencias del evento en un
intervalo o espacio continuo, por tanto, es una variable aleatoria discreta que toma valores
enteros de 0 en adelante (0, 1, 2, ...). As, el nmero de llamadas que recibe un servicio de
atencin a urgencias durante 1 hora, el nmero de clulas anormales en una superficie
histolgica o el nmero de glbulos blancos en un milmetro cbico de sangre son ejemplos
de variables que siguen una distribucin de Poisson.
Caractersticas:
En este tipo de experimentos los xitos buscados son expresados por unidad de rea o
tiempo.
Ej: 6.1 # de clientes que llegan a una caja de un supermercado en la hora pico.
# de defectos de una tela por m2.
# de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc.
# de bacterias por cm2 de cultivo.
# de llamadas telefnicas a un conmutador por hora, minuto, etc.
# de llegadas de embarcaciones a un puerto por da, mes, etc.
Para determinar la probabilidad de que ocurran x xitos por unidad de tiempo o rea, la
frmula a utilizar sera:
P( X x)
e t ( t ) x
x!
x 0, 1, ...
E ( X ) t
2 t
Donde,
53
P( X 0)
e t (t ) x
x!
e 0.,16 (0,16) 0
0,852143789
0!
P( X 1) 1 P( X 1) 1 P( X 0)
Sustituimos en la frmula: P( X x)
e t (t ) x
x!
P( X 1) 1
e 0, 48 (0,48) 0
1 0,618783391 0,381216608 0,3812
0!
24 horas es de 0,3812 .
6.2.3 Cul es la probabilidad que se presente a lo sumo una falla en un periodo de 12
horas?
Es decir P(X 1), donde 0,02
t 12 horas
P( X 1) P( X 0) P( X 1)
54
Sustituimos en la frmula: P( X x)
e t (t ) x
x!
ACTIVIDAD DE AUTOAPRENDIZAJE N 8
1.
Una persona pasa todas las maanas a la misma hora por un crucero donde el semforo
est en verde el 20% de las veces. Suponga que cada maana representa un ensayo
independiente.
1.1 En cinco maanas consecutivas, Cul es la probabilidad que el semforo este en verde
exactamente un da?
1.2 En 20 maanas, Cul es la probabilidad que el semforo este en verde exactamente
cuatro das?
1.3 En 20 maanas, Cul es la probabilidad que el semforo este en verde ms de cuatro
das?
2. Se supone que el nmero de defectos en los rollos de tela de cierta industria textil es una v.a
de Poisson con una media de 0.10 defectos por metro cuadrado.
2.1 Cul es la probabilidad de tener dos defectos en un metro cuadrado de tela?
2.2 Cul es la probabilidad de tener un defecto en 10 metros cuadrados de tela?
2.3 Cul es la probabilidad de que no haya defectos en 20 metros cuadrados de tela?
2.4 Cul es la probabilidad que existan al menos dos defectos en 10 metros cuadrados de
tela?
3. El nmero de mensajes que se envan por computadora a un boletn electrnico tiene una
media de cinco mensajes por hora.
3.1 Cul es la probabilidad que el boletn reciba cinco mensajes en una hora?
3.2 Cul es la probabilidad que el boletn reciba 10 mensajes en una hora y media?
3.3 Cul es la probabilidad que el boletn reciba menos de dos mensajes en media hora?
3.4 Cul es la probabilidad que el boletn reciba por lo menos tres mensajes en una hora?
4. Un profesor recibe, por trmino medio, 4,2 llamadas telefnicas de los estudiantes el da
antes de realizarse alguna prueba sistemtica. S las llamadas siguen una distribucin de
Poisson. Cul es la probabilidad que:
4.1 Reciba al menos tres llamadas ese da?
4.2 El profesor no reciba llamadas ese da?
4.3 Reciba a lo sumo tres llamadas ese da?
5. Un estudio de las filas en las cajas registradoras de salida en un supermercado revel que
durante un cierto periodo en la hora ms concurrida, el nmero de clientes en espera era en
promedio cuatro. Cul es la probabilidad que durante ese periodo:
5.1 No haya cliente esperando?
5.2 Cuatro o menos clientes estn en espera?
5.3 A lo sumo un cliente este en espera?
55
6. Un banco en promedio recibe 6 cheques sin fondos por da. Cul es la probabilidad de que
reciba cuatro cheques sin fondo en un da dado?
7. Variable aleatoria Continua
Una variable aleatoria continua es aquella que puede asumir un nmero infinito de valores
dentro de un determinado rango. Los conceptos y las ideas sobre las variables aleatorias
discretas tambin se aplican a las variables aleatorias continuas. Muchos indicadores
econmicos y empresariales como las ventas, la inversin, el consumo, los costos y los
ingresos pueden representarse por medio de variables aleatorias continuas. Adems, las
medidas del tiempo, la distancia, la temperatura y el peso encajan en esta categora.
8. Distribucin normal
Es el modelo de distribucin ms utilizado en la prctica, ya que multitud de fenmenos se
comportan segn una distribucin normal.
La distribucin normal es, sin duda, la distribucin de probabilidad ms importante del
Clculo de probabilidades y de la Estadstica. Fue descubierta por De Moivre (1773), como
aproximacin de la distribucin binomial. Esta distribucin se caracteriza porque los
valores se distribuyen formando una campana de Gauss, en torno a un valor central que
coincide con el valor medio de la distribucin. La curva de la distribucin normal puede ser
modelada utilizando la funcin de densidad,
Un 50% de los valores estn a la derecha de este valor central y otro 50% a la izquierda.
Esta distribucin viene definida por dos parmetros:
: es el valor medio de la distribucin y es precisamente donde se sita el centro
: es la varianza e indica si los valores estn ms o menos alejados del valor central:
2
x z
56
Manejo de la tabla
La t a b l a nos da la p r o b a b il id a d P (Z z ) s iendo z la variable tipificada.
Bsqueda en la tabla el valor Z
E n l a p r i m e ra c ol um na b u s c a m o s el va l o r d e l a s u n id a d e s y l a s d c im a s . E n
l a p r i m e r a f i l a el va l o r d e l a s c en t s im a s . S u in t e r s ec c i n n o s d a l a
p r o b a b il id a d b u sc a d a .
1 . P ( a Z b ) = Z ( b ) - Z (a )
3. P ( Z a ) = Z ( a )
57
Ej. 8.1 Un cliente tiene una cartera de inversin cuyo valor medio es de 78 mil dlares y
desviacin estndar de 36 mil dlares. Se le ha pedido que calcule:
78 mil $ y 36 mil $
132 78
P( X 132) P Z
PZ 1,50 Z (1,50) 0,9332
36
8.1.2 La probabilidad que el valor de la cartera de inversin sea por lo menos de 96 000 $.
X: Valor de la cartera de inversin (en miles de $)
78 mil $ y 36 mil $
96 78
P(X 96) P Z
PZ 0,50
36
Este resultado muestra que el 30,85% del valor de la cartera de inversin es por
lo menos de $ 96 000.
8.1.3 La probabilidad que el valor de la cartera de inversin sea cuando mucho 25 000
dlares.
X: Valor de la cartera de inversin (en miles de $)
78 mil $ y 36 mil $
25 78
P(X 25) P Z
PZ -1,47
36
Z (1,47) 0,0708
Lo que indica que el 7,08% del valor de la cartera de inversin es cuanto mucho
de 25 mil dlares.
58
78 mil $ y 36 mil $
72 78
P( X 72) P Z
PZ 0,17 1 P( Z 0,17)
36
78 mil $ y 36 mil $
90 78
80 78
P(80 X 92) P
Z
P0,06 Z 0,33
36
36
Z (0,33) Z (0,06) 0,6293 0,5239 0,1054
Lo que indica que esta probabilidad de ocurrencia es apenas de un 0,1054, que la cartera de
inversin se ubique entre esos valores.
8.1.6 La probabilidad que el valor de la cartera de inversin este entre 20 mil y 29 mil
dlares.
X: Valor de la cartera de inversin (en miles de $)
78 mil $ y 36 mil $
29 78
20 78
P(20 X 29) P
Z
36
36
P 1,61 Z - 1,36
Z (1,36) Z (1,61) 0,0537 0,0869 0,0332
8.1.7 La probabilidad que el valor de la cartera se encuentre entre 65 mil y 172 mil dolares.
X: Valor de la cartera de inversin (en miles de $)
78 mil $ y 36 mil $
59
60
172 78
65 78
P(65 X 172) P
Z
P 0,36 Z 2,61
36
36
Z (2,61) Z (0,36) 0,9955 0,3594 0,6361
Este resultado nos muestra que 0,6361 es la probabilidad que la cartera de inversin
se encuentre entre 65 y 172 mil dlares.
Nos encontramos con el caso inverso a los anteriores, conocemos el valor de la probabilidad y
se trata de hallar el valor de la abscisa. Ahora tenemos que buscar en la tabla el valor que ms
se aproxime a ste.
Ej: 8.2 Suponga que la cantidad de tiempo que lleva a la superintendencia de contribuciones enviar
reembolsos se distribuye normal con una media de 12 semanas y una varianza de 9.
8.2.1 Cuntas semanas tendr que esperar el 95% de los contribuyentes distribuidos
simtricamente para obtener el reembolso?
= 12
,
2 = 9
= 3
P( z1 Z z 2 ) Por la simetra 95% divida en dos partes iguales.
P(Z z2 ) 0,975
Sustituyendo en
z2 1,96
x z
z1 1,96
El contribuyente que solicite reembolso tendr que esperar entre 7 y 18 semanas, con
estas caractersticas.
P(Z z1 ) 0,90
z1 1,28
Sustituyendo en x z
x1 12 (1,28)(3) 15,84 semanas x1 16 semanas.
Es decir que el 90% de los contribuyentes que soliciten reembolso tendr que esperar
aprximamente 16 semanas.
Ej. 8.3 Se aplica un test de cultura general y se observa que las puntuaciones obtenidas
siguen una distribucin normal con media 65 y desviacin estndar 18. Se desea
clasificar a los examinados en tres grupos (de baja cultura general, de cultura general
aceptable y de excelente cultura general) de modo que hay en el primero un 20% de la
65 y 18
x z
P(Z z1 ) 0,20
Este valor lo ubicamos en el cuerpo de la tabla.
Sustituyendo en
x z
x1 65 (0,84)(18)
z1 0,84
x1 49,88 50
x z
x2 65 (1,04)(18)
x2 83,72 84
A partir de 85 puntos.
ACTIVIDAD DE AUTOAPRENDIZAJE N 9
1.
61
2. Una compaa de transporte premia con un bono especial a aquellos empleados que venden
300 o ms boletos durante una jornada de 8 horas. El nmero de boletos vendidos por
empleado en dicha jornada est distribuido de manera aproximadamente normal,
con = 270 y = 16. Cul es la probabilidad que un vendedor seleccionado
aleatoriamente no reciba el premio?
3. La distribucin de los salarios anuales de 10 000 trabajadores de una empresa es normal y
tiene una media de C$ 110 y varianza de C$ 64 (en miles). Cuntos trabajadores tienen
salarios:
3.1 Iguales o inferiores a C$ 110?
3.2 Entre C$ 88 y C$ 115?
3.3 Entre que valores se encuentra simtricamente distribuidos el 95% de los salarios
anuales de esos trabajadores? Y del 90%?
3.4 Cunto es el salario mximo del 95% de los trabajadores? Y del 80%?
4. El 80% de los integrantes de un grupo de personas tienen menos de 30 aos. Sabiendo
que la edad media del grupo es de 24 aos, calcule su desviacin tpica.
5. El tiempo de espera en cierto banco est distribuido en forma normal, aproximadamente, con
media y desviacin estndar iguales a 3,7 y 1,4 minutos, respectivamente. Encuentre la
probabilidad de que un cliente seleccionado aleatoriamente tenga que esperar,
5.1 menos de 2 minutos.
5.2 entre 3 y 3,5 minutos.
5.3 por lo menos 2,3 minutos.
5.4 cunto tiempo tiene que esperar el 90 % de los clientes? y el 10%?
6. Se sabe que la cantidad de dinero que gastan los estudiantes en libros de texto en un ao
en una universidad sigue una distribucin normal que tiene una media de $380 y una
desviacin estndar de $50. Cul es la probabilidad que un estudiante elegido al azar:
6.1 gaste menos de $360 en libros de texto en un ao?
6.2 gaste ms de $400 en libros de texto en un ao?
6.3 gaste entre $300 y $400 en libros de texto en un ao?
6.4 gaste entre $250 y $280 en libros de texto en un ao?
6.5 Quiero hallar un intervalo de gastos en libros de texto que incluya el 80% de todos los
estudiantes de esa universidad.
9. Distribucin muestral de la media
9.1 Distribucin muestral para la media de tamao n, con reemplazo
una poblacin constituida por un nmero N de elementos, cuya media aritmtica es
y donde la desviacin tpica viene dada , pueden formarse N2 muestras posibles. Para
cada una de estas muestras es posible una MEDIA MUESTRAL, que denotaremos con
el smbolo
En una distribucin muestral de las medias, la VARIABLE ALEATORIA
i
MEDIA MUESTRAL sigue una ley normal descrita como N (, /n).
62
Sin reemplazo
Infinita
Poblacin
Finita (N)
Ej: 9
N n
N 1
Dado los elementos de la poblacin {1, 3, 5}, encuentre todas las medias muestrales
posibles de tamao 2, con reemplazo. Las medias aritmticas reflejadas, seran:
Medias muestrales de todas las muestras posibles de tamao 2, con reemplazo.
Muestra
Media
i
1,1
1
1,3
2
1, 5
3
3,1
2
3,3
3
3,5
4
5,1
3
5,3
4
5,5
5
Frecuencia
1
2
3
2
1
=9
Probabilidad
1/9
2/9
3/9
2/9
1/9
=1
probabilidad
0.33
0.22
0.11
E ( x) x E ( x )
63
Siendo
la media aritmtica de la poblacin, la media aritmtica de cada muestra i , la
media aritmtica de todas las medias x , E (x) la esperanza matemtica de la variable
aleatoria X (para la poblacin) y E (x ) la esperanza matemtica de la variable aleatoria (para
la distribucin muestral de las medias).
Por su parte, los valores de la varianza y la desviacin tpica de esta distribucin muestral de
tamao 2 son:
V ( x) 2 ,
V (x) x ,
x
2
donde
es la desviacin tpica de la poblacin, x la desviacin tpica de la distribucin
muestral, V (x) la varianza de la variable x (poblacin) y V (x ) la varianza de la variable
(distribucin muestral de las medias).
x E( x )
1 2 3 2 ... 5 27
3
9
9
12
1,333333333
9
x 1,15154700538
Media Poblacional
1 3 5 9
3
3
3
8
2,666666667
3
1,63993162
2,666666667
1,632993162
2
x 1,154700538
Anlisis de la distribucin de muestreo para la media:
x
Se tiene que la media muestral y la poblacional son iguales a 3
La desviacin estndar poblacional es 1,6399 y la muestral es 1.1547. Es decir, que la
desviacin muestral es menor a la poblacional.
Las medias muestrales varan entre 1 y 5, mientras que los datos originales de la poblacin
van de 1, 3, y 5.
Se tiene que la distribucin de muestreo de los valores de las medias tiende a una
distribucin Normal.
NOTA: La diferencia de la DESVIACIN ESTNDAR describe la variabilidad de los valores
de una variable, en cambio el ERROR ESTNDAR describe la precisin del estadstico.
Adems, se cumple que x .
64
xi
1, 3
2
1,5
3
3,5
4
Frecuencia
1
1
1
=3
Probabilidad
1/3
1/3
1/3
=1
N n 1.632993162
N 1
2
3 2
0,816496581
3 1
65
N n
N 1
ACTIVIDAD DE AUTOAPRENDIZAJE N 10
1.
Salario ($)
8
9
6
10
5
1.2 Cul es la distribucin muestral de medias para una muestra de tamao 2, sin
remplazo?
Autos
vendidos
6
4
10
8
2.1 Cuntas muestras diferentes de tamao dos son posibles, con reemplazo?
66
2.2 Enliste todas las muestras posibles de tamao dos y calcule la media de cada
muestra.
2.3 Compare la media de las medias muestrales con la de la poblacin.
2.4 Calcule y x .
11. Estimaciones
11.1
Estimacin puntual
Estimar un parmetro es proponer un valor para el mismo a partir de la muestra; un
estimador del porcentaje poblacional sera la proporcin de dispositivos electrnicos
que presentan falla a este tipo de estimacin se le llama estimacin puntual. Es
bastante probable que el valor que se obtiene no sea realmente el valor del parmetro
en la poblacin.
Parmetro
Media ()
Desviacin Estndar ()
Proporcin (P)
Estimador
S
p
11.2
y S.
67
El error estndar mide la variabilidad entre las diferentes medias de las muestras; es
decir, mide la dispersin imaginaria que presentaran las distintas medias obtenidas en las
muestras estudiadas.
Se utilizarn frmulas diferentes segn se pretenda calcular el error estndar de una
media o el error estndar de una proporcin.
11.2.1 Intervalo de confianza para una media
De una poblacin de media y desviacin estndar o tpica () se pueden tomar
muestras de n elementos. Cada una de estas muestras tiene a su vez una media ( ). Se
puede demostrar que la media de todas las medias muestrales coincide con la media
poblacional:
Pero adems, si el tamao de las muestras es lo suficientemente grande, la distribucin
de medias muestrales es, prcticamente, una distribucin normal (o gaussiana) con
media y una desviacin tpica dada por la siguiente expresin:
Si estandarizamos:
En una distribucin Z ~ N (0, 1) puede calcularse fcilmente un intervalo dentro del cual caiga
un determinado porcentaje de las observaciones, esto es sencillo hallar
este valor se le llamar 1 (debido a que es el error que se cometer, un trmino opuesto).
Para ello se necesita calcular el punto X 2 o, mejor dicho, su versin estandarizada Z 2 o,
<<valor crtico>> junto con su "opuesto en la distribucin" X 2 Estos puntos delimitan la
probabilidad para el intervalo, como se muestra en la siguiente imagen:
z 2 z 2
As:
68
Obsrvese que el intervalo de confianza viene dado por la media muestral ( ) el producto
del valor crtico z 2 por el error estndar n .
N n
n
si
0.05 se omite e l FCF .
N
1
N
n
FCF
z 2 los niveles de confianza estndar son 1,96 para 1 = 95% y 2,575 para 1 = 99%.
En la siguiente tabla se detallan algunos niveles de confianza ms comunes:
Nivel de confianza (1 )
90%
95%
99%
Z/2
0,10
0,05
0,01
1,645
1,96
2,575
NOTA: Para un nivel de confianza del 90%, el valor se ubica en el cuerpo de la tabla y se
encuentra un valor aproximado o exacto del percentil de la distribucin Normal. Luego,
Z = 1.645.
2
donde s es la
x 2,6 gr
Uso de la
~ Normal
0,3
Obtenemos:
0,3
2,6 1,96
36
2,6 0,098
2,502 2,698 gr
69
( x t
, n 1
s
sx ) donde sx
n
N n
con n 1 gl
N 1
x 11 litros
Usar calculadora
s 0,282842712
Buscar en la ~ t de Student.
Sustituimos en la frmula:
( x t
s )
, n 1 x
0,282842712
11 2,45
7
z
n 2
e
2. Si
n0
N
0,05 n n 0
Nn 0
0,05 n N n
0
70
Ej: 14 Qu tan grande se requiere una muestra del Ejemplo 12, si queremos tener 95%
de confianza que nuestra estimacin de difiere por ms o menos 0.05.
Uso de la
1 95% 0,05 0,025
2
~ Normal
z 2 1,96
0,3
e 0,05
= 139
Con estas caractersticas se deben muestrear 139 sitios para el estudio.
Cuando se resuelve para el tamao de muestra, todos los valores fraccionarios se
redondean al siguiente nmero entero.
11.2.3 Intervalo de confianza para una proporcin
El intervalo de confianza para estimar una proporcin P, conocida una proporcin
muestral p de una muestra de tamao n, a un nivel de confianza del (1- )100% es:
P ( p z p ) donde
p (1 p )
x
y p
n
n
En la demostracin de estas frmulas est involucrado el Teorema Central de Lmite como una
aproximacin de una binomial por una normal.l
Ej: 15 Un fabricante de reproductores de discos compactos utiliza un conjunto de
pruebas para evaluar la funcin elctrica de su producto. Todos los reproductores
deben pasar las pruebas antes de venderse. Una muestra de 500 reproductores tiene
como resultado 15 que fallan en una o ms pruebas. Encuentre e interprete un intervalo
de confianza de 90% para la proporcin de los reproductores de discos compactos de la
poblacin que pasan todas las pruebas.
485
0,97
500
0,97(0,03)
P 0,97 1,645
500
P 0,97 0,012549528
p (1 p )
x
y p
n
n
P 0,97 1,645(0,007628892)
P (0,957450471 ; 0,982549528)
71
compactos de la poblacin que pasan todas las pruebas est contenida entre el 95,75%
y el 98,25% y el 10% restante se ubica fuera de ese intervalo.
11.2.4 Tamao de muestra para estimar p
Determinemos que tan grande se requiere que sea una muestra para asegurar que el
error al estimar P sea menor que una cantidad e, esto significa que debemos
elegir n de modo que: z
p(1 p)
e . Al resolver esta ecuacin para n, obtenemos:
n
n0
z22 p(1 p)
e2
1. n0
2. Si
z2 p(1 p)
2
e2
0,05 n n0
n0
Nn0
N
0,05 n N (n 1)
0
e 0,01
p 0,5
z 22 p(1 p)
e2
(1,96) 2 (0,5)(0,5)
9 604
(0,01) 2
n 9 604
cabo el estudio.
72
ACTIVIDAD DE AUTOAPRENDIZAJE N 11
1.
2. Un fabricante produce anillos para los pistones de un motor de automvil. Se sabe que el
dimetro del anillo est distribuido aproximadamente normal, y que tiene una desviacin
estndar de 0,1 mm. Una muestra aleatoria de 45 anillos tiene un dimetro promedio de
74,6mm. Construya e interprete un intervalo de confianza del 95% para el dimetro
promedio del anillo.
3. Se sabe que la duracin, en horas, de un foco de 75 watts tiene una distribucin
aproximadamente normal, con una desviacin estndar de 25 horas. Se toma una muestra
aleatoria de 40 focos, la cual resulta tener una duracin promedio de 1 014 horas.
Construya e interprete un intervalo de confianza del 99% para la duracin promedio.
4. En el ejercicio # 3, Suponga que se desea una confianza del 95% en que el error en la
estimacin de la duracin sea de 5 horas. Qu tamao de muestra se necesita?
5. Un ingeniero analiza la resistencia a la compresin del concreto. La resistencia est
distribuida aproximadamente normal, con varianza
73
con aproximacin de $100 con un 95% de confianza y se supone que la desviacin estndar
es de $200. Qu tamao de muestra se necesita?
10. Un grupo de estudio quera estimar la facturacin mensual promedio por luz elctrica en el
mes de julio en casas unifamiliares en una ciudad. Con base en estudios efectuados en otras
ciudades, se supone que la desviacin estndar es de $20. El grupo quiere estimar la
facturacin promedio de julio con aproximacin de $5 del promedio real con un 95% de
confianza. Qu tamao de muestra se necesita?
11. El gerente de una sucursal bancaria en una ciudad quiere determinar la proporcin de su
cuenta habiente a los cuales se les paga el sueldo por semana, por experiencia previa en otras
reas se sabe que slo el 30% prefieren este sistema, si el gerente quiere tener 95% de
confianza de que esta en lo correcto con aproximacin de 0.05 de la proporcin de sus
clientes a quienes se les paga por semana. Qu tamao de muestra se necesita?
12. Se desea hacer una encuesta para determinar la proporcin de familias que carecen de
medios econmicos para atender los problemas de salud. Existe la impresin de que esta
proporcin est prxima a 0,35. Se requiere de una confianza del 95% con un error de
estimacin de 0,05. De qu tamao debe tomarse la muestra?
13. Determine el tamao de muestra que se requiere para estimar la proporcin verdadera de
los estudiantes de una universidad que tienen ojos azules, si se desea que la estimacin
tenga un error mximo de 0,02 y una confianza del 95%. Suponga que la poblacin
estudiantil es de 4 350.
14. Se desea realizar una encuesta entre la poblacin juvenil de una determinada localidad
para determinar la proporcin de jvenes que estaran a favor de una nueva zona de ocio. El
nmero de jvenes de dicha poblacin es N = 2 000. Determinar el tamao de muestra
necesario para estimar la proporcin de estudiantes que estn a favor con un error de
estimacin de 0,05 y un nivel de confianza del 95%.
15. En un proceso qumico se fabrica cierto polmero. Normalmente, se hacen mediciones de
viscosidad despus de cada corrida, y la experiencia acumulada indica que la variabilidad
en el proceso es muy estable. Las siguientes son 15 mediciones de viscosidad por corrida:
724
742
718
740
776
761
745
749
759
739
795
747
756
742
760
8,23
8,20
8,21
8,20
8,28
8,23
8,25
8,19
8,25
8,26
8,23
74
17. Una lnea de autobuses piensa establecer una ruta desde un suburbio hasta el centro de la
ciudad. Se selecciona una muestra aleatoria de 50 posibles usuarios y 18 indicaron que
utilizaran esa ruta de autobuses. Establezca e interprete una estimacin del intervalo con
95% de confianza de la proporcin real de usuarios para esta nueva ruta de autobuses.
18. Un ingeniero hace pruebas con resistencia a la compresin del concreto. Para ello examina
12 especmenes y obtiene los siguientes datos.
2 212 2 237 2 249 2 204 2 225 2 301
2 281 2 263 2 318 2 255 2 275 2 295
Construya e interprete un intervalo de confianza del 99% para la resistencia promedio.
19. Un artculo publicado en Nuclear Ingineering Internacional describe varias caractersticas
de las varillas de combustibles utilizadas en un reactor propiedad de una empresa noruega
de electricidad. Las mediciones notificadas sobre el porcentaje de enriquecimiento de 12
varillas son las siguientes.
2,94
2,75
2,75
2,81
2,90
2,90
2,82
2,95
3,00
2,95
3,00
3,05
233,05
232,58
229,48
232,58
22. Se realiz una investigacin de mercadotecnia para estimar la proporcin de amas de casa que
pueden reconocer la marca de un producto de limpieza con base en la forma y color del
recipiente. De las 1 400 amas de casa consultadas, 420 fueron capaces de identificar la marca
del producto. Use un grado de confianza del 95% para determinar e interpretar en que
intervalo se encuentra la proporcin poblacional.
75
23. Un estudio muestral de 256 compaas industriales, determin que el 23% haban sealado a
sus empleados como la decada econmica a principios de 2008 afectara la organizacin.
Determine un intervalo de confianza de 95% para la proporcin de todas las compaas que
explicaran a sus empleados los efectos de la decada. Suponiendo que hay un total de 2 000
compaas.
24. El nmero de autos vendidos en Casa Pellas durante el primer semestre del 2012 fue de
800 automviles de diversas marcas, en una muestra de 400 automviles se observ que de
estos 47 eran de color Rojo.
24.1
Estime la proporcin de compradores que prefirieron automvil color Rojo.
24.2
Establezca el intervalo de confianza del 90% para la proporcin de compradores
que prefirieron el color Rojo e interprete los resultados.
25. Un auditor de una dependencia gubernamental de proteccin al consumidor quiere
determinar la proporcin de reclamos sobre plizas de enfermedades que paga la compaa
de seguros en un plazo de dos meses de haber recibido el reclamo. Se selecciona una
muestra de 200 reclamos y se determina que 80 fueron pagadas en un plazo de dos meses
despus de recibidos. Establezca e interprete una estimacin del intervalo con 99% de
confianza de la proporcin real de reclamos pagadas dentro de ese plazo de dos meses.
12. Prueba de hiptesis
La estadstica inferencial es el proceso de usar la informacin de una muestra para
describir el estado de una poblacin. Sin embargo es frecuente que usemos la informacin
de una muestra para probar un reclamo o conjetura sobre la poblacin. El reclamo o
conjetura se refiere a una hiptesis. El proceso que corrobora si la informacin de una
muestra sostiene o refuta el reclamo se llama prueba de hiptesis.
Hiptesis: Afirmacin acerca de los parmetros de la poblacin.
Al realizar pruebas de hiptesis, se parte de un valor supuesto (hipottico) de un parmetro
poblacional, despus de recolectar una muestra aleatoria, se compara la estadistica muestral (
), con el parmetro hipottico, de una supuesta media poblacional (). Luego se Rechaza o No
se rechaza el valor hipottico, segn proceda. Se rechaza el valor hipottico slo si el
resultado muestral resulta muy poco probable cuando la hiptesis es cierta. En el anlisis
estadstico se hace una aseveracin, es decir, se plantea una hiptesis, despus se hacen las
pruebas para verificar la aseveracin o para determinar que no es verdadera. Por tanto, la
prueba de hiptesis es un procedimiento basado en la evidencia muestral y la teora de
probabilidad; se emplea para determinar si la hiptesis es una afirmacin razonable.
Se realiza mediante un procedimiento sistemtico de cinco paso:
76
/2
/2
77
denota mediante la letra griega (), tambin es denominada como nivel de riesgo, este trmino
es ms adecuado ya que se corre el riesgo de rechazar la hiptesis nula, cuando en realidad es
verdadera. Este nivel esta bajo el control de la persona que realiza la prueba.
Si suponemos que la hiptesis planteada es verdadera, entonces, el nivel de significacin
indicar la probabilidad de rechazar, es decir, est fuera del rea de No rechazo. El nivel de
En cualquiera de los dos casos se comete un error al tomar una decisin equivocada. En la
siguiente tabla se muestran las decisiones que pueden tomar el investigador y las
consecuencias posibles.
Para que cualquier ensayo de hiptesis sea bueno, debe disearse de forma que minimice los
errores de decisin. En la prctica un tipo de error puede tener ms importancia que el otro, y
se tiene que poner una limitacin al error de mayor importancia. La nica forma de reducir
ambos tipos de errores es incrementar el tamao de la muestra, lo cual puede ser o no posible.
La probabilidad de cometer un error de tipo II denotada con la letra griega beta , depende
de la diferencia entre los valores supuesto y real del parmetro de la poblacin. Como es ms
fcil encontrar diferencias grandes, si la diferencia entre la estadstica de muestra y el
correspondiente parmetro de poblacin es grande, la probabilidad de cometer un error de
tipo II, probablemente sea pequea.
78
De los dos, el ms importante es alfa que llamaremos nivel de significacin y nos informa de la
probabilidad que tenemos de estar equivocados si aceptamos la hiptesis alternativa.
Debido a que los dos errores anteriores a la vez son imposibles de controlar, vamos a fijarnos
solamente en el nivel de significacin, este es el que nos interesa ya que la hiptesis alternativa
que estamos interesados en probar y no queremos aceptarla si en realidad no es cierta, es
decir, si aceptamos la hiptesis alternativa queremos equivocarnos con un margen de error muy
pequeo. El nivel de significacin lo marcamos nosotros. Si es grande es ms fcil No rechazar
la hiptesis alternativa cuando en realidad es falsa. El valor del nivel de significacin suele ser
un 5%, lo que significa que 5 de cada 100 veces No rechazamos la hiptesis alternativa cuando
la verdadera es la nula. El estudio y las conclusiones que obtengamos para una poblacin
cualquiera, se habrn apoyado exclusivamente en el anlisis de una parte de sta. De la
probabilidad con la que estemos dispuestos a asumir estos errores, depender, por ejemplo, el
tamao de la muestra requerida. Las contrastaciones se apoyan en que los datos de partida
siguen una distribucin normal, existe una relacin inversa entre la magnitud de los errores
y : conforme aumenta, disminuye. Esto obliga a establecer con cuidado el valor de
para
El valor del estadstico z, para muestra grande y desviacin estndar poblacional desconocida
se determina por la ecuacin:
x
z
s
n
En la prueba para una media poblacional con muestra pequea y desviacin estndar poblacional
desconocida se utiliza el valor del estadstico t.
t
x
con n 1 grados de libertad
s
n
79
Las pruebas de hiptesis a partir de proporciones se realizan casi en la misma forma utilizada
cuando nos referimos a las medias, cuando se cumplen las suposiciones necesarias para cada
caso. Pueden utilizarse pruebas unilaterales o bilaterales dependiendo de la situacin
particular. En tal caso el estadstico de prueba es.
z
x npo
npo (1 po )
Valor critico: Es el punto de divisin entre la regin en la que se rechaza la hiptesis nula y la
regin en la que No se rechaza.
Dado que ya se tiene la distribucin normal, los valores crticos se pueden expresar en
unidades de desviacin. Una regin de rechazo de 0.025 en cada cola de la distribucin
normal, da por resultado un rea de .475 entre la media hipottica y el valor crtico. Si se
busca est rea en la distribucin normal, se encuentra que los valores crticos que dividen
las regiones de rechazo y no rechazo son + 1,96 y 1,96
PASO 5: Tomar una decisin
En este ltimo paso de la prueba de hiptesis, el estadstico de prueba se compara con el valor
crtico y se toma la decisin de rechazar o no la hiptesis nula. Tenga presente que en una
prueba de hiptesis slo se puede tomar una de dos decisiones: Rechazar o No rechazar la
hiptesis nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hiptesis nula
cuando no debera haberse rechazado (error tipo I). Tambin existe la posibilidad de que la
hiptesis nula No se rechace cuando debera haberse Rechazado (error tipo II)
Valor p:
Es un planteamiento alternativo para la toma de una decisin de prueba de hiptesis.
Es la probabilidad de obtener una estadstica de prueba igual o ms exacta que el resultado
obtenido a partir de los datos de la muestra dado que la hiptesis nula, Ho, es realmente
verdadera.
A menudo el Valor p se conoce como nivel de significacin observado, que es el mnimo nivel al
cual Ho puede ser rechazado para un conjunto de datos.
El procedimiento compara el Valor p con el nivel de significacin .
Si el Valor p
Ho se Rechaza
Si el Valor p >
Ho no se Rechaza
80
Ej 19
Establezca las hiptesis nula y alterna.
19.1 En promedio, los estudiantes de una universidad viven a no ms de 15 km de la
misma.
H 0 : 15 km.
H 1 : 15 km.
19.2 El consumo promedio de combustible de un nuevo modelo de auto es de 25km/litro.
H 0 : p 0,65
H 1 : p 0,65
19.4 Al menos un 60% de la poblacin adulta de una comunidad votar en las prximas
elecciones municipales.
19.5 Se reclama que al menos el 60% de las compras realizadas en cierta tienda por
departamentos son artculos especiales.
19.7 Se observa que el 20% de los graduados de cierto colegio privado solicitan
admisin a escuelas de medicina.
81
H 0 : 11
20.1
Uso de la ~ Normal
H 1 : 11
0,05
z 1,645
z 1,645
H 0 : 5,8
20.2
H 1 : 5,8
20.3
H 0 : 110
H 1 : 110
20.4
H 0 : p 0,3
H 1 : p 0,3
Para = 0,01 y n = 40
Si
= 0,01 z
z = 2,33
21.2
/2
21.3
/2
Para = 0,05 y n = 16
Para = 0,01 y n = 10
82
21.4
/2
/2
/2
/2
Para = 0,05 y n = 36
1.
o = 1,5 gramos.
= 0,3 gramos
x = 1,6 gramos
= 40 bolsas
= 0,05
H 0 : 1,5 gr
H 1 : 1,5 gr
2. Nivel de Significacin.
z 1,645
= 0,05
1,6 1,5
2,108185107
0,3
40
z Cal 2,11
4. Regla de Decisin
Observe que este valor z Cal 2,11 se ubica en la Regin de Rechazo, es decir, z Cal z
Por lo tanto Ho se Rechaza.
5. Toma de Decisin
Valor p
p P(z 2,11) 1 - P(z 2,11)
p 1 - 0,9826
p 0,0174
Como p 0,0174 0,05 Ho se Rechaza
z Cal 2,11
83
1.
n = 10 empleados
Con la calculadora
determine:
= 0,01
x $261,4
o = $320
s $138,8045789
2. Nivel de Significacin.
= 0,01
gl = n - 1 = 10 1 = 9
3.
0,005
t ( 2
, 9)
3,25
t ( 2 , 9) 3,25
t ( 2 , 9) 3,25
x
261,4 320
1,335038601
s
138,8045789
n
10
t Cal 1,34
4. Regla de Decisin
Observe que este valor t Cal 1,34 se ubica en la Regin de No Rechazo, es decir,
3,25 t Cal 1,34 3,25 . Por lo tanto Ho No se Rechaza.
5. Toma de Decisin
Valor p
t Cal 1,34
84
son mayores ( > ) que 0,01 el nivel escogido de significacin. Por lo tanto, la hiptesis nula,
Ho, No se Rechaza.
Ej: 24 El director de personal de una compaa de seguros est interesado en reducir
la tasa de movimientos de los oficinistas encargados en procesar datos durante su
primer ao de empleo. Registros anteriores indican que 25% del total de las nuevas
contrataciones de esta rea ya no se encuentran en la compaa al final del primer ao.
Se estn aplicando programas de entrenamiento extensivos a una muestra de 150
nuevos oficinistas encargados del procesamiento de datos. Al final de un periodo de un
ao, de los 150 individuos, 30 ya no se encuentran en la compaa. Al nivel de
significancia de 0,01 Existe evidencia de que la proporcin de oficinistas encargados
del procesamiento de datos que estuvieron en el nuevo programa de entrenamiento y
que ya no trabajan para la compaa es menor de 0,25? Calcule el Valor p.
1.
po = 25%.
n = 150 oficinistas
x = 30
= 0,01
H 0 : p 25%
H 1 : p 25%
2. Nivel de Significacin
= 0,01
z 2,33
x npo
npo (1 po )
30 150(0,25)
150(0,25)(1 0,25 )
7,5
1,414213562
28,125
z Cal 1,41
4. Regla de Decisin
Observe que este valor z Cal 1,41 se ubica en la Regin de No Rechazo, es decir,
z 2,33 zCal 1,41 Por lo tanto Ho No se Rechaza.
5. Toma de Decisin
que la proporcin de
oficinistas encargados del procesamiento de datos y que ya no trabajan para la
compaa sea inferior al 25%.
Valor p
zCal 1,41
Como p 0,0793
0,01 Ho No se Rechaza
85
ACTIVIDAD DE AUTOAPRENDIZAJE N 12
1.
2. Se sabe que el dimetro de los agujeros para una montura de cable tiene una desviacin
estndar de 0,01mm. Se obtiene una muestra aleatoria de 40 monturas, donde el dimetro
promedio resulta ser 1,5045mm. Pruebe la hiptesis que el dimetro promedio verdadero
del agujero es de 1,50mm, usando una significancia de 0.05. Cul es el valor de p en esta
prueba?
3. El Gerente de produccin de una Compaa manufacturera estima que la edad media de sus
empleados es 22,8 aos. El tesorero de la firma necesita una cifra de la edad media de los
empleados ms exacta, a fin de estimar el costo de una prestacin por antigedad que se
considera para los empleados. El tesorero toma una muestra aleatoria de 70 trabajadores y
observa que la edad media de los empleados muestreados es de 26,2 aos con una desviacin
estndar de 4,6 aos. Con un nivel de significacin del 1%. Qu puede concluir acerca de la
exactitud de la estimacin del Gerente de produccin?
4. La produccin diaria de una planta industrial qumica registrada durante 50 das, tiene una
media muestral de 871 toneladas y una desviacin estndar de 21kg. Pruebe la hiptesis de
que el promedio de la produccin diaria del producto qumico es de 880kg por da, contra la
alternativa de que es mayor o menor que 880 toneladas por da, usando una significacin del
5%.
5. Una muestra aleatoria de 6 observaciones de una poblacin normal, gener los siguientes
datos:
3,7
8,1
8,8
4,9
5,0
6,4
Proporcionan los datos suficiente evidencia que seale que < 7, a un nivel del 5%.
6. Tina Dennis es la jefa de contabilidad de Meck Industries (MI). Ella cree que los
problemas de flujo de efectivo en MI se deben a la cobranza lenta de cuentas pendientes.
Estima que ms de 60% de las cuentas estn en atraso ms de tres meses. Una muestra de
200 cuentas seal que 140 tenan ms de tres meses de antigedad. Al nivel de
significacin de 0,01. se puede concluir que ms de 60% de las cuentas estn en atraso
por ms de tres meses?
7. Experiencias en la Wills Travel Agency indica que 44% de las personas desean que esa
agencia planee unas vacaciones para viajar a Europa. Durante la temporada ms reciente,
una muestra de 1 000 fue seleccionada al azar de los archivos y se encontr que 480
queran ir a Europa de vacaciones. Ha sido un cambio significativo hacia arriba en el
porcentaje de personas que desean ir a Europa? Pruebe a un nivel del 5%.
86
8. Se analiza una marca particular de margarina diettica para determinar el nivel de cido
graso poliinsaturado (en porcentaje). Se toma una muestra de seis paquetes y se obtienen
los siguientes datos:
16,8
Pruebe la hiptesis
17,2
17,4
H 0 : 17,0
contra
16,9
16,5
17,1
60 311
60 000
60 220
60 252
50 040
59 997
60 523
Al ingeniero le gustara demostrar que la vida til promedio de la nueva llanta excede los
60 mil km. Proponga y pruebe hiptesis apropiadas. Obtenga una conclusin con 0,05
Determine el valor p.
10. Se efecta una prueba de impacto Izod sobre 20 muestras de tubera PVC. El estndar
ASTM para este material requiere que la resistencia al impacto Izod sea mayor que 1.0 ftlbs/in. El promedio y la desviacin estndar muestrales son x 1,25 y s 0,25
respectivamente. Realice la prueba a un nivel de significacin de 0,01. Obtenga
conclusiones. Determine el valor p.
2 i 1
k
( f0 fe )2
fe
87
Las f e
fe
88
( filas )( columnas )
n
2
2
Cal
Tab
No fumador
Si
No
Total
21 [33,35]
48 [35,65]
69
Tipo de fumador
Fumador moderado
35 [29,48]
26 [31,52]
61
Fumador
empedernido
31 [24,17]
19 [25,83]
50
Total
87
93
180
2. Nivel de Significacin
0,01
gl (2 1)(3 1) 2
(87)(69)
33,35
180
f e2 1
(93)(69)
35,65
180
2 i 1
k
f e1 2
(87)(61)
29,48
180
f e22
(93)(61)
31,52
180
f e13
f e23
(87)(50)
24,17
180
(93)(50)
25,83
180
.....
14,59...
fe
33,35
24,48
25,85
4. Regla de decisin
Como
2
Cal
2
Cal
2
Tab
5. Toma de decisin
Existe suficiente evidencia al nivel de significacin de 0,01 que nos muestre que hay
relacin entre la presencia o ausencia de hipertensin y los hbitos de fumar.
Valor p
2
P( 14,59) con 2 gl.
ACTIVIDAD DE AUTOAPRENDIZAJE N 13
1.
Se efecta un estudio sobre las fallas de un componente electrnico. Existen cuatro tipos
de fallas posibles y dos posiciones de montaje para el dispositivo. Se toman los datos
siguientes:
Posicin de
montaje
1
2
Total
Tipo de falla
A
22
4
B
46
17
C
18
6
D
9
12
Total
Mediano
26
63
Grande
16
46
Total
Total
Indican los datos que el tipo de accidentes depende del tamao del automvil? = 0,10
89
No opinaron
Total
17
8
Presentan los datos suficiente evidencia que indique que hay relacin entre la afiliacin
poltica y la opinin expresada. Use un nivel de 0,05.
4. De un grupo de estudiantes se toman al mismo tiempo las calificaciones que estos obtienen
en un curso de Estadstica y en otro de Clculo. Los resultados son los siguientes:
Calificaciones
de estadstica
A
B
C
D
A
25
17
18
10
Calificaciones
B
6
16
4
8
de Clculo
C
17
15
18
D
13
6
10
11
20
Total
Total
Existe alguna relacin entre las calificaciones de los cursos de estadstica y Clculo?
0,05 Determine el valor p.
5. La directiva de una compaa est interesada en determinar si existe una asociacin entre
el tiempo de cambio de turno de sus empleados y el nivel de estrs relacionado con
problemas observados en el trabajo. En un estudio de 116 trabajadores de lnea de
ensamblaje se revel lo siguiente.
Tiempo de cambio
Menos de 15 min.
15 a 45 min.
Ms de 15 min.
Total
Alto
9
17
18
Estrs
Moderado
5
8
6
Bajo
18
28
7
Total
A un nivel de significancia de 0,01 Existe evidencia de que haya alguna relacin entre el
tiempo de cambio de turno y el estrs?
90
UNIDAD IV
Introduccin
En la prctica es frecuente que se requiera resolver problemas que implican conjuntos de
variables de las cuales se sabe que tienen alguna relacin inherente entre s. Podra ser de
inters desarrollar un mtodo de pronstico, es decir, un procedimiento de entrada a partir de
informacin experimental.
1. Diagrama de dispersin
Diagrama que refleja la relacin entre dos variables.
Si X y Y denotan las dos variables, entonces un diagrama de dispersin muestra la
localizacin de los puntos (x, y) en un sistema de coordenadas rectangulares.
Definicin de las variables
Variable dependiente (Y)
Variable independiente (X)
Ej: 1
Ej: 2
3,6
4,8
9,7
12,6
10,8
18,2
10,0
16,6
12,2
14,4
22,6
28,4
27,6
40,2
25,8
34,5
91
2. Regresin Lineal
En primer lugar debemos realizar un grfico de dispersin como el del Ej. 2 y estudiar
visualmente si la relacin entre nuestra variable dependiente (Ganancia) y nuestra variable
independiente (Cantidad en publicidad) puede considerarse lineal. Por convenio, se coloca
la variable dependiente en el eje Y de las ordenadas y la variable independiente en el eje X
de las abscisas. Si no observamos un comportamiento lineal, debemos transformar la
variable dependiente o incluso replantearnos el tipo de anlisis, ya que es posible que la
relacin entre ambas variables en caso de existir, pueda no ser lineal. En nuestro ejemplo
2, si parece cumplirse una relacin lineal entre la Ganancia y la Cantidad en publicidad.
El objetivo de la regresin lineal simple es encontrar la mejor recta de ajuste entre todas
las posibles, dentro de la nube de puntos. La mejor recta de ajuste ser aquella que
minimice las distancias verticales entre cada punto y la recta, calculndose normalmente
por el mtodo de mnimos cuadrados. De este modo conseguiremos una
ecuacin para la recta de regresin de Y (variable dependiente) en funcin de X (variable
independiente) de la forma
estimar
construir la ecuacin o recta de regresin que minimice esas distancias.
Gananci a a b(Canti dad en publi ci dad)
n X i Yi X i Yi
n X i2 X i
a Y bX
Y a bX , que se interpreta:
92
Ej: 3
En el supuesto de una relacin lineal, use el mtodo de los mnimos cuadrados para
determinar los coeficientes de regresin del ejemplo 2.
Y
12,2
14,4
22,6
28,4
27,6
40,2
25,8
34,5
y = 205,7
XY
X2
Y2
xy = 2550,52
x2 = 1112,29
y2 = 5907,21
81112,29 86,3
n X X
i
2
i
1,828343547
8898,32 7447,69
1450,63
b 1,83
a Y bX
205,7
86,3
1,828343547
8
8
a 5,99
Y 5,99 1,83 X
(cientos de $) Es decir la Ganancia esperada
Y 5,99 1,83(20,5) 43,505
en el negocio es de $4350,5
93
SYX
Ej: 5
a Yi b X iYi
n2
S YX
11,995728347.6154
1,999288057 1,41396183
6
2. Coeficiente de Correlacin
Es la herramienta estadstica que podemos usar para describir el grado en el que una
variable esta linealmente relacionada con otra. Al trabajar con dos variables cuantitativas
podemos estudiar la relacin que existe entre ellas mediante la correlacin y la regresin.
Aunque los clculos de ambas tcnicas pueden ser similares en algunos aspectos e incluso
dar resultados parecidos, no deben confundirse. En la correlacin tan solo medimos la
direccin y la fuerza de la asociacin de una variable frente a la otra, pero nunca una
relacin de causalidad. Slo cuando tenemos una variable que es causa o depende de otra,
podremos realizar una regresin. En esta unidad estudiaremos el coeficiente de correlacin
ms utilizado, como es el Coeficiente de Pearson. Abordamos un ejemplo de regresin lineal
simple y cmo se interpretan sus resultados.
El coeficiente de correlacin de Pearson (r) puede tomar valores entre -1 y +1, de modo
que un valor de r positivo nos indica que al aumentar el valor de una variable tambin
aumenta el valor de la otra (Figura 1A), y por el contrario, r ser negativo si al aumentar
el valor de una variable disminuye la otra (Figura 1B). La correlacin ser perfecta si r = 1,
en este caso los puntos formarn todos una recta. Es importante a priori determinar qu
valor de r vamos a considerar como relevante, puesto que una correlacin tan baja como r
= 0,07 sera significativa con un tamao muestral de unas 1000 personas. Adems es una
medida adimensional por lo que no posee unidades.
A
94
Frmula,
X Y
i
X Y
i
X 2
X i2 i
n
95
Y 2
Yi 2 i
n
X Y Y
X
n
n
2
i
2550,52 2218,98875
181,32875618,14875
8
8
86,3205,7
2550,52
i i
331,53125
112088,1402
331,53125
0,990249517
334,7956693
Un examen de la ecuacin indica que el ancho del intervalo de confianza depende de varios
factores. Para un nivel dado de confianza, el aumento en la variacin alrededor de la recta
de regresin, medida con el error estndar de la estimacin, da por resultado un intervalo
ms ancho. Pero, como sera de esperar, el tamao aumentado de la muestra reduce el
ancho del intervalo. As, mismo, el ancho del intervalo vara tambin con diferentes valores
Yi t
Ej: 7
,n2
S YX
X i
2
i
Yi para X 8 (cientos de $)
0,025
t 0,025;6 2,45
gl n 2 8 2 6
,n2
S YX
X i
2
i
1
(8 10,7875) 2
20,63 2,45.1.13
8
86,32
1112,29
1 7,77015625
20,63 2,451,13
8 181,32875
Por lo tanto se estima que la ganancia promedio estar entre $1956 y $2170
Para la Pendiente 1
Estadstico de prueba t b1
S b1
donde
S YX
S b1
2
i
X
i
96
,n 2
97
Sb1
r
1 r2
n2
Ej: 8 Con un nivel de significacin de 0,05. Hay relacin lineal entre las variables en
estudio? (Aplique los tres mtodos)
ACTIVIDAD DE AUTOAPRENDIZAJE N 14
1.
5
1,6
6
2,2
8
1,4
4
1,9
9
2,4
8
2,8
10
2,6
12
3,1
15
4,5
2. El gerente de personal de una empresa considera que puede haber una relacin entre el
ausentismo y la edad, y desea usar la edad de un empleado para predecir el nmero de das
de ausencia durante un ao calendario. Para lo cual seleccion una muestra aleatoria de 10
empleados, con los resultados que se muestran a continuacin.
Edad
Das ausentes
27
15
61
6
37
10
23
18
46
9
29
14
36
11
64
5
40
8
50
9
2.3 En el supuesto de una relacin lineal, use el mtodo de los mnimos cuadrados para
2.4 Cuntos das en promedio predecira usted que va a estar ausente un empleado de
2.5
2.6
2.7
2.8
45 aos de edad?
Calcule e interprete el coeficiente de correlacin, determinacin y no
determinacin.
Calcule e interprete el error estndar de la estimacin.
Encuentre una estimacin de intervalo con 95% de confianza del promedio de das
de ausencia de un empleado de 40 aos de edad.
Con un nivel de significacin de 0,05. Hay una relacin lineal entre la edad y el
ausentismo?
1
15
2
36
3
40
4
69
5
78
6
84
5
75
7
100
8
175
9
120
11
150
12
198
3.3 En el supuesto de una relacin lineal, use el mtodo de los mnimos cuadrados para
3.4 Prediga el saldo de la cuenta, para una cuenta que ha tenido 5 transacciones en el
determinacin.
3.7 Encuentre una estimacin de intervalo con 95% de confianza del saldo promedio de
98
4. Una mujer desea abrir una pequea tienda de ropa. Antes de seleccionar un local, le
gustara poder pronosticar la utilidad (en dlares) que se puede esperar que logre la tienda
por metro cuadrado de exhibicin y venta. Ella recolecta la siguiente informacin de otros
propietarios de tiendas comparables.
Tamao de la tienda (cientos de m2)
Utilidad (miles de $)
35
20
22
15
27
17
16
9
28
16
12
7
40
22
32
23
Guas de laboratorio
Introduccin
El software PASW Statistics 18 es un programa que posee las herramientas necesarias para
realizar los anlisis estadsticos ms frecuentes, tanto en un saln de clase como en el mbito
profesional. A travs de este programa es posible la descripcin y tabulacin de datos, la
realizacin de pruebas de hiptesis, el anlisis de correlacin y regresin entre otros.
Para realizar la prctica de laboratorio supongamos que se aplicaron las siguientes encuestas a
una muestra aleatoria simple de 16 trabajadores de una pequea empresa.
ENCUESTAS.
I
EDAD: 37
SEXO: 1.
M
2. F
SALARIO EN C$ 3 250
REA DE TRABAJO: 1. Produccin
2. Recursos Humanos
3. Finanzas
4.
Servicios Generales
QUE LUGARES VISTAS LOS FINES DE SEMANA:
1. Cines
2. Restaurantes
3. Bares
4.
Parques
5. Centros Comerciales
99
II
III
EDAD: 30
SEXO: 1. M
2.
F
SALARIO EN C$ 4 600
REA DE TRABAJO: 1. Produccin
2. Recursos Humanos
3.
Finanzas
4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines
2.
Restaurantes
3. Bares
4. Parques
5. Centros Comerciales
EDAD: 27
SEXO: 1. M
2.
F
SALARIO EN C$ 5 205
REA DE TRABAJO: 1. Produccin
2.
Recursos Humanos
3. Finanzas
4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1.
Cines
2.
Restaurantes
3.
4. Parques
5. Centros Comerciales
Bares
IV
EDAD: 21
SEXO: 1.
M
2. F
SALARIO EN C$ 3 000
REA DE TRABAJO: 1. Produccin
2. Recursos Humanos
3. Finanzas
4.
Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1.
Cines
2. Restaurantes
3. Bares
4.
Parques
5.
Centros Comerciales
EDAD: 25
SEXO: 1.
M
2. F
SALARIO EN C$ 4 650
REA DE TRABAJO: 1.
Produccin
3. Finanzas
QUE LUGARES VISITAS LOS FINES DE
1.
Cines
4. Parques
VI
VII
2. Recursos Humanos
4. Servicios Generales
SEMANA:
2. Restaurantes
3. Bares
5.
Centros Comerciales
EDAD: 42
SEXO: 1. M
2.
F
SALARIO EN C$ 6 800
REA DE TRABAJO: 1. Produccin
2. Recursos Humanos
3.
Finanzas
4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines
2.
Restaurantes
3.
4. Parques
5. Centros Comerciales
EDAD: 31
SEXO: 1.
M
2. F
SALARIO EN C$ 4 350
REA DE TRABAJO: 1.
Produccin
3. Finanzas
2. Recursos Humanos
4. Servicios Generales
Bares
100
VIII
IX
XI
XII
XIII
SEMANA:
2.
Restaurantes
3.
5. Centros Comerciales
Bares
2. Recursos Humanos
4. Servicios Generales
SEMANA:
2. Restaurantes
3. Bares
5.
Centros Comerciales
2.
Recursos Humanos
4. Servicios Generales
SEMANA:
2. Restaurantes
3. Bares
5.
Centros Comerciales
2. Recursos Humanos
4. Servicios Generales
SEMANA:
2.
Restaurantes
3. Bares
5.
Centros Comerciales
2. Recursos Humanos
4. Servicios Generales
SEMANA
2.
Restaurantes
3. Bares
5.
Centros Comerciales
2. Recursos Humanos
4. Servicios Generales
SEMANA:
2. Restaurantes
3. Bares
5.
Centros Comerciales
101
REA DE TRABAJO: 1.
Produccin
2. Recursos Humanos
3. Finanzas
4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines
2.
Restaurantes
3. Bares
4. Parques
5.
Centros Comerciales
XIV
XV
XVI
EDAD: 23
SEXO: 1. M
2.
F
SALARIO EN C$ 2 500
REA DE TRABAJO: 1.
Produccin
3. Finanzas
QUE LUGARES VISITAS LOS FINES DE
1.
Cines
4. Parques
2. Recursos Humanos
4. Servicios Generales
SEMANA:
2. Restaurantes
3. Bares
5.
Centros Comerciales
EDAD: 31
SEXO: 1. M
2.
F
SALARIO EN C$ 5 400
REA DE TRABAJO: 1. Produccin
2. Recursos Humanos
3. Finanzas
4.
Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1.
Cines
2. Restaurantes
3.
4. Parques
5.
Centros Comerciales
EDAD: 29
SEXO: 1. M
2.
F
SALARIO EN C$ 4 600
REA DE TRABAJO: 1.
Produccin
3. Finanzas
QUE LUGARES VISITAS LOS FINES DE
1. Cines
4.
Parques
Bares
2. Recursos Humanos
4. Servicios Generales
SEMANA:
2. Restaurantes
3. Bares
5.
Centros Comerciales
Vista de variables
102
103
escribimos Masculino. Posteriormente dar Aadir. De igual manera se digita el valor 2 con la
etiqueta de Femenino.
Si desea corregir algo en los valores introducidos, seleccione el valor, corrija y seleccione
opcin Cambiar. Cuando termine de introducir todos los valores dar Aceptar.
De la misma manera introduzca las variables: Salario y rea de Trabajo.
104
105
descriptivos, Frecuencias.
Aparece el cuadro de dilogo:
Aceptar.
Obtenemos la tabla de frecuencia y el grfico de la variable. Puede modificar los resultados
dando doble clic derecho sobre sta. La tabla puede copiar como objeto y pasar a WORD.
Sexo de los trabajadores.
Frecuencia
Vlidos
Masculino
Femenino
Total
Porcentaje
43.8
Porcentaje
vlido
Porcentaje
acumulado
43.8
43.8
100.0
56.3
56.3
16
100.0
100.0
106
etiquetas de datos.
Tambin puede Transponer el Grfico. Al terminar el uso
de Editor de grficos debe cerrar esta ventana. Despus
de haber modificado el grfico el resultado es:
Para procesar la variable rea de trabajo, realice los siguientes pasos, solo que en opcin
107
Ed ades
Vlidos
Frecuencia
1
1
1
1
1
1
1
2
2
2
1
1
1
16
21
22
23
25
26
27
29
30
31
37
42
47
51
Total
Porcentaje
6,3
6,3
6,3
6,3
6,3
6,3
6,3
12,5
12,5
12,5
6,3
6,3
6,3
100,0
Porcentaje
acumulado
6,3
12,5
18,8
25,0
31,3
37,5
43,8
56,3
68,8
81,3
87,5
93,8
100,0
Vlidos
Perdidos
0
31.81
Mediana
30.00
Moda
30a
Desv. tp.
8.818
Varianza
77.763
Rango
30
Mnimo
21
Percentiles 70
12
16
Media
Mximo
Edades
51
36.40
10
Porcentaje
Porcentaje
v lido
6,3
6,3
6,3
6,3
6,3
6,3
6,3
12,5
12,5
12,5
6,3
6,3
6,3
100,0
0
21
22
23
25
26
27
29
Edades
30
31
37
42
47
51
Para esto primero diseamos los intervalos de clase manualmente en una hoja de
papel. Realizamos los siguientes clculos:
R= 30 (vea la tabla Estadsticos);
El ancho calculado nos dio 6, pero podemos variar un poco, dejemos el ancho 5 y
empezamos con el dato 20 (dato mnimo es 21) para que los intervalos de clase
quede bonitos.
Vamos a recodificar los datos de las edades con estos intervalos de clase.
Realice los siguientes pasos:
20-24
25-29
30-34
35-39
40-44
45-49
50-54
Valid
20-24
25-29
30-34
35-39
40-44
45-49
50-54
Total
Frequency
3
4
4
2
1
1
1
16
Percent
18.8
25.0
25.0
12.5
6.3
6.3
6.3
100.0
Valid Percent
18.8
25.0
25.0
12.5
6.3
6.3
6.3
100.0
Cumulativ e
Percent
18.8
43.8
68.8
81.3
87.5
93.8
100.0
108
que
recodificar,
se
desea
agregando
a
una
informacin
de
109
observan
que
esta
110
Continuar.
111
TABLAS DE CONTINGENCIA
Para ver las opciones de este procedimiento
seleccione del men: Analizar, Estadsticos,
112
Esperamos el resultado,
Tabla de contingencia Sexo de los trabajadores. * rea de trabajo.
rea de trabajo.
Sexo de los
trabajadores.
Masculino
Recuento
% del total
Femenino
Recuento
% del total
Total
Recuento
% del total
Produccin
Recursos
Humanos
Finanzas
Servicios
generales
Total
18.8%
6.3%
6.3%
12.5%
43.8%
31.3%
6.3%
12.5%
6.3%
56.3%
16
50.0%
12.5%
18.8%
18.8%
100.0%
Ejercicio de aplicacin
Se obtuvieron los siguientes datos a partir de una encuesta que se realiz en una Empresa en la
ciudad de Managua. (30 casos)
1.
Sexo: 1. Femenino
V3:
Estado Civil:
2. Masculino.
1 Casado (a)
2.
3.
4.
5.
6.
2 Divorciado(a)
3 Soltero(a)
4 Otros
V4:
Nivel Acadmico:
3 Contador(a)
4 Mecnico
V5:
1 Licenciado(a)
2 Ingeniero(a)
5 Conductor
6 Otros.
Salario devengado: _______ (en C$)
V6:
V7:
1 S
2 No.
Recodifique la variable V1: Edad. (Presente un histograma)
1. 0 - 20 aos
2. 21 - 30 aos
3. 31 - 40 aos
4. 41 - 60 aos.
Aplique estadsticos a V1, V5, V6. Grficos de Histograma,
Aplique frecuencias a V2, V3, V4, V7. Grficos de Barras y Diagrama circular.
Aplique tabla de contingencia a las variables V2 y V4.
Recuerda que los resultados obtenidos deben ser analizados e interpretados.
Matriz de Datos
Casos
1
2
3
V1
21
50
22
V2
2
2
1
V3
3
2
1
V4
1
-5
2
V5
12 000
15 500
13 500
V6
1
20
1
V7
2
2
1
40
18 000
15
28
-5
15 000
29
20 000
-5
25
17 000
20
22 000
31
32 000
10
25
-5
28 500
11
-5
-5
10
12
42
27 500
20
13
51
-5
10 500
27
14
26
36 000
15
38
34 500
16
36
35 000
10
17
43
23 800
24
113
18
48
44 200
19
-5
19
33
-5
36 200
20
38
27 000
15
21
53
41 500
30
22
44
32 500
15
23
49
43 000
-5
24
30
25 000
25
29
15 700
26
37
18 000
12
27
-5
16 800
10
28
43
15 000
12
-5
29
50
30 000
18
30
23
32 000
114
Inferencia Estadstica
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
V1
Sexo
V2
Edad
2
2
1
1
1
1
2
2
1
2
1
2
2
1
2
2
1
1
1
2
2
2
2
2
1
28
21
40
22
24
41
25
30
19
30
21
25
26
28
21
22
20
30
35
25
20
24
22
30
22
2: No
V3
Pago en energa
(C$)
1250
920
680
450
360
589
1270
1590
1260
490
-5
950
620
700
552
468
1220
580
450
1256
1128
-5
830
-5
525
V4
Pago de agua
(C$)
450
320
350
-5
350
430
500
290
550
360
130
220
351
456
452
-5
554
350
260
-5
620
260
230
190
520
2: No
Telfono
V5
V6
Casa propia
1
2
1
1
2
1
2
2
1
2
2
2
1
1
1
1
1
2
-5
1
1
2
1
2
2
2
2
1
1
1
-5
1
1
1
2
2
2
2
1
2
2
1
2
2
2
1
1
1
1
1
Con el uso de PASW Statistics 18 podemos obtener Intervalos de Confianza que por
defecto establece una confiabilidad del 95%, puede ser modificado por el usuario.
Media
Intervalo de confianza
para la media al 95%
665.26
Lmite superior
983.65
808.89
Mediana
690.00
Varianza
128925.593
Desv. tp.
359.062
Mnimo
360
Mximo
1590
Rango
1230
Asimetra
Curtosis
Lmite inferior
Media recortada al 5%
Amplitud intercuartil
824.45
Error tp.
76.552
711
.559
-.976
.491
.953
115
Suponga que se desea probar la hiptesis con un nivel de significacin de 0,05 que el
pago promedio en energa (en C$) en el mes de junio C$1 000.
Las hiptesis nula y alternativa son:
respectivamente.
Siga el procedimiento.
Analizar, Compara medias, Prueba T para una muestra , Dar clic.
A qu conclusin llega?
Estadsticos para una muestra
N
Energa (en C$)
22
Media
824.45
Desviacin tp.
359.062
Error tp. de la
media
76.552
t
-2.293
gl
21
Sig. (bilateral)
.032
,032
Diferencia de
medias
-175.545
Prueba de independencia
Procedimiento.
116
117
Chi-cuadrado de Pearson
Correccin por continuidad
Sig. asinttica
(bilateral)
.628
.005
.945
.236
.627
Valor
.235a
b
Razn de verosimilitudes
gl
Sig. exacta
(bilateral)
Sig. exacta
(unilateral)
.697
.225
.473
.635
24
a. 1 casillas (25.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 4.58.
b. Calculado slo para una tabla de 2x2.
Tamao de la familia
99
104
151
129
142
111
74
91
119
91
DIAGRAMA DE DISPERSIN
118
Aceptar.
El resultado es,
ECUACIN DE REGRESIN
Entre a Analizar, Regresin, Lineales
119
120
Coeficientes no
estandarizados
B
Error tp.
(Constante)
60.359
25.468
x: Tamao de la familia
11.276
5.467
Coeficientes
tipificados
Beta
.589
Sig.
2.370
.045
2.062
.073
R
a
.589
R cuadrado
R cuadrado
corregida
.347
.266
20.81855
CORRELACION BIVARIADA
Entre a Analizar, Correlaciones, Bivariadas
y obtiene el cuadro de dilogo: Correlaciones Bivariadas.
121
Correlacin de
Pearson
Sig. (bilateral)
y: Cantidad gastada en
alimentos ($)
.589
.073
N
Correlacin de
Pearson
10
.589
Sig. (bilateral)
.073
10
10
1
10
Pinche estadsticos
122
Continuar. Aceptar.
El resultado es,
Coeficientesa
Modelo
Lmite superior
(Constante)
1.629
119.088
x: Tamao de la familia
-1.332
23.883
Referencias
Walpole, Ronald E., Myers, Raymond H., y Myers, Sharon L. (1998).
Probabilidad y estadstica para Ingenieros. (6. ed.). Mxico: PrenticeHall.
Johnson, R. (1988). Estadstica Elemental. (4. ed.). Mxico: Iberoamrica.
Mason, R., y Lind, D. (1998). Estadstica para Administracin y
Economa. (8. ed.). Mxico: Alfaomega.
Newbold, P., Carlson, W., y Thorne, B. (2008). Estadstica para
Administracin y Economa. (6. ed.). Madrid: Pearson Educacin.
Conde, Carlos. (2010). Estadstica Descriptiva. Recuperado el 24 de junio de 2012 de
http://www.es.crribd.ci/descriptiva/.pdf.
Navarro, Alfredo. (2010). Probabilidades. Recuperado el 2 de julio de 2012 de
http://www.profesorenlinea.cl/matematica/probabilidades.htm
Arroyo Cervantes, G. (2008). Inferencia Estadstica. Recuperado el 12 de agosto de
2012 de http://es.scribd.com/doc/43058695/PRUEBA-DE-HIPOTESIS.
Becerra Espinoza, J.M. (2009). Regresin y Correlacin Lineal simple. Recuperado
el 18 de agosto de 2012, de http://www.eumed.net/cursecon/medir/index.htm