Академический Документы
Профессиональный Документы
Культура Документы
Estadstica e Investigacin
1
Estadstica e Investigacin
Slo con el propsito de crear un marco adecuado para nuestra exposicin, daremos
algunas ideas bsicas sobre investigacin, sin explicar los conceptos, dado que esto
compete al curso de Metodologa de la Investigacin Cientfica.
En este texto le presentamos slo una tipificacin, la que en base a nuestra experiencia,
resulta ser de mayor utilidad en muchas disciplinas, en particular para las investigaciones
en el campo de la educacin y administracin.
2
La descripcin del fenmeno de la desercin consistir fundamentalmente en la medicin
de su incidencia segn gnero, grado de estudio, lugar de procedencia del cliente, tipo de
cliente, tipo de tarjeta que posee, movimientos mensuales que realiza a la tarjeta, actividad
a la que se dedica el cliente, etc.
Se trata de una investigacin cuyo propsito es el de caracterizar el comportamiento de una
sola variable, un solo fenmeno: clientes puntuales en los crditos.
3
c) Existe una relacin directa (o inversa) entre la variable X y la variable Y
d) En cuanto a la funcin de las variables en la estructura relacional, una(s) variable(s)
puede(n) considerarse Variable(s) dependiente(s) y otra(s) como variable(s)
independiente(s), sin embargo, en la mayora de los casos no es posible o no es correcto
atribuir a las variables la funcin de ser dependientes o independientes, lo correcto es
considerarlos como fenmenos concomitantes o variables que varan en forma conjunta, es
decir, hay una covariacin entre ellas.
e) Se realizan las mediciones de las variables a travs de un conjunto de indicadores y
mediante procedimientos estadsticos se detecta la existencia o no de una relacin y, en
caso de existir evidencia, se cuantifica el grado de relacin entre los indicadores.
f) Las relaciones que se detectan no son relaciones de causa - efecto. Luego, no es
correcto tampoco formular conclusiones cuya estructura es: " la variable A influye en la
variable B" o "el fenmeno o factor A es causa del fenmeno o variable B".
g) Este tipo de investigacin tambin se puede realizar sobre la base de una o ms
muestras. (Canavos, 1992)
- Forma dos grupos de 40 estudiantes cada uno, asignando al azar a cada elemento en uno
de los grupos. Uno de los grupos constituye el Grupo Control y el otro, el Grupo
Experimental.
- Conduce el proceso de enseanza-aprendizaje de modo que emplea el Nuevo Enfoque
Pedaggico con el Grupo Experimental y el Enfoque Tradicional con el Grupo Control.
- Finalizado el periodo de aplicacin de ambos enfoques, realiza la evaluacin del logro
de los objetivos en ambos grupos y
- Procede a comparar ambos grupos mediante algn test (o prueba) estadstica.
Caractersticas
La experimentacin se utiliza para deducir relaciones causales. El significado cientfico de
la causalidad difiere del significado comn. El cuadro siguiente, reproducido de Malhotra,
aclara lo que debemos entender por causalidad en el campo de la ciencia.
4
Tabla 1
Significados comn y cientfico de causalidad
Significado comn Significado cientfico
-X es la nica causa de Y -X es slo una de las causas posibles de Y
-X siempre debe llevar a Y -La presencia de X provoca que la presencia de Y
(X es una causa que determina Y) sea ms probable (X es una probable causa de
-Es posible probar que X es la causa de Y. Y)
- Es difcil probar que X sea la causa de Y. A lo
ms podemos inferir que X es una causa de Y.
Fuente: Malhotra, 2008
Niveles de la Investigacin
Cientfica INVESTIGACIN
EXPERIMENTAL
INVESTIGACIN
CORRELACIONAL
INVESTIGACIN
DESCRIPTIVA
Figura 1: La siguiente figura trata de expresar los niveles para cada uno de los
tipos de investigacin referidos.
5
1.2.1. Fase de Planeacin
a. Seleccin del tema.
b. Planteamiento del problema
- Formulacin del Problema.
- Formulacin de objetivos
- Justificacin e Importancia.
c. Construccin del marco terico
- Teoras
- Antecedentes
- Datos
- Variables
- Hiptesis.
d. Diseo metodolgico
- Tipo de Investigacin
- Seleccin de diseo de la investigacin
- Diseo de la muestra
- Elaboracin de instrumentos de recoleccin de datos
- Diseo de formatos de tabulacin
- Previsin de los anlisis a realizar con los datos.
6
En la fase de Ejecucin, la Estadstica interviene casi en todas las actividades que se
sealan, salvo en la interpretacin de los resultados del anlisis, que es una tarea de
explicacin de los hallazgos de la investigacin a partir del marco terico respectivo.
(Devore, 1998)
SELECCIONAR MUESTRAS
RECOPILAR
ORGANIZAR
PRESENTAR DATOS
ANALIZAR
EN EL PROCESO DE UNA
INVESTIGACION
7
Hasta esta parte tenemos una primera visin de la relacin entre la Investigacin
Cientfica y la Estadstica.
1.5 Importancia de la Estadstica
No existe actividad humana en que se deje de usar la Estadstica, las decisiones ms
importantes en nuestra vida se toman con ayuda de esta ciencia. La importancia en el rea
cientfica es porque:
a) Realiza una descripcin ms exacta.
b) Permite resumir los resultados de manera significativa y cmoda.
c) Nos permite obtener conclusiones generales y especficas.
1.6.1 Medicin:
La medicin es un proceso de asignacin de nmeros u otros signos a las
caractersticas de los objetos, de acuerdo con ciertas reglas especificadas con anticipacin.
1.6.2 Poblacin:
Se denomina poblacin al conjunto de todas las unidades de observacin o
anlisis (que consiste en personas, animales, objetos, etc.), cuyas caractersticas observables
se van a estudiar. Una poblacin debe definirse en trminos de su contenido, extensin y
tiempo.
MUESTRA
POBLACIN
1.6.5 Dato:
Es el valor o respuesta que adquiere la variable.
1.6.6 Constante:
Es un dato cuyo valor no puede cambiar durante la ejecucin de la investigacin.
Recibe un valor en el momento de la recoleccin y este permanece inalterado durante toda
la investigacin.
1.6.7 Estadgrafo:
Es una medida usada para describir el comportamiento de una variable en la
muestra. Sirven para estimar parmetros o como valores de distribuciones de probabilidad
que permiten hacer inferencia estadstica.
9
1.6.8 Parmetro:
Son todas aquellas medidas que describen numricamente la caracterstica de una
poblacin. Tambin se les denomina valor verdadero, ya que una caracterstica poblacional
tendr un solo parmetro (media, varianza, etc.). Sin embargo, una poblacin puede tener
varias caractersticas, y, por tanto, varios parmetros.
1.6.9 Variable:
Es una caracterstica que representa a aquello que vara o que est sujeto a algn
tipo de cambio. Se trata de algo que se caracteriza por ser inestable, inconstante y mudable.
1.6.10 Indicador:
Son medidas verificables de cambio o resultado diseadas para contar con un
estndar contra el cual evaluar, estimar o demostrar el progreso con respecto a metas
establecidas. (ONU, 2002)
Cualitativas
Por su
Discretas
1 Naturaleza
.7.1.1 Cuantitativas
Variables
Continuas
cualitativas
: Son las
Figura 4: Por su naturaleza, las variables se clasifican en cualitativas y
variables que expresanydistintas
cuantitativas, cualidades,
a su vez las caractersticas
cuantitativas en discretas y ocontinuas
modalidad. Cada modalidad
que se presenta se denomina atributo o categora. Las variables cualitativas pueden ser
dicotmicas cuando slo pueden tomar dos valores posibles como: s y no, hombre y mujer,
etc. o son politmicas cuando pueden adquirir tres o ms valores.
10
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de
valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores
entre los distintos valores especficos que la variable pueda asumir. Ejemplo: El nmero de
hijos (1, 2, 3, 4, 5).
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo
especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m,
1,65 m, 1,66 m,...), o el salario. Solamente se est limitado por la precisin del aparato
medidor, en teora permiten que exista un valor entre dos variables.
Nominal
Cualitativas
Ordinal
Por su Escala
Intervalo
Cuantitativas
Razn
11
la misma que la existente entre 15 y 17 grados. Lo que no podemos establecer es que una
temperatura de 10 grados equivale a la mitad de una temperatura de 20 grados.
Dependiente
Por su
Investigacin
Independiente
PROBLEMAS PROPUESTOS
12
1. Clasifique adecuadamente las diversas variables
VARIABLES TIPO ESCALA
Nmero de artculos elctricos vendidos
Actitud de los pacientes durante su internado
El peso de la carga de los camiones
La longitud de 1000 tornillos con arandela y tuerca
El grado acadmico de un docente
Marca de computadoras utilizadas
Cantidad de dinero gastado en libros
Volumen de agua de un reservorio
Los tipos de fallas de una maquinaria
Nmero de inasistencias en un mes
Nivel socioeconmico de los habitantes de Chiclayo
Gravedad de un infarto
Nmero de ataques de asma semanales
2. Para cada ejercicio, identificar: poblacin, unidad de anlisis, muestra, variable y tipo de
variable:
2.1 En la empresa Agroindustrial Tumn S.A. trabajan 2500 personas. La empresa est
estudiando conceder un aumento de sueldo y encarga hacer un estudio de factibilidad para
analizar si es posible realizar el aumento. La comisin de funcionarios encargada de este
estudio toma una muestra de 180 trabajadores informando que ganan en promedio
mensualmente 1060 soles, la cual la comparan con los sueldos mensuales de otras
empresas. S usted fuera el auditor de este estudio de factibilidad, identifique lo siguiente:
Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:
Tipo de variable:
2.2 El Gerente de Procter & Gamble, quiere saber cul es la marca de detergente que
ms prefieren las amas de casa de la ciudad de Chiclayo. Para llevar a cabo este estudio se
seleccion una muestra de 504 amas de casa de los alrededores del centro histrico de la
ciudad de Chiclayo. Identifique:
Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:
Tipo de variable:
13
2.3 La empresa Telefnica, desea disear nuevos planes de una tarifa en el servicio de
telefona mvil en la ciudad de Lima. Se elige 50 usuarios de telefona mvil y se observa
sus gastos en trfico telefnico. Identifique:
Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:
Tipo de variable:
Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:
Tipo de variable:
2.5 La Oficina de Servicios Generales de la USS desea conocer los medios en los cuales
con mayor frecuencia se transportan los alumnos de la USS. Para ello realiza una encuesta a
50 alumnos de pregrado en el semestre 2012-II y encuentra que el 70% de los encuestados
usa el transporte pblico y el 20% usa el transporte de la universidad. Identifique:
Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:
Tipo de variable:
14
2.7 Un mdico de cabecera trabaja en un rea rural del distrito de Ferreafe que cuenta
con 4500 habitantes, y est interesado en conocer cuando se producen un mayor nmero de
demanda de asistencia a domicilio, para reforzar el horario que ms lo necesita. Para ello
realiza una encuesta a 200 habitantes y ha recogido datos sobre las ltimas demandas que
ha tenido y las ha catalogado como visitas de maana, tarde, noche o festivo dependiendo
de la hora y en el da en que se han producido. Identifique:
Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:
Tipo de variable:
2.9 El Director del diario la Industria quiere saber cul es el diario que ms prefieren los
lectores de la ciudad de Chiclayo. Para llevar a cabo este estudio se seleccion una muestra
de 684 lectores de dicha ciudad. Identifique:
Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:
Tipo de variable:
15
CAPTULO II
16
2.1 Conceptos generales en la investigacin
Para comprender las tcnicas e instrumentos que se utilizan en la recoleccin y el
anlisis de informacin, es necesario definir conceptos bsicos que se utilizan, como los
siguientes.
Investigacin
Se define como una serie de mtodos para resolver problemas cuyas soluciones necesitan
obtenerse por medio de una serie de operaciones lgicas, tomando como punto de partida
datos objetivos. (Real Academia Espaola)
Mtodo
La palabra mtodo proviene del griego methodos, trmino compuesto por meta, que
significa con, y odos, que significa va. De acuerdo con la Real Academia Espaola,
mtodo es el procedimiento que se sigue en las ciencias para hallar la verdad y ensearla.
Es una forma razonada de utilizar tcnicas y procedimientos para realizar alguna actividad
en cierto orden siguiendo los principios ordenados de la ciencia.
Tcnica
Instrumentos
Son las herramientas, las maquinarias y los equipos que sirven como apoyo para realizar
una investigacin; su utilizacin permite alcanzar los resultados esperados.
Recopilacin
17
A continuacin analizaremos las tcnicas de recopilacin de informacin que permiten
efectuar el levantamiento de datos.
2.2.1 Cuestionarios
El cuestionario es un documento formal y estructurado mediante el cual se
recopila informacin, datos y opiniones a travs de preguntas especficas que se aplican
dentro de un universo o una muestra de individuos, con la finalidad de interpretar
posteriormente esa informacin. (Muoz, 2011)
En esencia, los cuestionarios utilizan dos tipos de preguntas: abiertas y cerradas.
Preguntas abiertas. Son aquellas en las que el encuestado es libre de emitir un juicio o una
opinin de acuerdo con su criterio acerca de lo que se le interroga; de esta forma, no existe
ninguna limitacin para la expresin de las ideas y opiniones, ni en profundidad ni en
temticas.
a) Preguntas dicotmicas, las cuales slo permiten dos posibles respuestas, por lo general
opuestas entre s, por ejemplo: ( ) S ( ) No; Masculino ( ) Femenino ( )
b) Preguntas tricotmicas. Son aquellas en que las opciones de respuestas son tres
posibilidades, por ejemplo: S ( ) No ( ) No sabe ( )
c) Preguntas de alternativas mltiples. Tambin conocidas como preguntas peine o tems,
nos presentan varias alternativas entre las que el encuestado elige alguna; por lo general,
estas opciones incluyen una gama de respuestas que varan de un extremo a otro, por
ejemplo: Elija la respuesta marcando con una x
18
Asimismo, el diseo de un cuestionario contiene
1. Datos de identificacin
Contiene:
- Datos sobre el nombre, direccin, nmero de telfono del encuestado.
- La fecha, hora de entrevista.
- Nombre y cdigo del encuestador
2. Solicitud de cooperacin
Redactada para obtener la colaboracin de los encuestados. Contiene:
- Identificacin de la institucin que realiza el estudio y/o del encuestador.
- Explicacin del objetivo de la encuesta.
- El tiempo que ser preciso emplear para el llenado del cuestionario
3. Instrucciones
Son las instrucciones referidas a la forma de utilizar el cuestionario.
- Si el cuestionario se administra mediante entrevistadores, sean personales o por
telfono, las instrucciones son para el entrevistador y se encuentran en una hoja
separada, Hoja de instrucciones del entrevistador.
- Si el cuestionario es auto administrado o por correo, las instrucciones se encuentran
en el mismo cuestionario.
4. Informacin solicitada
Es la parte ms importante y extensa del cuestionario, est integrada por el conjunto de
preguntas a la obtencin de informacin relevante para los propsitos de la investigacin.
5. Datos de clasificacin.
Contiene datos generales para clasificar los encuestados, como el nivel socioeconmico,
tipo de vivienda, tipo de hogar, etc. a veces suele ponerse tambin en la primera parte del
cuestionario.
Si el cuestionario se administra mediante entrevista personal, son registrados por el
entrevistador, con base a la observacin.
Si el cuestionario es auto administrado, por correo o entrevista telefnica, los datos
los proporciona el encuestado.
19
2.2.2 Entrevistas
Entrevista es la recopilacin de informacin en forma directa, cara a cara, donde
el entrevistador interroga y obtiene informacin directamente del entrevistado, siguiendo
una serie de preguntas preconcebidas y adaptndose a las circunstancias que las respuestas
del entrevistado le presenten.
2.2.3 Encuestas
Otra de las tcnicas ms utilizadas en el desarrollo de una investigacin,
principalmente en las ciencias sociales, es el levantamiento de informacin mediante
encuestas, ya sea de opinin, de comportamiento, de actuacin o de cualquier otro factor
digno de evaluar. La encuesta se realiza con la ayuda de un cuestionario, cuya funcin es la
medicin y pueden aplicarse de manera personal, telefnica o por correo.
2.2.4 Observacin
Una de las tcnicas ms importantes que se utiliza en cualquiera de los mtodos
de investigacin cientfica es la observacin, la cual se puede definir como el examen
detenido de los diferentes aspectos de un fenmeno, con la finalidad de estudiar sus
caractersticas, rasgos y comportamiento dentro del ambiente donde se desarrolla el propio
fenmeno.
La observacin es el registro, en forma sistemtica, de patrones conductuales de personas,
objetos y sucesos a fin de obtener informacin sobre el fenmeno de inters.
Toda vez que decida emplear el mtodo de la observacin, para que sta sea sistemtica,
ser necesario que previamente resuelva los siguientes tres problemas:
Qu se va a observar?
Cmo se va a observar?
Cundo se va a observar?
Supongamos que su objetivo es el estudio de la atencin de los alumnos del primer ao de
secundaria en las clases de matemticas, empleando dos practicantes de la especialidad de
matemticas como observadores para que lleven a cabo el registro de la atencin en el aula
durante el perodo que va del mes de mayo a fines de julio.
No se trata de la observacin del tamao, ni de la edad de los alumnos, ni mucho menos del
color de los ojos de la profesora o de los practicantes, sino, se trata de la observacin de la
actividad psicofisiolgica de los alumnos, llamada atencin. En esta situacin concreta se
encuentran presentes las soluciones de los tres problemas:
20
Cundo se va a observar?. Respuesta: En todas las clases de matemticas, desde mayo
hasta julio.
2.2.5 Experimentacin
Otra de las herramientas ms utilizadas en el mtodo cientfico de investigacin
es la experimentacin, un mtodo comn de las ciencias y la tecnologa, que consiste en el
estudio de un fenmeno, reproducido generalmente en un laboratorio, en las condiciones
particulares de estudio que interesan, eliminando o introduciendo aquellas variables que
puedan influir en l. Se entiende por variable todo aquello que pueda causar cambios en los
resultados de un experimento, existen variables independientes y dependientes. La
variable independiente es todo evento que se incorpora al experimento para ver cmo
influye en la variable dependiente.
21
Existen diversos mtodos para evaluar la confiabilidad de un instrumento, tales como:
a) Medida de Estabilidad: (confiabilidad test - retest). Un mismo instrumento es
administrado a un mismo grupo de personas despus de un perodo de tiempo. Se mide la
confiabilidad a travs de la correlacin entre ambos puntajes.
c) Mtodo de las Mitades partidas (split - halves). Requiere una sola medicin
en un mismo grupo de sujetos. Se divide la prueba en dos mitades y se comparan los
resultados en correlaciones.
Tabla de Frecuencias
Es el agrupamiento de datos en categoras que muestran el nmero de observaciones en
cada categora mutuamente excluyente.
Variable
Categ.
Conteo o
Categ. Porcentaje
22
Total
Frecuencia relativa
porcentual
Variable fi hi%
Categ.
Categ.
Total
23
X1 = Soltero X8 = Divorciado X15 = Soltero
X2 = Casado X9 = Casado X16 = Casado
X3 = Viudo X10 = Casado X17 = Casado
X4 = Soltero X11 = Casado X18 = Soltero
X5= Divorciado X12 = Soltero X19 = Divorciado
X6 = Viudo X13= Divorciado X20 = Casado
X7 = Soltero X14 = Viudo
Con esta informacin construir una tabla de distribucin de frecuencia para la variable
Estado Civil.
Clases o categoras:
C1 = Soltero C2 = Casado
C3 = Divorciado C4 = Viudo
Tabulacin:
Tabla 1
Estado civil de 20 obreros de la empresa constructora Las Torres S.A.,
Chiclayo-diciembre 2013.
Estado Civil (x) fi hi %
Soltero 6 30
Casado 7 35
Divorciado 4 20
Viudo 3 15
TOTAL 20 100
Interpretacin:
El 30 % de obreros tienen el estado civil de solteros (6), el 35 % son casados (7), el 20 %
divorciados (4), y el 15 % son viudos (3).
Frecuencia relativa
porcentual
Categ.
Total
25
Clasificacin:
En este caso se identifican los distintos valores que tiene Xi, primero ubicamos el valor
menor y mayor: Xmin = 2 y Mx. = 6. Los distintos valores que toma la variable Xi los
vamos a denotar por fi resultando:
X1 = 2; X2 = 3; X3 = 4; X4 = 5; X5 = 6
Tabulacin:
Tabla 2
Nmero de trabajadores de una muestra de 20 pequeas empresas.
Departamento Lambayeque, 2012
N de Trabajadores fi Fi hi% Hi%
2 1 1 5 5
3 3 4 15 20
4 7 11 35 55
5 6 17 30 85
6 3 20 15 100
TOTAL 20 100
Categ.
Categ.
26
Marca de clase (xi) La marca de clase es el punto medio de un intervalo.
l i 1 l i
Yi
2
Cuando la variable en estudio es continua, para elaborar una tabla de distribucin de
frecuencias deben seguir los siguientes pasos:
63 68 36 49 56 64 59 35 78 43
36 43 53 70 57 62 43 68 62 27
27
89 64 72 52 51 62 60 71 61 55
26 59 60 67 57 67 61 67 51 81
60 53 64 76 44 73 56 62 63 60
i. Nmero de Intervalos
K 1 3.322 * log 50= 6.64=7
I 2.5 * 4 50
I 7
Tabla 3
Edad de 50 pacientes atendidos por servicios de emergencias Hospital
Docente las
[Li-1, Li> Yi fi Fi hi % Hi % Mercedes
Chiclayo. Abril,
26 - 35 30,5 2 2 4 4
2013
35 - 44 39,5 6 8 12 16
44 - 53 48,5 5 13 10 26
53 - 62 57.5 15 28 30 56
62 71 66.5 14 42 28 84
71 80 75.5 5 47 10 94
80 89 84.5 3 50 6 100
TOTAL 50 100
28
Fuente: Registros Hospital Docente las Mercedes. Chiclayo, Abril-2013
Interpretacin:
f3: 5 pacientes atendidos por servicios de emergencias del Hospital Regional Docente de las
Mercedes de Chiclayo tienen una edad comprendida entre 44 y 53 aos.
Tabla 4
Grado de instruccin de pacientes atendidos de Tuberculosis pulmonar,
Hospital Almanzor Aguinaga Asenjo - Chiclayo, Mayo - 2013
Grado de Instruccin fi %
Analfabeto 36 45
Primaria 24 30
Secundaria 16 20
Superior 04 05
TOTAL 80 100
29
Grado de instruccin de pacientes atendidos de Tuberculosis pulmonar -
Hospital Almanzor Aguinaga Asenjo - Chiclayo, Mayo 2013
N
36
P 32
A
A =Analfabetos
P= Primaria
C 28
E 24
T 0 20
A P S SP
E
Figura 1: Se puede observar que el 45% de los pacientes atendidos son
S 16
analfabetos, mientras que el 5% de ellos tienen un grado de instruccin
superior.
GRADO DE INSTRUCCIN
Ejemplo:
Teniendo en cuenta la informacin de la tabla 4, construir un grfico de sector.
30
Superior
5%
Primaria Secundaria
30% 20%
Analfabeto
45%
xi fi hi Fi Hi
0 1 12.5 1 12.5
Fuente: Registros Hospital Docente las
Mercedes.Chiclayo,Mayo-2013
Ejemplo
Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el nmero de caras, X,
obtenindose los siguientes resultados:
Tabla 5
Nmero de veces que aparece una cara
al lanzar 3 monedas al aire
31
1 3 37.5 4 50.0
2 3 37.5 7 87.5
3 1 12.5 8 100.0
Total 8 100.0
2.6.4. Histograma
Un histograma se construye a partir de la tabla estadstica, representando sobre
cada intervalo, un rectngulo que tiene a este segmento como base. El criterio para calcular
la altura de cada rectngulo es el de mantener la proporcionalidad entre las frecuencias
absolutas (o relativas) de cada intervalo y el rea de los mismos.
32
16
14
12
Fuente:
N DE PACIENTES
10
Registros
8
Hospital 6
Docente 4
las 2
Mercedes 0
26 35 35 44 44 53 53 62 62 71 71 80 80 - 89
.Chiclayo EDAD
,Mayo-
2013
Masculino Femenino
33
Graficar la informacin de la tabla 3
18
16
N DE PACIENTES 14
12
10
8
6
4
2
0
21.5 30.5 39.5 48.5 57.5 66.5 75.5 84.5 93.5
EDAD
Figura 5: el pico ms alto nos da referencia a que existen 15 pacientes atendidos con una
edad promedio de aproximadamente 58 aos.
Fuente: Registros Hospital Docente las Mercedes.Chiclayo,Mayo-2013
PROBLEMAS PROPUESTOS
2. Un conjunto de datos est integrado por 75 observaciones que van desde el 1.2 hasta
39.2 dlares (1 decimal). Cul es la amplitud que recomendara usted para la construccin
de una tabla de distribucin de frecuencias?
Rpta:____________________
4. Al investigar el nivel socioeconmico en las modalidades: bajo (B), medio (M), alto
(A) de 50 familias se obtuvo los siguientes datos:
M B B M A M B M B M
B B B M M A B B A M
A B B B M B M A M B
M M M B M M B A M M
A M M M M B B M A M
a. Indicar la variable en estudio.
b. Indicar el tipo de variable.
c. Elaborar la tabla de distribucin frecuencias.
d. Interpretar la tabla.
65 63 65 63 69 67 53 58 60 61
64 65 64 72 68 66 55 57 60 62
64 65 64 71 68 66 56 59 61 62
63 65 63 70 67 66 57 59 61 62
64 64 63 69 67 66 58 60 61 62
Construir la tabla de distribucin de frecuencias en forma completa (Incluyendo el nmero,
ttulo, conceptos, cuerpo o contenido, nota o notas de pie, fuente y elaboracin), usando la
Regla de Sturges para determinar el nmero de intervalos.
Interpretar:
h4%:...
H4%:..
F3:.....
f2:
35
principales ciudades: Trujillo, Chiclayo, Piura e Iquitos. El objetivo de la investigacin de
mercado es el tratar de determinar segmentos de mercado a los cuales puedan enfocarse e
idear una estrategia de comercializacin que eleven los niveles de consumo y venta. El
estudio de campo consider una muestra de 40 personas que respondieron en las cinco
ciudades. Los datos y las variables recolectadas se detallan a continuacin:
X1. Sexo
X2. Edad (en aos)
X3. Categora ocupacional (estudiante, obrero, empleado, profesional).
X4. Nivel de educacin (aos de escolaridad terminados).
X5. Estado civil (casado, no casado).
X6. Ingreso mensual.
X7. Si el encuestado bebe cerveza por lo menos una vez al mes (s, no).
X8. Ciudad.
Realizar lo siguiente:
a. Una tabla de frecuencias para la variable ingreso considerando la totalidad de los datos.
b. Calcule e interprete a partir de la tabla construida: H2%, f3, h4%, F2, y3.
c. Considerando solamente los datos de la ciudad de Chiclayo construya una tabla que
distribuya a las personas tomadas como muestra de acuerdo a su estado civil. Asimismo,
utilice la grfica adecuada para presentar la informacin.
d. Considerando solo a las personas de Iquitos, presente una tabla que las distribuya de
acuerdo a su edad. Igualmente grafique sus resultados
Base de datos:
X4:Aos de
N X1:Sexo X2.Edad X3:Cat_ocu X5: E_C X6:Ingreso X7:Bebe X8:Ciudad
escolaridad
36
10 Masculino 35 Obrero 8 No casado 1200 No Trujillo
11 Masculino 30 Estudiante 14 No casado 700 Si Chiclayo
12 Femenino 31 Ama de casa 5 Casado 1200 No Chiclayo
13 Masculino 35 Obrero 6 Casado 1200 Si Chiclayo
14 Masculino 37 Obrero 17 Casado 1300 Si Chiclayo
15 Femenino 38 Ama de casa 10 No casado 1380 Si Chiclayo
16 Femenino 19 Estudiante 13 No casado 800 Si Chiclayo
37
A 300 6000
B 200 4000
C 180 7200
38
CAPTULO III
39
3.1. El Promedio o Media Aritmtica
El promedio es el centro de la distribucin de los datos cuando se trata de casos
normales. Entendemos aqu por casos normales aquellos conjuntos de datos que no
contienen valores muy extremos, valores muy alejados de los dems (Universidad Catlica
de Valparaso) .
El promedio tiene los siguientes smbolos
Ejem.1: Los siguientes datos corresponde al ingreso econmico de 8 padres de los alumnos
de ingeniera de sistemas: 1200, 900, 1250, 1350, 800, 750, 1200, 1300. Encontrar el
ingreso promedio
1200 900 1250 1350 800 750 1200 1300
x
8
x 1093,75 Soles
x f i i
Formula: x i 1
n
Ejem. 2:
40
Tabla 1
Nmero De trabajadores por empresa
Xi fi
46 8
47 10
48 16
49 14
50 12
51 9
52 6
Total 75
x f i i
FORMULA: x i 1
Yi : Marcas de clase del intervalo
n
Ejem.3:
Tabla 2
Ingreso econmico de 62 padres de familia
41
Ingreso Econmico Yi fi Fi
454,5 587,5 521 5 5
587,5 720,5 654 5 10
720,5 853,5 787 10 20
853,5 986,5 920 13 33
986,5 1119.5 1053 16 48
1119,5 1252,5 1186 8 56
1252,5 1385,5 1319 5 62
Total 62
42
Un conjunto de datos puede tener una moda y se dice que la distribucin de los datos es
unimodal, ms de una moda se dice que la distribucin de los datos es multimodal o
tambin no tener moda y se dice que la distribucin de los datos es amodal.
Xi fi
46 8
47 10
48 16
49 14
50 12
51 9
52 6
Total 75
43
Ejem.5: Vamos a tomar los datos de la tabla 2
Ingreso
fi
Econmico Fi
454,5 587,5 5 5
587,5 720,5 5 10
720,5 853,5 10 20
853,5 986,5 13 33
986,5 1119.5 16 48
1119,5 1252,5 8 56
1252,5 1385,5 5 62
Total 62
De acuerdo a la teora:
1 fi = 16 2 Li-1 = 986,5 3 fi-1 = 13
4 A = 133 5 fi+1 = 8
Li Me Ls
50% 50%
La mediana se aplica en lugar del promedio, cuando la variabilidad de los datos es muy
marcada. La mediana tambin se aplica a datos cualitativos ordenados de acuerdo a rangos.
La mediana no tiene smbolo definido.
45
3.3.2. Mediana para Datos Cuantitativos Tabulados
a. Mediana para datos no agrupados en intervalos
n
1 Cuando Fi 1
2
Formula: Me = Xi
Dnde:
xj: Es el valor de la variable que se encuentra en la misma fila de Fi
n
Fi: Frecuencia absoluta acumulada inmediatamente mayor que
2
Fi-1: Frecuencia absoluta acumulada anterior a Fi
Procedimiento:
Ejem.7: Tomamos los datos de la tabla 1
n 75
Xi fi Fi 1 37,5 2 Fi 48
2 2
46 8 8
n
47 10 18 3 Fi 1 34 efectivamente Fi 1
48 16 34 2
49 14 48
50 12 60 4 Xj 49
51 9 69
52 6 75
Por lo tanto: Me = 49
Total 75
50% de las empresas tienen como mximo 49 trabajadores.
n
2 Cuando Fi 1
2
Li 1 Li
Formula:
2
Ejem.8: Los siguientes datos corresponden al N de hijos de 54 familias
Nmero Procedimiento:
de hijos fi Fi n 54
Li 1 27 2 Fi 42
2 2
1 5 5
n
2 10 15 3 Fi 1 27 efectivamente Fi 1
3 12 27 2
4 15 42 4 Li 4 5 Li 1 3
5 8 50
6 4 54 3 4
Reemplazando valores: Me 3,5 = 4
Total 54 2
46
b. Mediana para datos agrupados en intervalos
n
1 Cuando Fi 1
2
n 2 Fi 1
FORMULA: Me Li 1 A *
Fi Fi 1
Dnde:
Li-1 = lmite inferior del intervalo que se encuentra en la misma fila de Fi
A = Amplitud del intervalo
Fi = frecuencia absoluta acumulada inmediatamente mayor que n
2
Fi-1= frecuencia absoluta acumulada anterior a Fi
Ingreso
fi
Econmico Fi
454,5 587,5 5 5
587,5 720,5 5 10
720,5 853,5 10 20
853,5 986,5 13 33
986,5 1119.5 16 48
1119,5 1252,5 8 56
1252,5 1385,5 5 62
Total 62
Procedimiento:
n
1 n 62 31 2 Fi= 33 3 Fi 1 20 efectivamente Fi 1
2 2 2
4 Li 1 853,5 5 A = 133
Reemplazando valores se tiene:
31 20
Me 853,5 133
33 20
Me 966,04
El 50% de trabajadores tienen un ingreso mximo de 966,04 soles.
47
n
2 Cuando Fi 1
2
Formula: Me Li 1
Ejem.10: Los siguientes datos corresponden al peso en kilos de 120 alumnos.
Peso fi Fi
30 33 10 10
33 37 20 30
37 41 30 60
41 45 30 90
45 49 16 106
49 53 14 120
Total 120
Procedimiento:
3 Fi 1 60 efectivamente
n 120 n
1 60 2 Fi 90 Fi 1
2 2 2
4 Li 1 41 5 A 4
1 n 35 2 Fi 55 3 Fi 1 13
2
La mediana est dada por la categora que se encuentra en la misma fila de Fi; por lo tanto,
la mediana est dada por la categora Superior no universitaria.
El 50% de los padres de familia de los estudiantes tienen un grado de instruccin mximo
de Superior no universitaria.
48
3.4. Cuartiles (Qi)
Son medidas de posicin que dividen a la distribucin de datos ordenados, en cuatro partes
iguales, de tal manera que:
Li Q1 Q2 Q3 Ls
25%
50%
75%
Ejem.12
Tomaremos los datos, ordenados previamente correspondientes al ingreso econmico
semanal de 7 padres de familia.
200, 225, 300, 420, 450, 460, 540
x1 x2 x3 x4 x5 x6 x7
49
Ejem.13
Tomaremos los datos ordenados previamente, correspondientes al ingreso econmico
semanal de 10 padres de familia
200, 225, 300, 420, 450, 460, 540, 550, 600, 650
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
50
Entonces:
Q3 x8 ( x9 x8 )(0,25)
550 (600 550)(0,25)
550 12,5
Q2 562,5
n(i)
4 Fi 1
Formula: Qi Li 1 A *
Fi Fi 1
Ejem.14
Para el cuadro N 2, calcular el primer, segundo y tercer cuartil.
15 10
Q1 720,5 133 *
20 10 El 25% de los trabajadores, tienen un ingreso mximo
Q1 787 de 787 soles.
51
Clculo del segundo cuartil (Q2): i = 2
n(2)
4 Fi 1
Formula: Q2 Li 1 A *
Fi Fi 1
Procedimiento:
ni 622
1 31 2 Fi = 33 3 Fi-1 = 20
4 4
4 Li-1 = 853,5 5 A = 133
31 20
Q2 853,5 133
33 20
Q2 966,04
El 50% de los trabajadores, es decir 31, tienen un ingreso mximo de 966,04 soles.
n(3)
4 Fi 1
Formula: Q3 Li 1 A *
Fi Fi 1
Procedimiento:
ni 623
1 46,5 2 Fi = 48 3 Fi-1 = 33
4 4
4 Li-1 = 986,5 5 A = 133
46,5 33
Q3 986,5 133
48 33
Q3 1106,2
52
3.5. Deciles (Di)
Son medidas de posicin que dividen a la distribucin de datos, previamente ordenados, en
10 partes.
i
El decil isimo es el valor del dato que ocupa la posicin ( )( n 1 ) en el ordenamiento.
10
Si la posicin no resulta entera, se hace una interpolacin lineal entre los dos valores
correspondientes a las dos observaciones entre las cuales se encuentre la posicin.
(Montgomery, 1997)
x1 x2 x3 x4 x5 x6 x7 x8 x9
Decil 6 (D6): i = 6, n = 9
6
( )( 9 1 ) 6
10 :
Posicin entera
Por tanto el decil 6 es el dato que ocupa la sexta posicin: D6 = 580.
53
3.5.2. Deciles para datos tabulados
n(i )
10 Fi 1
Formula: Di Li 1 A *
Fi Fi 1
Donde i, tomar valores de 1 a 9, segn se trate del primero, segundo, hasta el noveno decil.
Ejem.15
Para el cuadro N 2, calcular el 4 decil.
Procedimiento:
1 ni 624 24,8 2 Fi = 33 3 Fi-1 = 20
10 10
4 Li-1 = 853,5 5 A= 133
n(4)
10 Fi 1 24,8 20
D4 Li 1 A * D4 853,5 133 *
33 20
Fi Fi 1
D4 902,61
3.6. Percentiles
Para el clculo de los centiles o percentiles (Pi) se procede de manera similar y las frmulas
correspondientes son: (Hoog, 1995)
i
Para datos originales: ( )( n 1 )
100
n(i )
100 Fi 1
Formula: Pi Li 1 A *
Fi Fi 1
54
Ejem.16: Para la tabla 2, calcular el 37 percentil.
Ingreso
fi Fi
Econmico
454,5 587,5 5 5
587,5 720,5 5 10
720,5 853,5 10 20
853,5 986,5 13 33
986,5 1119.5 16 48
1119,5 1252,5 8 56
1252,5 1385,5 5 62
Total 62
Procedimiento:
n(37)
100 Fi 1 22,94 20
P37 Li 1 A * P37 853,5 133 *
Fi Fi 1 33 20
P37 883,57
55
PROBLEMAS PROPUESTOS
2 . Un dentista observa el nmero de caries en cada uno de los 100 nios de cierto
colegio. La informacin obtenida aparece resumida en la siguiente tabla:
N cari es fi hi %
0 25 25
1 20 20
2 X z
3 15 15
4 y 5
- Halle el nmero de caries promedio.
- El nmero de caries mximo que tienen el 50% de los nios.
56
5. Dada la siguiente distribucin de frecuencias, calcular el valor de n sabiendo que
la moda es 60 y pertenece al tercer intervalo.
Intervalos f
16 32 6
32 48 n
48 64 8
64 80 3n
80 - 96 3
7. Las notas de los alumnos que llevaron el curso Matemtica bsica se presenta a
continuacin:
15.0 11.9 10 15
12.1 13.8 8 14.5
9.5 12.3 7.5 12.7
8.3 20 6.3 13.6
10.4 15.3 5.5 19.2
12.5 14.5 15 14.5
11.6 11.9 13 11.2
57
Tiempo en minutos Nmero de
computadoras
170 175 1
175 180 3
180 185 4
185 190 8
190 195 5
195 200 2
- Calcular la el tiempo mximo que demoran el 65% de las mquinas en transferir un
archivo.
- Cunto tiempo tardan la mayora de computadoras en transferir un archivo?
- Cul es el tiempo promedio.
10. Las personas que asisten al gimnasio Ponte en Forma comentaron sobre el
nmero de hijos que tienen:
3 0 4 4
2 1 3 3
0 1 4 4
1 2 2 2
1 0 3 0
2 3 4 3
3 2 1 2
2 1 3 2
- Cuntos hijos tienen en promedio las personas
- Cuntos hijos como mximo tiene el 45% de las personas.
58
- Cuntos hijos como mximo tiene el 74% de las personas.
CAPTULO IV
Medidas de Dispersin
Y
Deformacin
59
Medidas de Dispersin y Deformacin
4.1. Medidas de Dispersin
Son medidas o parmetros estadsticos que sirven de complemento a las medidas de
centralizacin en el anlisis de los datos. La dispersin o variacin es una caracterstica
importante de un conjunto de datos porque intenta dar una idea de cun esparcidos se
encuentran stos. (Mendenhall, 2000)
Viene a ser la diferencia entre el valor mximo y el valor mnimo de los datos, es decir:
R = VMax VMin
El recorrido a rango como estadgrafo de posicin es muy limitado, porque slo considera
los valores extremos de la distribucin de datos y no nos indican nada sobre el
comportamiento de los datos.
4.1.2. Varianza:
La Varianza muestral es la que se presenta en la tabla adjunta y la varianza poblacional se
define en el captulo de probabilidades.
CONDICIN Muestra
Datos Originales 2
( )2
=
1
Datos Tabulados ( )2
2 =
sin intervalos 1
Datos Tabulados 2
( )2
=
con intervalos 1
60
Observacin: Si deseamos obtener la varianza en una poblacin, el denominador en la
frmula es n (tamao de poblacin).
Ejem.2: Los siguientes datos corresponden a los ingresos econmicos por semana de 12
trabajadores de una empresa
Xi: 600, 650, 200, 710, 300, 550, 420, 460, 450, 540, 850, 225.
Para poder aplicar la frmula, primero debemos encontrar el promedio y luego aplicar la
frmula de la varianza.
1 Calculando el promedio: x 496.25
( )2
2 Calculando la varianza muestral: 2 =
1
12 1
419156.22
S2
12 1
S 38105.11 Soles al cuadrado
2
CONDICIN Muestra
Datos Originales
( )2
=
1
Datos Tabulados
( )2
sin intervalos =
1
Datos Tabulados
( )2
con intervalos =
1
S S 2 38105.11
S 195.21 Soles
61
La dispersin promedio que existe entre los datos y la media aritmtica es de 195.21 soles.
Muestra 1: Muestra 2
x 248 x 248
s = 12.56 s = 38.75
3( y Me) y Md
As As
S S
El primero es el ms usual.
Interpretacin
1. Si la distribucin es Simtrica, entonces As = 0, en este caso coinciden y Me Md
2. Si la distribucin es Asimtrica Positiva sesgada a la derecha si: As > 0.
3. Si la distribucin es Asimtrica Negativa sesgada a la izquierda si: As < 0.
62
Fuente: Escobar, 2010
Coeficiente de Kurtuosis: a = m 44
S
Donde S4 = ( S2 )2
x x ni
4
i
m4 =
n
Si a = 3 : La distribucin es Mesokrtica ( Normal).
Si a > 3 : La distribucin es Leptokrtica ( apuntada)
Si a < 3 : La distribucin es Platikrtica ( aplanada )
64
CAPTULO V
Probabilidades
65
Probabilidades
5.2. Experimentos
La Teora de la Probabilidad tiene que ver con los diversos resultados posibles que
pueden obtenerse y los posibles sucesos que podran ocurrir cuando se realiza un
experimento. El trmino experimento se utiliza en la teora de la probabilidad para
describir virtualmente cualquier proceso cuyos resultados no se conocen de antemano con
certeza. Entonces, un experimento es el proceso mediante el cual se obtiene una
observacin (o una medicin) de un fenmeno.
66
5.2.2. Experimentos Determinsticos
Si un experimento tiene un nico resultado posible, que al realizarlo sabemos
que ocurrir, el experimento se llamar determinstico.
Por Ejemplo, un experimento determinstico sera extraer una bola de una que contiene
bolas con un slo color, digamos negras. Si nos fijamos en el color de la bola extrada
sabemos de antemano que es negra. (Raymond y Myers, 1998).
Otro Ejemplo es, si realizamos el experimento; se lanzan dos dados, los posibles
resultados al observar el nmero de puntos en ambas caras de los dados es el siguiente
espacio muestral:
Ms Ejemplos:
67
Indicar su espacio muestral:
Solucin:
Para e : S {1,2,3,4,5,6}
2 2
Para e : S {R,V }
3 3
Para e : S {1,2,3,}
5 5
Para e : S {x R/0 x 1}
6 6
Para e : S {t R/t 0}
7 7
Para e : S {0,1}
8 8
5.4. Eventos
Con base a los experimentos anteriores (lanzar un dado, lanzar dos monedas y lanzar
dos dados), observamos que stos pueden tener uno o ms resultados, a los cuales se les
llama Eventos y que se representan mediante letras maysculas.
Por tanto un Evento es un subconjunto de un Espacio Muestral.
Se puede hacer una lista de muchos eventos asociados con un experimento, algunos con
ms posibilidad de ocurrir que otros. Desde el punto de vista de conjuntos, un evento es un
subconjunto de un espacio muestral. Por Ejemplo, en el experimento de tirar un dado se
tiene:
{1} es el evento elemental o evento simple que indica que al lanzar un
dado salga la unidad.
{2, 4,6} es un evento que indica que al lanzar un dado salga nmero par.
{1, 2,3} es un evento que indica que al lanzar un dado salga un nmero menor
que 4
{1, 2, 3, 4, 5, 6} es un evento que indica que al lanzar un dado salga un nmero menor
que 7
68
E2: Ocurren por lo menos dos caras
E3: Ocurre sello en el tercer lanzamiento.
Sol: tenemos que: S {ccc, ccs, csc, css, scc, scs, ssc , sss}
Luego: E 1
{ccc, sss}
E 2
{ccc, ccs, csc, scc}
E 3
{ccs, css, scs, sss}
Observaciones:
- A todo elemento de un espacio muestral se le denomina suceso, y se denota por
w,x,y, etc., es decir w S.
- Un evento con un solo elemento es un evento elemental, as E {w} es un evento
elemental.
- Si el conjunto vaco es subconjunto de cualquier conjunto, entonces es un
evento, y se denomina evento imposible.
Ejemplo: E= lanzar un dado y observar que la cara superior muestre un puntaje
mayor que 6 E {}
- Si todo conjunto es subconjunto de s mismo, entonces S tambin es un evento y
se le denomina Evento Seguro. En el Ejemplo de la tirada del dado un evento
seguro S sera ver un puntaje menor que 7 al lanzar el dado, como vemos el
evento sera:
S = {1, 2, 3, 4, 5, 6}, y es un evento seguro porque siempre ocurre.
69
Entonces: A C {2,3,4,5,6} es el evento de que el nmero sea par o primo.
B C {3,5} es el evento de que el nmero sea impar o primo.
{1,4,6} es el evento de que el nmero no sea primo.
c
C
5.6. Definiciones de Probabilidad:
La definicin de probabilidad tiene 3 enfoques:
1. Definicin Clsica o A priori
2. Definicin de probabilidad por frecuencia Relativa o Aposteriori.
3. Probabilidad Subjetiva.
Observacin: las dos primeras definiciones son probabilidades objetivas.
2 1 2 3 4 5 6
1 dado
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
70
6 (6,1) (6,2) (6,3) (5,4) (6,5) (6,6)
n 36
E: resultado del primer dado mayor que el resultado del segundo dado n E
15
Por lo tanto:
P( A) n A
3 1
, P( B)
nB 3 1 , P(C ) nC 18 1
n 36 2 n 36 6 n 36 2
P( D) n D
26 13
, P(E) queda para el estudiante.
n 36 18
5.6.2. Definicin por frecuencia Relativa o A posteriori
Si un experimento bien definido se repite n veces (n grande); sea n A el nmero de veces
que el evento A ocurre en los n ensayos donde n A
n , a este n A
se le denomina
" nA "
frecuencia; y al cociente se le denomina frecuencia relativa, la cual representa a la
n
estimacin de la probabilidad de que ocurra el evento A, o sea:
P( A) n A
n
Si queremos obtener la verdadera probabilidad, entonces N debe ser muy grande.
P(A) lm
n A
n
n
71
Observacin: las propiedades de la probabilidad por frecuencia relativa son las mismas que
la probabilidad clsica dados en las observaciones generales de la pg.
Ejemplo: en 20 centros educativos de las diferentes P.P.J.J. de Chiclayo que forman en total
a 16000 alumnos, se detectaron 1900 casos de tuberculosis. Hallar la probabilidad de
encontrar a un alumno tuberculoso en un colegio determinado.
n A 1900 , n 16000
1900
P( E ) 0,1186 o en forma porcentual P( E) 11,86%
16000
Nivel Especialidad Primaria Hist.y Geog. Leng.yLit. (C) Educ.Fis. Matem. Total
(A) (B) (E) (M)
N Total de alumnos 108 60 58 40 38 304
Alumnos sexo femen. 80 38 30 16 11 175
(F)
Alumnos sexo 28 22 28 24 27 129
mascul.(V)
Cul es la probabilidad de que un alumno seleccionado aleatoriamente
Solucin:
72
P( A) n A
175
n 304
b) Sea B el evento: el alumno seleccionado pertenece a la especialidad de
lenguaje y Literatura.
nB 58 (total de alumnos de Lenguaje y Literatura)
P( B) n B
58
n 304
c) Sea C el evento: la persona seleccionada es hombre y de la especialidad
de Educacin Fsica.
nC 24
24
P(C )
304
11
P( D)
304
73
Ejemplo:
Como pueden observar, son eventos nicos, que no han ocurrido antes. No hay forma de
que se puedan interpretar tales probabilidades como una frecuencia relativa o como una
probabilidad Clsica. Entonces el enfoque subjetivo de la probabilidad es pues adecuado en
la respuesta de las preguntas ltimamente expuestas.
Ejemplos:
1) Una persona desea comprar una lavadora de ropa, para lo cual ha pensado que puede
seleccionar de entre las marcas Whirpool, Easy y General Electric, cuando acude a hacer la
compra se encuentra que la lavadora de la marca W se presenta en dos tipos de carga ( 8 u
11 kilogramos), en cuatro colores diferentes y puede ser automtica o semiautomtica,
mientras que la lavadora de la marca E, se presenta en tres tipos de carga (8, 11 o 15
kilogramos), en dos colores diferentes y puede ser automtica o semiautomtica y la
lavadora de la marca GE, se presenta en solo un tipo de carga, que es de 11 kilogramos, dos
colores diferentes y solo hay semiautomtica. Cuntas maneras tiene esta persona de
comprar una lavadora?
74
Solucin:
Es muy simple, cuando se trata de una sola actividad, la cual requiere para ser llevada a
efecto de una serie de pasos, entonces haremos uso del principio multiplicativo y si la
actividad a desarrollar o a ser efectuada tiene alternativas para ser llevada a cabo, haremos
uso del principio aditivo.
75
N1 x N2 x N3 x N4 = 2 x 3 x 2 x 1 = 12 maneras de construir la casa
Solucin:
9 x 10 x 10 x 10 x 10 x 10 = 900,000 nmeros telefnicos
9 x 9 x 8 x 7 x 6 x 5 = 136,080 nmeros telefnicos
1 x 9 x 8 x 7 x 6 x 5 = 15,120 nmeros telefnicos
8 x 8 x 7 x 6 x 5 x 5 = 67,200 nmeros telefnicos
3) De cuntas maneras diferentes podr vestirse un joven que tiene 3 camisas diferentes, 4
pantalones y 2 pares de calzado?
Ejemplo:
Notando que dos cuales de estos seis permutaciones son distintas, es decir, difieren en la
posicin de sus elementos, entonces interesa el orden
p n
n(n 1)(n 2).... * 3 * 2 *1 n!
76
Definicin: el nmero p n
, de permutaciones que pueden construirse con n elementos de
un conjunto cualquiera es n!
5.7.3.2. Variaciones:
(nVr)
Del Ejemplo anterior tenemos que del conjunto {2, 3, 5, 6, 7, 9} tomamos 3 elementos para
formar nmeros diferentes de 3 dgitos (parte a), es decir tomamos grupos de 3 en 3
elementos, teniendo en cuenta el orden, y dio como resultado por el principio fundamental
del conteo
(3
6*
5 *4 =120 que vienen a ser 6 (factorial generalizado)
3 factores
N de elementos
Problema: seis personas entran en un saln de espera en la que hay 8 sillas De cuantas
maneras diferentes pueden sentarse?
Solucin: se trata de variacin porque las personas se van a colocar en diferentes sillas,
pues se tiene en cuenta el orden.
77
8! 8!
Rpta. V 20160
(8 6)! 2!
8 6
n!
nCr
r! (n r )!
Diremos que hemos formado as las combinaciones de orden 1 con los 5 elementos del
conjunto V. A partir de las combinaciones de orden 1 con los elementos de V, formamos
las combinaciones de orden 2 as:
{a} {a, e},{a, i},{a, o},{a, u}
{o} {o, u}
78
{u}
Como podemos observar se coge un elemento seguido de los elementos de la derecha sin
regresar a la izquierda, este mismo procedimiento se sigue para formar las combinaciones
de orden 3, 4, etc.
12! 12!
Entonces C 792
12 5
5! (12 5)! 5!7!
Cr
n
Propiedad de los nmeros Combinatorios: Si n C r
1
n
1) C n
C n 1
n n
2) C r
n m n m
C C
n m
3) se cumple: a)
x y x y n m
x y
n 1
C r 1 C r 1
n n
4) C r
n n 1
n
5) C r C
r r 1
(degradacin de ndices).
Solucin: tenemos n 13
79
Las clases que se repiten son: letra I n1 5 letra D n2 3 Luego, por la
13!
frmula: PR
5!3!
PROBLEMAS PROPUESTOS
6. En una compaa hay 6 varones y 4 damas que aspiran ser miembros de un comit.
Si se deben escoger 2 al azar escribiendo los nombres en hojas de papel y sacndolos de
una urna. Cul es la probabilidad que los dos sean hombres? Cul que sean un hombre y
una mujer o dos mujeres?
7. De 20 personas que contrajeron cierta enfermedad al mismo tiempo y que fueron
llevados a una misma sala de un hospital, 15 se recuperan completamente en 3 das; al cabo
del cual, se escogen aleatoriamente 5 personas para un chequeo. Cul es la probabilidad
que los 5 sean dados de alta?
8. Cul es la probabilidad que exactamente 4 sean dados de alta?
9. Cul es la probabilidad que ninguno sea dado de alta?
10. Diez libros se colocan aleatoriamente en un estante. Determinar la probabilidad que
tres libros determinados, sean colocados juntos.
80
CAPTULO VI
Teoremas de las
probabilidades
81
6.1. Propiedades Generales de las Probabilidades:
Antes de conocer los teoremas de las probabilidades, es importante tener en cuenta
las siguientes propiedades:
1) La probabilidad de un evento cualquiera A est comprendido entre 0 y 1, es decir:
0 P( A) 1
y n 0 y se cumple que: 0 nA n ,
Demostracin: tenemos que n A
0 nA n
dividiendo entre n : 0 P( A) 1 l.q.q.d.
n n n
2) P( A) 0 , si A es un evento imposible.
Demostracin: si A es un evento imposible A , n A
0
P( A)
n A
0
P( A) 0 l.q.q.d.
n n
3) P( A) 1, si A es un evento seguro.
Demostracin: Si A=S n A n
P( A) n A
n
P( A) 1 l.q.q.d.
n n
P({wi}) 1
i 1
Observaciones Complementarias:
82
Si el espacio muestral S est formado por: S {w1 , w2 , w3 , wn} , es decir un nmero
finito de elementos, entonces la probabilidad P i
a un resultado w,
i
est dada por
(1) P 0
i
i 1,2,3, n
n n
(2) Pi P({wi}) 1
i 1 i 1
Luego, la suma de las probabilidades asignadas a los puntos o resultados del espacio
muestral es la unidad (teniendo en cuenta que estos resultados w , w , w ,w
1 2 3 n
son
mutuamente excluyentes y colectivamente exhaustivos).
Ejemplo: Ocho amigos juegan boliche una vez a la semana. Este grupo est formado por 2
parejas de casados, 3 jvenes y una joven. Antes del juego cada uno pone 10 soles en una
bolsa, cuyo contenido ser ganado por el que obtenga mayor puntaje. Si las mujeres tienen
la mitad de la habilidad que los varones poseen para el juego. Cul es la probabilidad de
que un soltero gane?, Cul es probabilidad de que gane una mujer?, Cul es la
probabilidad de que gane un hombre casado?
Solucin: el espacio muestral est formado por: 5 hombres que tienen igual habilidad,
siendo P la probabilidad de que gane un hombre.
P
Luego se tiene: 5( P) 3 1 P 2 13 y P 2 1 13.
2
83
a) Sea A, el evento gane un hombre soltero, A tiene 3 elementos, y stos tiene igual
habilidad:
P( A) 3( P) 3(2 13) P( A) 6 13.
b) Sea B, el evento gane una mujer, B tiene 3 elementos, con igual habilidad:
P( B) 3( P 2) 3(1 13) P( B) 3 13.
c) Sea C, el evento gane un hombre casado, C tiene 2 elementos con igual habilidad:
P(C ) 2( P) 2(2 13) P(C ) 4 13.
6.2.1. Axiomas:
Axioma 1.
Cualquiera que sea el suceso S, P [S] 0.
Axioma 2.
Si dos sucesos son incompatibles, la probabilidad de su unin es igual a la suma de sus
probabilidades:
Si: A B = P [AB ] = P [A ] + P [B ]
Axioma 3.
La probabilidad total es 1: P [E ] = 1
84
6.2.3. Teorema de la probabilidad condicional
Sean A y B dos sucesos, tales que P(A)>0. Denotamos la probabilidad de B dado
que A ha ocurrido.
() ()
P(B|A)= = =
() ()
dnde:
P(Ai) son las probabilidades a priori.
P(B | Ai) es la probabilidad de B en la hiptesis Ai.
P(Ai | B) son las probabilidades a posteriori.
Esto se cumple
El Teorema de BAYES se apoya en el proceso inverso al del Teorema de la Probabilidad
Total:
85
Tratar de explicar estar frmula con palabras es un galimatas, as que vamos a intentar
explicarla con un ejemplo. De todos modos, antes de entrar en el ejercicio, recordar que
este teorema tambin exige que el suceso A forme un sistema completo.
Ejemplo.
Aplicacin de la frmula:
86
La probabilidad expresada en porcentaje, de que efectivamente estuviera lloviendo el da
del accidente (probabilidad a posteriori) es del 71,4%.
PROBLEMAS PROPUESTOS
Hbito de Bronquitis
Total
Fumar SI NO
Fuma 140 110 250
No fuma 50 100 150
Total 190 210 400
2. Una compaa dedicada al transporte pblico explota tres lneas de una ciudad, de
forma que el 60% de los autobuses cubre el servicio de la primera lnea, el 30% cubre la
segunda y el 10% cubre el servicio de la tercera lnea. Se sabe que la probabilidad de que,
diariamente, un autobs se avere es del 2%, 4% y 1%, respectivamente, para cada lnea.
Determina la probabilidad de que, en un da, un autobs sufra una avera.
87
4. Se lanzan dos dados equilibrados con seis caras marcadas con los nmeros del 1 al
6. Se pide:
Halla la probabilidad de que la suma de los valores que aparecen en la cara superior sea
mltiplo de tres.
Cul es la probabilidad de que los valores obtenidos difieran en una cantidad mayor de
dos?
8. Se extrae una bola de una urna que contiene 4 bolas rojas, 5 blancas y 6 negras,
cul es la probabilidad de que la bola sea roja o blanca? Cul es la probabilidad de que no
sea blanca?
9. .En un centro escolar los alumnos pueden optar por cursar como lengua extranjera
ingls o francs. En un determinado curso, el 90% de los alumnos estudia ingls y el resto
francs. El 30% de los que estudian ingls son chicos y de los que estudian francs son
chicos el 40%. El elegido un alumno al azar, cul es la probabilidad de que sea chica?
10. En cierta encuesta se listaron como sigue los resultados sobre el uso de ropa para
dormir mientras se viaja:
88
Gnero
Uso de ropa Hombre Mujer
Ropa interior 0,22 0,024
Camisn 0,002 0,18
Nada 0,16 0,018
Pijamas 0,102 0,073
Camiseta 0,046 0,088
Otros 0,084 0,003
a) Cul es la probabilidad de que un viajero sea hombre?
b) Cul es la probabilidad de que un viajero sea hombre si duerme en pijama o en
camiseta?
CAPTULO VII
89
Distribuciones Probabilsticas
X f(x) =
probabilidad
1 0.35
2 0.30
3 0.20
4 0.10
5 0.05
90
Ejemplo el tiempo. La variable aleatoria X, peso neto en libras de un herbicida qumico
empacado es
EX xf(x)
x
EX xf(x)dx
2 Var X EX x - f(x)
2 2
91
5
2 Var X EX x - f(x) x 2.2 (2)
2 2 2
x i 1
(1 2.2) (0.35) (2 2.2) 2 (0.30) (3 2.2) 2 (0.20) (4 2.2) 2 (0.10) (5 2.2) 2 (0.05)
2
1.6
2 VarX EX x - f(x)dx
2 2
2
3
(50.25) 3 (49.75) 3 0.0208
Distribuciones probabilsticas
Utilidad:
La distribucin binomial se utiliza en situaciones cuya solucin tiene dos posibles
resultados.
Por ejemplo:
-Al nacer un beb puede ser hombre o mujer
-En el deporte un equipo puede ganar o perder.
-En pruebas de cierto o falso slo hay dos alternativas.
92
-Un tratamiento mdico puede ser efectivo o inefectivo.
-La meta de produccin o ventas del mes se pueden o no lograr.
-En pruebas de seleccin mltiple, aunque hay cuatro o cinco alternativas, se puede
clasificar como correcta o incorrecta.
P X x Cxn p x q n x
n!
P X x . p x .(1 p)n x
n x ! x !
b) Varianza
() = 2 =
c) Desviacin estndar
npq
Ejemplo 1
Un comerciante tiene conocimiento de que el 12% de los artculos del lote recibido estn
defectuosos. Si un comprador elige 4 artculos, encuentre la probabilidad de que.
a) los 4 estn defectuosos.
( = 4) = 44 (0.12)4 (0.88)0 = 0.0002074
b) de 1 a 3 estn defectuosos.
93
P(1 3) = 14 (0.12)1 (0.88)3 + 24 (0.12)2 (0.88)2 + 34 (0.12)3 (0.88)1 =
0.4009728
Ejemplo 2
En pruebas realizadas a un amortiguador para automvil se encontr que el 20%
presentaban fuga de aceite. Si se instalan 8 de estos amortiguadores, hallar la probabilidad
de que,
a) 4 salgan defectuosos
( = 4) = 48 (0.2)4 (0.8)4 = 0.05
b) ms de 5 tengan fuga de aceite.
( > 5) = 68 (0.2)6 (0.8)2 + 78 (0.2)7 (0.8)4 + 88 (0.2)8 (0.8)0
= 0.00123136
c) de 3 a 5 amortiguadores salgan defectuosos.
P(3 5) = 38 (0.2)3 (0.8)5 + 48 (0.2)4 (0.8)4 + 58 (0.2)5 (0.8)3 =
0,20185088
d) Determine el promedio y la desviacin estndar de amortiguadores con defectos.
() = = 8 (0.20) = 1,6 2
Ejemplo 3
Un ingeniero que labora en el departamento de control de calidad de una empresa elctrica,
inspecciona una muestra al azar de 20 alternadores de un lote. Si el 10% de los
alternadores del lote estn defectuosos. Cul es la probabilidad de que en la muestra,
a) Ninguno este defectuoso
( = 0) = 020 (0.1)0 (0.9)20 = 0,12157665
b) uno salga defectuoso,
( = 1) = 120 (0.1)1 (0.9)19 = 0,27017034
c) A lo ms dos salgan defectuosos
( 2) = 020 (0.1)0 (0.9)20 + 120 (0.1)1 (0.9)19 + 220 (0.1)2 (0.9)18 = 0,67692681
94
7.2. Distribucin Hipergeomtrica
Introduccion
La distribucin hipergeomtrica al igual que la distribucin binomial se aplica en
situaciones donde se espera que ocurra o no un evento especfico, la diferencia es que en la
distribucin binomial, cada producto es extrado con reemplazo y todos los intentos son
independientes, en cambio en la distribucin hipergeomtrica cada muestra es extrada sin
reemplazo y los intentos son dependientes.
Utilidad:
La distribucin hipergeomtrica es especialmente til en todos aquellos casos en los que se
extraigan muestras o se realizan experiencias repetidas sin devolucin del elemento
extrado o sin retornar a la situacin experimental inicial.
Por ejemplo:
-Se quiere seleccionar 2 hombres de 17 personas de las cuales hay slo 7 hombres
-En la agro industria se tiene 8 terneros de los cuales hay 3 enfermos, se quiere
seleccionar 2 para la venta.
- Se tiene 22 empleados de los cuales 12 tienen estudios tcnicos, se requiere 5 de ellos.
Este modelo presenta similitudes con el Binomial, pero sin la suposicin de independencia
de ste ltimo, la dependencia se debe al hecho de que N es finito y las extracciones se
efectan sin reemplazamiento
1) la cantidad de pruebas N
2) n de elementos en la poblacin original que pertenecen a la categora deseada d
3) tamao de muestra extrada n
4) n de elementos en la muestra que pertenecen a la categora deseada x
5) utilizar la funcin matemtica.
95
b) Varianza
V(X) = n*p*q (N-n)/(N-1)
c) Desviacin estndar
= ( )/( 1)
Ejemplo 1
En una empresa industrial diariamente se producen 14 unidades de metalmecnica, de las
cuales generalmente 5 salen defectuosas. Se examina en un da cualquiera una muestra de 4
unidades. Hallar la probabilidad de:
(54)(145
54 )
P( = 4) = (14
= 0.0449
4)
Ejemplo 2
Entre los 12 colectores solares en exhibicin en una feria comercial 9 son planos y los otros
3 son curvos. Si una persona que visita la feria selecciona aleatoriamente 3 colectores para
probarlos y luego comprarlos, cul es la probabilidad de que:
a) los 3 sean colectores planos?
b) los 3 sean colectores curvos?
Solucin:
9 3
a) P(x=3) = = 0,3818
3 0
12
3
b) P(x=0) = 9 3 = 0,004545
0
3
12
3
96
Ejemplo N 3:
Un fabricante de tractores compra motores de una compaa, bajo una condicin, acepta un
lote de 40 motores si de una muestra de 8 motores ninguno presenta defectos. Cul es la
probabilidad de aceptar un lote que en realidad tiene 2 motores con defectos?
2 38
P(x=0) = = 0,6359
0 8
40
8
Utilidad
Su utilidad se da en general en los problemas llamados lneas de espera, teora de colas o
similares.
Ejemplo
- N de leucocitos en una gota de sangre
- N de veces que una planta de energa nuclear emite gases radiactivos en un periodo
de tres meses
- Nmero de bacterias nocivas por cada cm3 de agua.
- Nmero de personas que llegan a una posta mdica para ser atendidos
- Nmero de aviones que llegan a un aeropuerto durante el da.
La aproximacin de una v.a del tipo binomial a una del tipo Poisson, es muy buena si n
100 y p 0,05
Ejemplo 1:
Se sabe que el nmero promedio de camiones que llegan a un terminal terrestre durante el
da es de 10, las instalaciones del terminal pueden atender como mximo 15 camiones al
da. Cul es la probabilidad de que la capacidad de atencin del terminal sea superado en
un da cualquiera?
Solucin:
X = nmero de camiones que llegan al terminal terrestre durante el da para ser atendidos.
X= 0, 1, 2, 3,..
P(x > 15) = 1 P(x 15)
15
e 10 10 x
x!
=1- x 0 = 1 - 0,9513 = 0,0487
Ejemplo 2:
En cierto proceso de fabricacin en el que se producen artculos de porcelana ocurren
defectos que ocasionan problemas en las ventas, el fabricante asegura que en promedio uno
de cada 1000 artculos producidos es defectuoso. Cul es la probabilidad de que en una
caja de 3000 artculos haya:
a) exactamente 3 artculos con defectos?
b) al menos un artculo con defectos?
Solucin:
a) X: nmero de artculos defectuosos en la muestra.
= np = 3000(1/1000) = 3
e 3 3 3
P(x=3) = = 0,224042
3!
98
b) P(x 1) = 1 - P(x=0) = 1 1/e3 = 1 0,049787 = 0,950213
Ejemplo 3:
El nmero de clientes que llegan a un banco es en promedio 60 por hora, cul es la
probabilidad de que lleguen 2 clientes en:
a) un minuto?
b) dos minutos?
Solucin:
a) = 60(1/60) = 1
1 2
P(x=2) = e 1 1 / 2e 0,1839
2!
b) = 120(1/60) = 2
P(x=2) = e-222/2! = 2/e2 = 0,27067
Utilidad
Se utiliza en muchos fenmenos que ocurren en la naturaleza, en la industria y en cualquier
campo, tales como: la temperatura del medio ambiente, la precipitacin pluvial, las
mediciones de magnitudes fsicas, el peso y la talla de las personas, etc.
Ejemplos
Consumo de cierto producto por un mismo grupo de individuos,
Cociente intelectual, grado de adaptacin a un medio
Efecto de una misma dosis de un frmaco, o de una misma cantidad de abono
Propiedades
99
1.- Sus puntos de inflexin son: - y + , por lo tanto es cncava hacia abajo en el
intervalo - < x < + ,
2.- La media y la Varianza de la distribucin son: y 2 respectivamente, y que son los
parmetros de la distribucin.
3.- Las reas comprendidas bajo la curva normal son:
, corresponde al 68,26% del rea total.
2, corresponde al 95,44% del rea total.
3, corresponde al 99,74% del rea total.
4.- A cualquier v.a que tiene distribucin normal con media y varianza 2, se le
representa por: N(, 2)
Definicin:
Se dice que una variable aleatoria continua X, tiene una distribucin normal, si su funcin
de densidad est dada por:
F (x) = 1 1 x 2 -<x< Donde: - < < y > 0
exp ( )
2 2
a) P(Z1.60)
0.9452
Segn la Tabla de la Distribucin Normal
Para Z1.60 P=0.9452
1.60
b) P(Z1.30)
Segn la Tabla de la Distribucin Normal
0.9032
Para Z1.30 P=0.9032
1.30
c) P(Z-2.36)
Segn la Tabla de la Distribucin Normal
0.0039
Para Z-2.36 = 1- Z2.36 P=1-0.9961=0.0039
Z-2.36 = 0.0039
100
-2.36
d) P(-2.00Z2.00)
Segn la Tabla de la Distribucin Normal
Para -2.00Z2.00 = Z2.00- Z-2.00 P=0.9772-(1-0.9772)=0.9772-0.0228=0.9544
-2.00Z2.00 = 0.9544
0.9544
-2.00 2.00
e) P(-2.50Z2.50)
Segn la Tabla de la Distribucin Normal
Para -2.50Z2.50 = Z2.50- Z-2.50 P=0.9938-(1-0.9938)=0.9938-0.0062=0.9876
-2.50Z2.50 = 0.9876
0.9876
-2.50 2.50
Aplicaciones
1. Los tiempos de atencin al cliente en minutos en una entidad financiera BCP tienen
distribucin normal con medios 10 minutos y desviacin estndar de 0.6 minutos, hallar:
101
Como se tiene 10 clientes entonces el nmero de tiempo de atencin de 11 minutos est
dada por:
n1 = n X P [X 11]
n1 = n X P [Z 1.67]
n1 = 10 X 0.95254
n1 = 9.53 minutos
0.9522
10 11
X
0.9
0 1.282
X
Como se tiene 10 clientes entonces el nmero de clientes porcentaje de 8 minutos est dada
por:
n1 = n XP [x> 8]
n1 = n X P [Z > - 3.33]
n1 = 10 X 0.00343
n1 = 3.43 de clientes
102
0.9996
8 10
X
10 10
P(X < 10) = ( < )
0.6
P( X < 10) = P( Z< 0 )
P( X < 10) = 0.500000
P( X < 10) = 0.500000
103
0.04779
10 11
X
2. Los salarios de los trabajadores en cierta industria son en promedio $ 11.9 por hora y la
desviacin estndar es de $ 0.4. Si los salarios tienen una distribucin normal. Cul es
la probabilidad de que un trabajador seleccionado al azar:
a) Reciba salarios inferiores a $ 11?
P [X 11]
P (X11) = 11 11.9/0.4
P (Z -2.25) = P (Z< -2.25)
P (Z -2.25) = 0.0122
n = n x P (x11)
n = n x P (Z -2.25)
n =11 x 0.0122
n = 0.1342
n =13.42 Dlares
0.01222
11 11.9
X
b) Cul debe ser el salario menor que gana un trabajador que se encuentra entre
el 10% de los trabajadores que ms ganan?
P [X X1] = 0.10
Estandarizando obtenemos:
P (-ZX) = 0.01
Interpolando obtenemos:
Z AREA
-1.29 0.985
104
-Z 0.10
-1.28 0.1003
0.8997
11.9 12.412
X
3. La renta media de los habitantes de un pas es de 4 de ptas/ao, con una varianza de 1,5.
Se supone que se distribuye segn una distribucin normal. Calcular:
Estandarizando obtenemos:
P[ZZ1]=0.80
105
Z1 Se encuentra en el rea de los positivos de la distribucin normal estndar, entonces
aplicamos la propiedad:
P [ZZ1]=1-P[ZZ1]=0.80
1-P [ZZ1]=0.80
P [Z<Z1]=0.20
Interpolando:
Z REA
-0.85 0.1977
Z 0.20
-0.84 0. 2005
0.0028 0.01
=
0.0023 Z-0.85
X1 = 4 + (-0.84 x 1.5)
X1 = 4 + 1.26
X1 = -2.74 renta mnima.
0.8
2.738 4
X
106
Utilidad
1) Para determinar el intervalo de confianza dentro del cual se puede estimar la media de
una poblacin a partir de una muestra pequea(n<30)
2) Para probar hiptesis cuando una investigacin se basa en muestreo pequeo.
3) Para probar si dos muestras proviene de la misma poblacin.
Ejemplos
-Para probar que el promedio de calificaciones de un grupo de 12 estudiantes, es el mismo
del ao anterior.
- El efecto del consumo de nicotina de mujeres embarazada con el contenido mineral seo
de su hijo.
Elementos
Significancia, = Alfa
Ejemplos:
107
b) P [ -1.325 T 2.845]
P [T 2.845] P [T -1 .325]
0.995 0.1
P (T) = 0.895
108
Elementos
Grados de libertad (n-1)
Nivel de significancia = alfa
Varianza muestral S2
Varianza poblacional 2
Ejemplos:
Suponga que los tiempos requeridos por un cierto autobs para alcanzar un de sus destinos
en una ciudad grande forman una distribucin normal con una desviacin estndar =1
minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la
varianza muestral sea mayor que 2.
Solucin:
Se denomina tambin la distribucin Chi- cuadrado con k grados de libertad. que puede ser
cualquier entero positivo incluyendo al 1 y est representado por df.
a) P [ X 40.00]
= 1- P [ X 40.00]
=1 - 0.995
109
0.005
b) P [ 15.45 X 40.00]
P [ X 40.00] - P [ X 15.45]
0.995 - 0.25
0.745
z= x
~ N (0,1)
Por lo tanto:
E(z) = E( x ) = E(x/) E(/) = E(x)/ - / = / - / = 0
V(z) = V( x ) = V(x/) V(/) = V(x)/2 0 = 2/2 = 1
En consecuencia:
f(z)= 1 1 -<z<
exp z 2
2 2
110
Solucin:
a) P(z 1) = F(1) = 0,8413
b) P(z > 2) = 1 P(z 2) = 1 F(2) = 1 0,9772 = 0,0228
c) P(z > 1,5) = F(1,5) = 0,9332
d) P( -2 < z < 1.75) = F(1,75) F(-2) = 0,9599 0,0228 = 0,9371
e) P(0,05 < z > 1,96) = F(1,96) F(0,05) = 0,975 0,5199 = 0,4551
Nota.- la tabla usa valores de z con dos decimales como mximo, por lo que se debe
redondear los valores de z originales a dos decimales.
Ejemplos Prcticos:
Ejemplo 1:
El tiempo requerido para ensamblar una pieza mecnica es una v.a. cuya distribucin es
normal con media igual a 12,9 mn. y = 2 minutos, cul es la probabilidad de que una
pieza sea ensamblada en:
a) en menos de 11,5 mn.?
b) entre 11 y 14,8 mn.?
c) en ms de 11,8 mn.?
d) exactamente 11 mn.?
Solucin:
a) P(x < 11,5) = P ( z < z1) = P(z < - 0,7) = 0,2420
Donde z1 = 11,5 12,9 = -0.7
2
b) P (11 < x < 14, 8) = P (z2 < z < z3)= P(-0,95 < z < 0,95)
Dnde: z2 = 11 12,9 z3 = 14,8 12,9
0,95 0,95
2 2
c) P(x > 11,8) = P(z > z4) = P(z > -0,55) = 1 F(-0,55) = 1- 0,7088
111
d) P(x=11) = 0, sin embargo es factible estimar la probabilidad entre 110,5, es decir
P(10,5 x 11,5) = P(z1 z z2)
Dnde: z1 = 10,5 12,9 1,2 z2 = 11,5 12,9 0,7
2 2
P(-1,2 z - 0,7) = P(0,7 z 1,2) = 0,88493 0,75804 = 0, 12689
Como puede apreciar esta probabilidad es alta, por lo que la recomendacin es cuando los
valores sean bastante altos y no pequeos como lo que se tiene. O cuando se usa variables
discretas.
Ejemplo 2:
Un embarque de 2500 aros son enviados a una ensambladora con las especificaciones que
los dimetros de los aros deben estar en el intervalo 0,3 0,005 pulgadas. Si los dimetros
internos de los aros tienen una distribucin normal con media 0,302 pulg. Y una = 0,003
pulg.Qu porcentaje de aros cumplirn las especificaciones?
Solucin:
P(0,295 < x < 0,305) = P(z1 < z < z2) = P(-2,33 < z < 1,00)
Donde. z1 = 0,295 0,302 = - 2,33 z2 = 0,305 0302 1,00
0,003 0,003
Ejemplo 3:
Los hornos elctricos fabricados por una compaa tienen una duracin promedio de 15000
hrs. Y una = 2500 hrs.
a) si el fabricante promete reponer todo horno que falle antes de las 7500 hrs., qu
proporcin de sus hornos tendr que reponer?
b) si da como tiempo de garanta de 8500 hrs., qu proporcin de los hornos tendr
reponer?
c) si slo quiere reponer mximo el 1% de sus hornos, qu tiempo de garanta tendr que
dar?
Solucin:
a) P(x 7500) = P(z z1)
Donde z1 = 7500 1500 3
2500
P(z -3) = F(-3) = 0,0013 0,13% de sus hornos
112
b) P(x 8500) = P(z z2)
Donde z1 = 8500 1500 2,6
2500
P(z -2,6) = F(-2,6) = 0,0047 0,4,7% de sus hornos
PROBLEMAS PROPUESTOS
1.- En una fbrica hay 12 mquinas. Cada una de ellas est averiada un da de cada 10,
cul es la probabilidad de que en un determinado da haya ms de tres mquinas
averiadas?
2.- De una poblacin de conservas se sabe que el 60% son buenos. Si se extrae un
conjunto de 10 de ellos, cul es la probabilidad de que en ese conjunto haya 7
defectuosos?
3..- Un mdico ha obsevado que el 13% de sus pacientes sufre de efectos negativos cuando
le administran cierto frmaco, a un grupo de 5 pacientes le recet ste medicamento y
desea saber la siguiente probabilidad.
113
a) Que ninguno de ellos tenga efectos negativos
b) Uno o ms tengan los efectos nosivos.
c) Un paciente tenga efectos nosivos
4.- De cada 2000 tornillos fabricados por una determinada mquina hay 2 defectuosos. Para
realizar el control de calidad se observan 150 tornillos y se rechaza el lote si el nmero de
defectuosos es mayor que 1. Calcular la probabilidad de que el lote sea rechazado?
6.- El nmero medio de llamadas telefnicas que se reciben en una central en cada minuto
es de 2, determnese la probabilidad que se reciban ms de 5 llamadas.
8.- La concertista de piano Donna Prima est muy molesta por el nmero de tosidos que se
presentan en la audiencia justo antes de que empiece a tocar. Durante su ltima gira Donna
estim un promedio de 8 tosidos justo antes de empezar su concierto. La seora Prima le ha
advertido a su diretor que si escucha mas de cinco tosidos en el concierto de esa noche, se
rehusar a tocar. cul ser la probabilidad de la artista toque esa noche?
115
CAPTULO VIII
Muestreo
Tamao de Muestra
8.1. Tamao de Muestras
Para determinar un tamao de muestra es necesario identificar los siguientes componentes o
elementos:
1) La varianza (2): corresponde al grado de variabilidad que presentan las unidades de
la poblacin. Mientras ms grande sea 2 mayor ser el tamao de la muestra. El valor de
2x supuestamente conocido, de lo contrario se debe estimar a travs de una investigacin
116
preliminar. En el caso de 2p = PQ, sucede algo similar, pero se tiene la costumbre de tomar
P= 0,50 con lo cual se obtiene el mximo valor posible de n.
2) Nivel de confianza: Tiene relacin directa con el tamao de la muestra, por lo tanto
se dir que a mayor nivel de confianza ms grande debe ser el tamao de la muestra. Los
valores de Z se obtienen mediante el uso de tablas como se ha venido haciendo. El nivel de
significacin es fijado por el investigador, de acuerdo a su experiencia.
3) Precisin de la estimacin: Corresponde al margen de error que el investigador fija
de acuerdo con el conocimiento que tenga acerca del parmetro que piensa estimar. Se le
conoce como error de muestreo (E).
Las frmulas para el clculo del tamao de muestra son los siguientes:
TAMAO DE Cuando se conoce N Cuando NO se conoce
MUESTRA N
2 2 2 2
= =
Para la media ( 1) 2 + 2 2 2
2 2
= =
Para la proporcin ( 1) 2 + 2 2
Donde:
n: Tamao de muestra
Nivel de Valor de
Z: Nivel de confianza
confianza Z
E: Margen de error
90% 1,65
2 : Varianza poblacional
: Desviacin estndar de la poblacin 95% 1,96
P: Proporcin de la poblacin que tiene la 99% 2,58
caracterstica de inters
Q: 1- P
N: Tamao de la poblacin
Ejemplo. 1:
El auditor de un banco desea estimar la proporcin de estados, de cuenta bancarias
mensuales para los depositantes del banco que tendrn errores de varias clases, y especifica
un coeficiente de confianza del 99% y un error mximo de 4%.
(a)Determinar el tamao de la muestra si no se dispone de informacin sobre la proporcin
verdadera de los estados de cuenta mensuales que tienen errores.
(b)Determinar el tamao de la muestra, si el auditor, por su experiencia, cree que la
verdadera proporcin de estados de cuenta con errores es 0.15.
117
Solucin A:
2
=
Z99% = 2,58 2
E = 4% = 0,04
P = 0,5 2,582 0,5 0,5
=
Q = 1-0,5 = 0,5 0,042
= 1040
Solucin B:
2
Z99% = 2,58 =
2
E = 4% = 0,04
P = 0,15 2,582 0,15 0,85
Q = 1-0,15 = 0,85 =
0,042
= 530
Ejemplo. 2:
Se pretende realizar una investigacin para conocer el tiempo de estudio semanal dado
en horas, de los estudiantes de la Universidad Seor de Sipn. Si un estudio previo
determin que la varianza fue de 0,32 horas. Qu tamao de muestra sera
conveniente para la investigacin? Considerando un nivel de confianza del 95% y un
error tolerable de 0,05 horas.
Solucin :
2 2
=
2
Z95% = 1,96
1,962 0,32
E = 0,05 =
0,052
2 = 0,32
= 492
8.2. Muestreo
El muestreo son las tcnicas o herramientas utilizadas para la realizacin de una
muestra. En la aplicacin de estas tcnicas es necesario conocer y manejar algunos trminos
indispensables en el desarrollo de una investigacin, tal como se detallan a continuacin:
118
contrario, tan slo se hace recuento se le denomina atributo o puede ser una variable
discreta.
Considerar la poblacin como conjunto de unidades o elementos, debe entenderse como un
grupo de personas, familias, establecimientos, manzanas, barrios, etc., pero en realidad es
un conjunto de medidas obtenidas de las caractersticas estudiadas.
119
- Afijacin ptima: cuando el tamao, tanto de la muestra general como para cada uno
de los estratos muestrales, depende del grado de variabilidad de la caracterstica en
cada estrato y del costo mnimo para una precisin dada.
Es importante hacer notar que en este caso los criterios de seleccin pueden variar de
experto a experto, al determinar cules son las unidades de muestreo representativas de la
poblacin.
120
recaptura, esto es, aqullos que han sido capturados previamente y marcados. Este tipo de
tcnicas se utiliza mucho en el muestreo de insectos, peces, venados, ballenas y, en general,
poblaciones de animales en extincin.
PROBLEMAS PROPUESTOS
1. De una poblacin N=10000 personas nos proponemos obtener una muestra, para
estimar el ingreso promedio por persona. Se quiere que la estimacin muestra, no se aparte
121
en ms de $5000 del promedio verdadero y que esto se cumpla en 95 de cada 100 casos. La
desviacin tpica es de $30000 Cul es el tamao de muestra ptimo?
2. Supongamos que en un rea dada, la proporcin de explotaciones agropecuarias que
poseen energa es de 0,36 Cul es el error de muestreo de la estimacin, utilizando una
muestra al azar de 300 explotaciones, con una confianza del 95% un total de 8000
explotaciones?
3. Qu tamaa deber tener una muestra para estimar dentro del 3% la proporcin de
mujeres casadas que van peridicamente a consulta ginecolgica, en una poblacin de 5000
mujeres y una seguridad del 95%?
4. Se desea estimar el costo promedio de matrculas de los estudiantes universitarios
de la ciudad. Por estudios anteriores y a precios actuales se sabe que la desviacin tpica es
de $18000. a) Calcular el tamao de muestra fijando para ello un error de $3000 y una
confianza del 99% b) Si se considera que la poblacin estudiantil que se desea investigar es
de 12000 Cul sera el valor de n?
5. En cierta residencial se espera que el 60% de las familias tengan vehculo propio. Se
desea hacer una investigacin para estimar la proporcin de familias propietarias de
vehculos, con un error del 3% y un coeficiente de confianza del 90%. a) Determine el
tamao de muestra b) Qu sucedera si P=0,5?
6. Una oficina de investigaciones sobre salud considera que el 20% de las personas
adultas de una regin, padecen cierta enfermedad parasitaria. Cuntas personas tendrn
que seleccionar en la muestra al azar, para que el error del estimado de la proporcin sea
del 7% y tenga una confianza del 99%?
7. Interesa estimar el nmero promedio de accidentes de trnsito en una ciudad.
Durante un ao (365 das) se determina una desviacin tpica de 12 accidentes diarios.
Cuntos das (tamao de muestra) se requieren para no errar en ms de dos accidentes, con
un 90% de confianza?
8. Entre los estudiantes de cierta universidad privada, se desea tomar una muestra para
estimar la proporcin de alumnos que utilizan la biblioteca. El error debe conservarse en un
4% con una confianza del 96%. Cul es el tamao de la muestra, si la universidad tiene
3200 alumnos matriculados?
9. Qu tamao de muestra se requiere para una poblacin de 5000 unidades, si se
desea un error del 8% y un intervalo de confianza del 95%?
10. A partir de una muestra de 200 observaciones se encontr que, en una remesa haba
20 acumuladores defectuosos. Utilizando un nivel de confianza del 99%. Calcule el error de
muestreo.
122
CAPTULO IX
Introduccin a la Inferencia
Estadstica: Estimacin
123
La estadstica tiene como finalidad inferir algo sobre una poblacin con base en una
muestra aleatoria tomada de la poblacin sobre la cual deseamos hacer la inferencia. La
Poblacin tiene constantes desconocidas que la caracterizan, sobre estas constantes se hace
la inferencia. La inferencia consiste en estimar y probar hiptesis sobre estas constantes
desconocidas.
b) Estimador. Es aquel que se calcula con los datos de la muestra (es una funcin de
la muestra). Como ejemplo sealaremos a la media de la muestra ( X ) la cual se calcula con
los datos de la muestra cmo sigue
x 1 x 2 ... x n
X
n
POBLACION
Media de la poblacin
2 Varianza de la poblacin
Desviacin estndar de la poblacin Parmetros
p
Proporcin de la poblacin
MUESTRA
X Media de la muestra
S2 Varianza de la muestra
p Proporcin de la muestra
124
c) Estimador puntual. Es aquel que estima al parmetro mediante un solo valor o punto.
Ejemplo la media de la muestra.
d) Estimador por intervalo. Llamado tambin intervalo de confianza es aquel que estima
al parmetro mediante un intervalo con un coeficiente de confianza (1- ).
e) Hiptesis. Es una afirmacin sobre algo la cual puede ser falsa o verdadera.
Ejemplo. Maana llover.
f) Hiptesis estadstica. Es una afirmacin sobre uno o varios parmetros de una o varias
poblaciones.
Ejemplo. =20, la edad media de todos los alumnos de la USS es 20 aos.
g) Hiptesis nula. Es una afirmacin sobre uno o varios parmetros que incluye la
igualdad. se designa con Ho.
Ejemplo. Ho = Los datos de la muestra provienen de una distribucin normal.
k) Puntos crticos. Son valores tabulares que delimitan la regin de rechazo (RR) y la de
no rechazo (RA).
125
distribucin aproximadamente normal. La muestra aleatoria se puede haber tomado de
cualquier distribucin no necesariamente de la distribucin normal.
Primero presentaremos el resultado para estimar la proporcin de una poblacin y en
seguida un ejemplo.
Teorema 1
Si n 30, entonces:
pq pq
p - Z , p Z .
2
n 2
n
Donde:
x
p , q =1- p , n es el tamao de la muestra y Z es un valor en la tabla de Z o
n 2
distribucin normal estndar de tal manera que a su derecha esta una probabilidad
.
2
Ejemplo 1.
En un estudio sobre desocupacin en el Municipio de T se tom una muestra aleatoria de
200 personas en edad laboral del Municipio de T de las cuales 26 contestaron que no tienen
trabajo.
a) Estimar puntualmente a p, la proporcin de desocupados en el Municipio de T.
b) Encontrar un 95% intervalo de confianza para p, Es decir estimar p con un
coeficiente de confianza del 95%.
c) Interpretar el estimador puntual y el estimador por intervalo.
Solucin
Puesto que n=200 es mayor que 30 y el nmero de xitos es x=26
126
b) Un 95% de confianza para p se encuentra usando el inciso b) del teorema 1
Un 100(1- )% intervalo de confianza para p es
pq pq
p - Z , p Z .
2
n 2
n
Donde:
normal estndar de tal manera que a su derecha esta una probabilidad .
2
Para encontrar Z , primero debemos calcular usando la siguiente formula.
2
0.05
Entonces 0.025 y Z se encuentra en la tabla de la normal estndar ubicando
2 2 2
1.9 0.025
En seguida determinamos los valores del lmite inferior y del lmite superior de 95% del
intervalo de confianza para p
pq (0.13)(0.87)
LI p - Z 0.13 1.96 0.13 0.05 0.08
2
n 200
pq (0.13)(0.87)
LS p Z 0.13 1.96 0.13 0.05 0.18
2
n 200
Entonces un 95% intervalo de confianza para p es [0.08, 0.18]. Es decir se estima que la
proporcin poblacional esta entre 0.08 y 0.18.
127
c) Interpretacin.
Si usamos un estimador puntual para estimar p, se concluye que el porcentaje de
desocupacin en el Municipio de T es alrededor del 13% y si usamos un estimador por
intervalo para estimar p se concluye que el porcentaje de desocupacin en el Municipio de
T esta entre el 8% y el 18% dicha conclusin se hace con un confianza de confianza
del95%.o con un error del 5%.
Teorema 2
Si se cumplen los dos requerimientos mencionados anteriormente; es decir, si la
variable en estudio tiene distribucin normal y la varianza de esta distribucin es
desconocida (si la varianza es desconocida, entonces la desviacin estndar de la
poblacin tambin es desconocida), entonces
a) El mejor estimador puntual para es la media muestral X .
b) Un 100(1- )% intervalo de confianza para es
S S
X - t n -1, , Xt .
2 n n -1,
2 n
Donde:
X es la media de la muestra, S es la desviacin estndar de la muestra, n es el tamao
de la muestra y t es un valor en la tabla de t de Student con n-1 grados de
n 1,
2
libertad (GL) de tal manera que a su derecha esta una probabilidad de
2
128
Ejemplo 2
En un estudio para estimar el salario promedio mensual de los profesores del departamento
de Lambayeque se tom una muestra aleatoria de tres profesores a los cuales se les registro
su salario mensual en soles. Se conoce que variable salario tiene distribucin normal. Los
datos de la muestra se dan a continuacin
1200 800 1000
Como los dos requerimientos se cumplen: la variable en estudio tiene distribucin normal y
la varianza 2 es desconocida, usaremos el teorema 2 para encontrar los estimadores de .
a) El mejor estimador puntual para es X
n
S S
X - t n -1, , Xt . Donde:
2 n n -1,
2 n
X =1000,
n=3,
( x i ) 2 (1200 800 1000) 2
x i2 n
1200 2 800 2 1000 2
3
S 40000 ,
n 1 3 1
0.05
0.025 y
2 2
columna los n-1=2 grados de libertad, en la primera hilera la probabilidad 0.025 y
2
finalmente se detecta el valor t en la interseccin de estos dos valores como se indica
n 1,
2
en la tabla siguiente:
129
0.025
2
n-1=2 4.303
Con estos datos podemos calcular el lmite inferior (LI) y el lmite superior (LS) del
intervalo de confianza pedido.
S 200
LI X t 1000 4.303 * 1000 496.88 503.12.
n 1, n 3
2
S 200
LS X t 1000 4.303 *
1000 496.88 1496.88.
n 1,
n 3
2
A si un 95% intervalo de confianza para .12 es [503.12, 1496.88].
c) Interpretacin
Si se usa un estimador puntual, se concluye que el salario promedio mensual de todos los
profesores del departamento de Lambayeque es de 1000 soles, sin embargo si se usa un
estimador por intervalo para el salario promedio, se estima que el salario promedio mensual
de todos los profesores del departamento de Lambayeque esta entre 503 soles y 1496.88
soles.
130
PROBLEMAS PROPUESTOS
2. En un estudio realizado por Waall Street Journal, se tom una muestra aleatoria de
900 personas que estn suscritas en Wall Street Journal, de estas 900 personas el 40%
indicaron que terminaron al menos dos aos en una Universidad.
a) Encuentre un 95% intervalo de confianza para la proporcin de suscritores de Wall
Street Journal que terminaron al menos dos aos de estudios universitarios.
b) Interprete lo que encontr en el inciso a).
6. Un agricultor afirma que l puede determinar si una semilla de papaya es macho con
solo palpar la semilla. Para probar tal afirmacin se tomaron 1000 semillas al azar para que
examine el agricultor y determine si es semilla de papayo macho, posteriormente se
sembraron las semillas y se determin realmente si eran semillas de papayo macho.
Finalmente al hacer el cotejo se encontr que el agricultor de detecto el sexo de 6 semillas
correctamente.
131
a) Encontrar un estimador puntual para la proporcin de semillas detectadas
correctamente por el agricultor con respecto al sexo.
b) Encontrar un 95% intervalo de confianza para la proporcin de semillas detectadas
correctamente por el agricultor con respecto al sexo. Cul es su opinin con respecto a
la afirmacin del agricultor?
10. Se analiz una marca particular de margarina diettica para determinar el nivel de
cido graso polinsaturado (en porcentaje).Una muestra de 6 paquetes al azar dio como
resultado los siguientes datos:
16.8 17.2 17.4 16.9 16.5 17.1
Se conoce que el nivel de cido graso polinsaturado tiene distribucin normal.
a) Encontrar un estimador puntual para .
b) Encuentre un 95% Intervalo de confianza para .
c) Interprete en trminos del problema lo calculado en los incisos a) y b).
132
CAPTULO X
Introduccin a la Inferencia
Estadstica: Prueba de
Hiptesis
133
10.1 PRUEBAS DE HIPOTESIS
Otra de las finalidades de la inferencia estadstica, probablemente la ms importante
en investigacin, es la prueba de hiptesis. Es decir, probar enunciados o afirmaciones
sobre los parmetros de las poblaciones.
134
III. Pruebas de Hiptesis para la proporcin p y para la media :
En los resultados o teoremas para pruebas de hiptesis presentaremos en cada uno de ellos
tres incisos describiendo brevemente los pasos a seguir para probar la hiptesis. Es decir, se
presenta el valor calculado (estadstica de prueba), el valor tabular o punto crtico, la regin
de rechazo (RR), regin de no rechazo o regin de aceptacin (RA), y la regla de decisin.
Teorema 3
Si n, el tamao de muestra, es mayor o igual a 30, entonces
a) Ho: p = p* versus
Ha: p p*
RR RA RR
-Zt Zt
Regla de decisin
135
b) Ho: pp* versus
Ha: p>p*
RA RR
Zt
Regla de decisin
RR RA
-Zt
Regla de decisin
136
Ejemplo
Usando los datos del ejemplo del estudio de desocupacin en el municipio de T probar con
=0.05 que el porcentaje de desocupacin en el municipio de T es diferente del 4%,
afirmacin que hace el gobierno central.
2. Nivel de significancia:
=0.05.
3. Estadstico de prueba:
p p *
Zc
p * (1 p*)
n
4. Regin de aceptacin y rechazo:
Zt= Z Z 0.05 Z 0.025 1.96 .
2 2
RR RA RR
-Zt Zt
-1.96 1.96
7. Conclusin:
Con un nivel de significancia del 5% se concluye que el porcentaje de desocupacin en
el municipio de T es significativamente diferente del 4% que afirma el gobierno central.
137
Tambin podramos haber probado la hiptesis considerando en la hiptesis alternante que
la proporcin de desocupados en el municipio de T es mayor del 4%, lo cual ilustraremos
en seguida.
Usaremos el inciso b) del teorema 3.
1. Planteamiento de hiptesis:
Ho: p=0.04 versus
H1: p>0.04
2. Nivel de significancia:
=0.05
3. Estadstico de prueba:
p p *
Zc
p * (1 p*)
n
4. Regin de aceptacin y rechazo:
Valor tabular Zt
RA RR
Zt
1.96
7. Conclusin:
138
B. Pruebas de hiptesis sobre el parmetro , media de una poblacin
Trataremos solo el caso cuando la variable en estudio tiene distribucin normal con
varianza desconocida., para este caso se presenta la una prueba de dos colas (Ha: *)
y dos pruebas de una cola (Ha: > * y Ha: < *).
Teorema 4
a) Ho: = * versus
Ha: *
X*
tc
S
n
Valor tabular tt
tt= t valor en la tabla de Tcon n - 1 GL tal que a su derecha esta una probabilid ad .
n 1, 2
2
GL=grados de libertad
Regin de rechazo (RR) y la regin de aceptacin (RA)
RR RA RR
- tt tt
Regla de decisin
b) Ho: = * versus
Ha: > *
Valor calculado tc
X*
tc
S
n
139
Valor tabular tt
tt= t n 1, valor en la tabla de Tcon n - 1 GL tal que a su derecha esta una probabilid ad .
GL=grados de libertad
RA RR
tt
Regla de decisin
c) Ho: = * versus
Ha: < *
Valor calculado tc
X*
tc
S
n
Encontrar el tt
tt= t n 1, valor en la tabla de Tcon n - 1 GL tal que a su derecha esta una probabilid ad .
GL=grados de libertad
RR RA
- tt
Regla de decisin
140
Ejemplo
Usando los datos del ejemplo de investigacin sobre estimacin del salario promedio de
todos los profesores del departamento de Lambayeque, probar con =0.05 si el salario
promedio de los profesores es diferente a 1200 soles mensuales.
En el ejemplo tenemos los siguientes datos: n=3, la media muestral es igual a 1000 y la
desviacin estndar de la muestra es 200.
1. Planteamiento de hiptesis: 2.Nivel de significancia:
Ho: =1200 versus =0.05
H1: 1200
3. Estadstico de prueba:
X *
tc
S
n
4. Regin de aceptacin y rechazo:
Valor tabular tt
t t 2,0.025 4.303
n 1,
tt= 2
- tt tt
-4.303 4.303
5. Calculamos el estadstico de prueba:
X * 1000 1200
tc 1.73
S 200
n 3
6. Decisin:
Como el tc = -1.73 cae en la RA, no se rechaza Ho.
7. Conclusin:
Con un nivel de significancia del 5 % (error del 5%) se concluye que el salario
promedio de los profesores del departamento de Lambayeque no es significativamente
diferente de 1200 soles por mes. Es decir, con un nivel de significancia del 5% los datos de
muestra aleatoria no muestran evidencias para rechazar la hiptesis de que el salario
promedio de todos los profesores del departamento de Lambayeque es de 1200 soles
mensuales
141
PROBLEMAS PROPUESTOS
3. En un estudio realizado por Wall Street Journal, se tom una muestra aleatoria de 900
personas que estn suscritas en Wall Street Journal, de estas 900 personas el 40% indicaron
que terminaron al menos dos aos en una Universidad.
Probar con =0.05 que la proporcin de suscritores de Wall Street Journal que terminaron
al menos dos aos de estudios universitarios es del 50%.
4. Un gerente compro 10000 bateras para la empresa en la cual trabaja. El gerente toma
una muestra aleatoria de 300 bateras de las 10000 compradas las cuales fueron examinadas
resultando 42 bateras defectuosas.
Probar con =0.05 que menos del 5%. De las bateras son defectuosas. De su conclusin
en trminos del problema.
7. Un fabricante de llantas est investigando la vida de las llantas producidas con un nuevo
producto. Tomo una muestra aleatoria de 16 llantas producidas con este nuevo producto y
las ha probado hasta el fin de su vida til en una prueba de carretera. La media y la
desviacin estndar muestrales son 60139.7 y 3645.94 km. Se conoce que la vida til de las
llantas tiene distribucin normal. Al fabricante le gustara demostrar que la vida media de
142
esta nueva llanta es mayor de 60000 km. Formule y pruebe las hiptesis apropiadas con
=0.05, y establezca conclusiones.
11 09 03 03 03
05 10 06 05 02
03 15 04 07 01
08 18 02 03 02
01 11 03 03 03
04 02 06 05 05
03 05 08 01 04
Para probar si los datos de la muestra provienen de una distribucin normal construya un
histograma de frecuencias y observe si la distribucin de frecuencias tiene forma
acampanada lo cual indicara que los datos provienen de una distribucin normal en caso
contrario se concluye que los datos no provienen de una distribucin normal.
Hacer la prueba normal. Revisar un libro donde este descrito la prueba de bondad de ajuste
para prueba de normalidad. Por ejemplo puede revisar el libro: Introduccin a los mtodos
estadsticos un enfoque multidisciplinario de los autores Said y Zarate.
143
CAPTULO XI
144
Pruebas No Paramtricas
Distribucin Chi-cuadrada ( 2)
La distribucin chi cuadrada es toda una familia de distribuciones. Las aplicaciones ms
comunes de la distribucin chi-cuadrada son (1) pruebas de bondad de ajuste y (2) pruebas
de independencia y (3) Prueba de Homogeneidad
Supongamos que tenemos un nmero k de clases en las cuales se han ido registrando un
total de n observaciones (n ser pues el tamao muestral). Denotaremos las frecuencias
observadas en cada clase por O1, O2,, Ok (Oi es el nmero de valores en la clase Ai). Se
cumplir:
O1 + O2 +... + O k = n
Lo que queremos es comparar las frecuencias observadas con las frecuencias esperadas
(tericas), a las que denotaremos por E1, E2,..., Ek. Se cumplir:
E1 + E2 +... + E k = n
Frecuencia Observada Frecuencia Observada
Clase 1 O1 E1
Clase 2 O2 E2
Clase K Ok Ek
Total n n
145
Ejemplo
El director de Movil, tiene la responsabilidad de controlar el nivel de existencias para
cuatro tipos de automvil vendidos por la firma. En el pasado, ha ordenado nuevos
automviles bajo la premisa de que los cuatro tipos son igualmente populares y la demanda
de cada tipo es la misma. Sin embargo, recientemente las existencias se han vuelto ms
difciles de controlar, y el director considera que debera probar su hiptesis respecto a una
demanda uniforme.
Solucin
1. Planteamiento de hiptesis
H0: La demanda es uniforme para los cuatro tipos de autos.
H1: La demanda no es uniforme para los cuatro tipos de autos.
2. Nivel de significancia:
=0.05
3. Estadstico de prueba
( )2
2 = =1 ;
.; = .
7. Conclusin:
La demanda no es uniforma para los 4 tipos de autos.
146
2. Prueba de Independencia, La prueba de independencia Chi-cuadrado, nos permite
determinar si existe una relacin entre dos factores analizadas en un estudio. Para saber si
dos factores muestran algn grado de dependencia se construyen tablas de doble entrada
(filas y columnas) .Es necesario resaltar que esta prueba nos indica si existe o no una
relacin entre las variables, pero no indica el grado o el tipo de relacin; es decir, no indica
el porcentaje de influencia de una variable sobre la otra o la variable que causa la
influencia.
1 1,1 1,2 1, .
1 2,1 2,2 2, .
. .
. .
1 ,1 ,2 , .
Total n.j .1 .2 . ..
. = . =
=1 =1
= =1 . = =1 . = =1
Ejemplo 1
Alicia Garca es la directora de investigacin de Plaguicidas de un importante Laboratorio
en la ciudad de Chiclayo. En su proyecto actual Alicia debe determinar si existe alguna
relacin entre la clasificacin de efectividad que los consumidores asignan a un nuevo
insecticida y el sitio (urbano o rural) en el cual se utiliza. De los 100 consumidores a
quienes se le aplic la encuesta, 75 vivan en zonas urbanas y 25 en zonas rurales. La Tabla
2. Resume las clasificaciones hechas por los consumidores. (Use =0.10)
147
Tabla 2.
Clasificacin segn el uso de Plaguicidas
Debajo del 15 6 21
promedio
Total 75 25 100
Solucin
1. Planteamiento de hiptesis
H0: La clasificacin y la ubicacin son independientes.
H1: La clasificacin y la ubicacin No son independientes.
2. Nivel de significancia:
=0.10
3. Estadstico de prueba
( )2
2 = =1 ;
.; = .
148
Clculo de las frecuencias esperadas:
1. .1 (75)(31)
11 = = = 23.25
. . (100)
1. .2 (25)(31)
11 = = = 7.75
. . (100)
2. .1 (75)(48)
11 = = = 36
. . (100)
2. .2 (25)(48)
11 = = = 12
. . (100)
3. .1 (75)(21)
11 = = = 15.75
. . (100)
3. .2 (25)(21)
11 = = = 5.25
. . (100)
Estadstico de prueba:
= 3.76
6. Decisin
Como 2 < 2 , entonces No se rechaza la Ho
7. Conclusin
No existen suficientes evidencias estadsticas con un nivel de significacin =0,05 para
afirmar que la clasificacin de la efectividad y la ubicacin donde se utiliza sean
independientes.
149
Ejemplo 2
Un investigador quiere estudiar si hay asociacin entre la prctica deportiva y la sensacin
de bienestar. Extrae una muestra aleatoria de 100 sujetos. Los datos aparecen a
continuacin.
Solucin
1. Planteamiento de hiptesis
H0: La prctica deportiva y la sensacin de bienestar son independientes.
H1: La prctica deportiva y la sensacin de bienestar No son independientes.
2. Nivel de significancia:
=0.10
3. Estadstico de prueba
( )2
2 = =1 ;
.; = ,
Grados de libertad=(r-1)(c-1)=(2-1)(2-1)=1
Al 0.05 de significancia =6,63
150
5. Calculamos el estadstico de prueba
Estadstico de prueba:
= 8.13
6. Decisin
Como 2 < 2 , entonces se rechaza la Ho
7. Conclusin
Existen suficientes evidencias estadsticas con un nivel de significacin =0,05 para
afirmar que la prctica deportiva y la sensacin de bienestar estn asociadas.
151
3. Prueba de Homogeneidad
De varias muestras cualitativas, consiste en comprobar si varias muestras de un carcter
cualitativo proceden de la misma poblacin. Es necesario que las dos variables medibles
estn representadas mediante categoras con las cuales construiremos una tabla de
contingencia.
Solucin
1. Planteamiento de hiptesis
H0: La opinin sobre el producto X es semejante en los tres distritos.
H1: La opinin sobre el producto X No es semejante en los tres distritos
2. Nivel de significancia:
=0.05
3. Estadstico de prueba
( )2
2 = =1 ;
.; = ,
Grados de libertad=(r-1)(c-1)=(3-1)(3-1)=4
Al 0.05 de significancia =9,488
152
4. Regin de aceptacin y rechazo
>
>
Estadstico de prueba:
= 78,42099
6. Decisin
Como 2 > 2 , entonces se rechaza la Ho
7. Conclusin
Existen suficientes evidencias estadsticas con un nivel de significacin =0,05 que la
aceptacin del producto X no es semejante en los distritos de La Victoria, Jos Leonardo
Ortiz y Chiclayo.
153
PROBLEMAS PROPUESTOS
Si 72 68 140
No 48 12 60
Total 120 80 200
A un nivel de significancia de =0.1 pruebe si existe relacin entre las variables analizadas.
2. Se selecciona al azar 236 trabajadores y se les clasifica de acuerdo con sus hbitos
de beber licor, obtenindose los siguientes resultados.
Hbito de licor Rendimiento laboral
Alto Medio Bajo
Bebedor en exceso 28 31 14
Bebedor 29 16 12
promedio
Poco bebedor 17 9 23
No bebedor 27 19 11
Pruebe la hiptesis de independencia de los factores, es decir que el rendimiento laboral de
un trabajador es independiente del hbito que tiene de beber licor, para una significancia
=0.05.
3. En un grupo de enfermos que se quejaban que no podan dormir se les dio somnferos y
placebos. Los datos se muestran en la tabla adjunta.
Duermen bien Duermen mal
Somnferos 58 20
Placebos. 94 48
Es lo mismo tomar somnfero o placebos para dormir bien o mal en este grupo de
enfermos. Pruebe a un nivel de significancia del 5%
154
Lugar de Grado de perjuicio Total
residencia Alto Bajo
AA.HH 32 28 60
Urbanizaciones 225 290 515
Residenciales 50 79 129
Total 307 397 704
A un nivel de significacin del 5% pruebe si las variables perjuicio tnico y Lugar de
residencia son independientes.
10. En una muestra aleatoria de 100 ciudadanos del distrito de Lambayeque, se les
clasific por su ocupacin: obrero, estudiante, profesional, y se les consult si estn a favor
o en contra de la integracin de un organismo de justicia, propuesto por el congreso. los
datos se muestran a continuacin.
Obrero estudiante profesional
A favor 23 29 27
156
En contra 25 39 35
Proponga y pruebe una hiptesis para demostrar, con el 5% de significancia, que la opinin
de los ciudadanos es independiente de su ocupacin.
CAPTULO XII
REGRESIN Y
CORRELACIN LINEAL
157
Regresin y correlacin lineal simple
En muchas ocasiones surge la necesidad de estudiar la relacin que existe entre dos
variables cuantitativas que tienen distribucin aproximadamente normal. Por ejemplo,
promedio ponderado semestral y nmero de horas de estudio en una muestra de estudiantes
universitario del I Ciclo de estudios. Antes de establecer un modelo que relacione a ambas
variables, es necesario averiguar si estas dos variables esta correlacionadas entre s; es decir
realizar una anlisis de correlacin.
12.1. Anlisis de correlacin de dos variables cuantitativas
El coeficiente de correlacin poblacional entre dos variables aleatorias x e y, se estima
con r.
n Yt X t Yt X t
r
n Yt 2 Yt n X t2 X t
2 2
Las sumatorias en la frmula anterior se realizan sobre las n observaciones, tomadas como
muestra.
158
1. Planteamiento de la hiptesis
H0: xy = 0 (las variables no estn correlacionadas)
( 2)
=
1 2
4. Regin de rechazo
Tomar una muestra de n observaciones en las que se consideran dos variables, una variable
x independiente, considerada libre de error es decir una variable fijada de antemano y una
variable y, variable dependiente, considerada variable aleatoria, o sea una de las posibles
respuestas de la variable y a la variable x. Se tienen entonces un conjunto de n pares de la
forma (x,y)
159
a) Realizar un diagrama de dispersin de las variables (x,y) en un sistema de
coordenadas cartesianas, ya visto anteriormente y calcula el coeficiente de correlacin.
b) En base a la informacin anterior y si se considera apropiado un modelo de recta,
encontrar la ecuacin de la recta que mejor ajuste (o represente) a todos los puntos del
diagrama. A travs de esta ecuacin es posible predecir el valor de y para un determinado
valor de x.
c) La ecuacin de la recta es la siguiente:
y 0 1 xi i
y 0 1 x1
n xi y i xi y i
0 y 1 x 1
n xi xi
2 2
Dnde:
y : media aritmtica de las y
x : media aritmtica de las x
160
Si existe una relacin lineal entre la variable Y y la variable X, el coeficiente de regresin
de la ecuacin y 0 1 x1 , debe ser diferente de cero, es decir debemos realizarse la
siguiente prueba de hiptesis:
2. Nivel de significancia
= 0.05
3. Prueba estadstica
t
S
2
S 2
(X t X )2
e 2
t
(Yt 0 1 X t ) 2
2 i 1
n2 n2
Intervalo de confianza para el coeficiente de regresin:
1 t1-n2 [ EE ( 1 )]
2
n 2
Donde t1- es el percentil apropiado de la distribucin t con (n-2) grados de libertad.
2
161
independiente. El coeficiente de determinacin expresa la variabilidad explicada por el
modelo de regresin. A partir de l podeos calcular el coeficiente de alineacin. Este
coeficiente expresa la proporcin de la variabilidad de la variable dependiente no explicada
por el modelo y viene dado por la siguiente expresin: [1 R2 ]
Ejemplo
Se conduce un experimento en 12 sujetos para analizar si la dosis de cierta droga (en ml)
est relacionada con el tiempo de reaccin a un estmulo en segundos.
Droga (ml) 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5
Tiempo (segs) 1,0 0,8 1,8 1,4 2,1 1,8 2,2 3,0 2,75 3,0 4,1 4,9
3
Tiempo de reaccin (seg)
0 R = 0.8824
0 1 2 3 4 5 6 7
n Yt X t Yt X t
r
nY t
2 2
Yt n X t2 X t
2
162
12 130.9 28.85 45
= = 0.939
(12 85.7125)2 (12 204.5 452 )
Se puede concluir de existe una alta correlacin positiva entre el tiempo de reaccin y dosis
de la droga.
4. Regin de rechazo
RR RA RR
-t t
-2.2281 +2.2281 (este valor se ha obtenido de la tabla T de Student
con 10 grados de libertad y con 0.025 de
probabilidad)
5. Decisin: Como el t calculado es mayor que el punto crtico 2.2281, se rechaza Ho
6. Conclusin: Si existe correlacin entre el tiempo de reaccin y dosis de la droga,
con un nivel de significancia de 0.05.
Como se observa que si existe una alta correlacin lineal directa entre las variables de
estudio, el siguiente paso es determinar un modelo que los relacione a ambas variables.
Anlisis de Regresin.
Estimacin de la recta de regresin: y 0 1 x1
Se debe obtener los valores de a y b, mediante las siguientes relaciones:
163
n xi y i xi y i
1 0 y 1 x
n xi xi
2 2
1 = 12(130.9)45(28.85)
2 = 0.63531469
12(204.5)45
y 0.023 0.64 x1
Significancia estadstica del coeficiente de regresin
Antes veamos algunos clculos auxiliares
Y 2
( )
1 0,657 0,117649 7,5625
0,8 0,97465 0,03050262 5,0625
1,8 1,2923 0,25775929 3,0625
1,4 1,60995 0,044079 1,5625
2,1 1,9276 0,02972176 0,5625
1,8 2,24525 0,19824756 0,0625
2,2 2,5629 0,13169641 0,0625
3 2,88055 0,0142683 0,5625
2,75 3,1982 0,20088324 1,5625
3 3,51585 0,26610122 3,0625
4,1 3,8335 0,07102225 5,0625
4,9 4,15115 0,56077632 7,5625
suma 1,92270699 35,75
164
1. Planteamiento de las hiptesis
H 0 : 1 0
H 1 : 1 0
2. Nivel de significancia
= 0.05
3. Prueba estadstica
t
S
0.63531469
= = 8.663
0.07333622
Donde, un estimador para Var ( ) es:
2 0.1922707
S 2 = = 0.0053782
(X t X ) 2 35.75
0.07333622
S
e 2
t
(Y X t ) 2
2 i 1
t
1,92270699/(12-2) = 0.1922707
n2 n2 =
4. Regin de rechazo
RR RA RR
-t t
-2.2281 +2.2281 (este valor se ha obtenido de la tabla T de Student
con 10 grados de libertad y con 0.025 de
probabilidad)
Como existe una relacin lineal entre las variables de estudio, se podra predecir el tiempo
165
de reaccin al estmulo que tendra un sujeto si la dosis fuera de 7 ml
y 0.023 0.64(7) = 4,46893941
0.63531469 2.2281x0.07333622
LI : 0.4719
LS : .0.7987
Como el intervalo de confianza no contiene a la unidad, el coeficiente de regresin es
diferente de cero, por lo que se concluye que el tiempo de reaccin al estmulo y la dosis de
droga estn linealmente relacionas y esta relacin es directa, con un nivel de confianza del
95%
El coeficiente de determinacin es (0.939)2 = 0.882, es decir el porcentaje de variaciones
observadas en el tiempo de reaccin al estmulo que es explicado por las variaciones de la
dosis de la droga es del 87.1%. El porcentaje de variacin del tiempo de reaccin al
estmulo que no es explicado por la dosis de la droga es del 0.118 [1 R2 ]
A continuacin se presenta los clculos realizados con el MegaStat
ANOVA
table
Source SS df MS F p-value
Regression 14,4296 1 14,4296 75,05 5,82E-06
Residual 1,9227 10 0,1923
Total 16,3523 11
166
de mayor utilidad prctica, que es la regresin lineal mltiple. Por regresin lineal mltiple
entenderemos el anlisis de regresin lineal pero ahora con ms de una variable explicativa.
yi 0 1 xi1 2 xi 2 p xip i
para i= 1, 2, ...,n
y 0 1 x1 2 x2 p x p
Si suponemos que la respuesta media est relacionada con los parmetros a travs de la
ecuacin: y 0 1 x1 2 x 2 p x p , esto quiere decir que podemos estimar la
media de la variable respuesta a travs de la estimacin de los parmetros de regresin. Si
esta ecuacin se ajusta a la realidad entonces tenemos una forma de describir cmo la
media de la variable respuesta y vara con las variables explicatorias x1 , x 2 , , x p .
167
b) Estimacin de los parmetros de regresin mltiple.
y y i .
2
observada y la respuesta estimada, lo que equivale a minimizar: i
s 2
2 e
2
i
y i y i
2
n p 1
n p 1
y x
variabilidad: s y2 x
s y2 / x es entonces el estimador de la variabilidad de la respuesta y, tomando en cuenta las
variables explicatorias xj.
168
y yi
2
2 i
Lo distinguimos de s que es la variabilidad de y sin tomar en cuenta las
n 1
y
Notas:
- Vamos a dejar a SPSS el clculo del error estndar de b j
- Tendremos entonces un test de hiptesis asociado a cada variable explicatoria en el
modelo.
- Podemos realizar hiptesis de una cola, donde H1: j 0 o H1: j 0 , pero lo
usual es hacer el test bilateral.
j
d) Intervalo de confianza para :
Un intervalo de confianza ( 1 )*100% para j est dado por:
bj t (n p 1) EE (b j )
1
2
EE (b j ) es el error estndar de b j
169
e) Intervalos de confianza para la respuesta media e intervalos de prediccin
individual:
La tabla ANOVA es similar a la de regresin simple. Los grados de libertad del modelo son
ahora p en vez de 1, lo que refleja que ahora tenemos p variables explicatorias en vez de
slo una. Las sumas de cuadrados representan las fuentes de variacin. Recordemos que la
suma de cuadrados total es igual a la suma de los cuadrados del modelo de regresin ms la
suma de los cuadrados del residuo:
SCT = SCMod + SCRes
170
H 0 : 1 2 p 0
H 1 : al menos un j no es cero
La hiptesis nula dice que ninguna de las variables explicatorias son predictoras de la
variable respuesta. La hiptesis alternativa dice que al menos una de las variables
explicatorias est linealmente relacionada con la respuesta. Como en regresin simple,
valores grandes de F nos dan evidencia en contra de hiptesis nula. Cuando H0 es
verdadera, el estadstico F tiene distribucin F de Fisher con (p, n-p-1) grados de libertad.
Los grados de libertad estn asociados a los grados de libertad del modelo y del residuo en
la tabla ANOVA.
Recordemos que en regresin lineal simple el test F de la tabla ANOVA es equivalente al test t
bilateral para la hiptesis de que la pendiente es cero. Ahora, el test F de regresin mltiple
docima la hiptesis de que todos los coeficientes de regresin (con excepcin del intercepto)
son cero, hiptesis que no es de mucho inters. En el problema de regresin mltiple interesan
ms las hiptesis individuales para cada parmetro asociado a cada variable explicatoria.
R
2 SCMod
( y y ) 2
y y
2
SCTotal i
Ejemplo
Los datos provienen de un estudio de consumo de helado que abarc las primaveras y
veranos de tres aos. El consumo de helados de midi en pintas per cpita por semana, el
precio del helado en dlares, el ingreso familiar de los consumidores en dlares por
semana y la temperatura en grados Fahrenheit.
Consumo: Y 0.386 0.374 0.393 0.425 0.406 0.344 0.327 0.288 0.269 0.256
Precio: X1 1.35 1.41 1.39 1.40 1.36 1.31 1.38 1.34 1.33 1.39
Ingreso:X2 351 356 365 360 342 351 369 356 342 356
171
Temperatura:X3 41 56 63 68 69 65 61 47 32 24
Resumen
Tabla 1
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,818538824
Coeficiente de determinacin R^2 0,670005806
R^2 ajustado 0,505008709
Error tpico 0,04207347
Observaciones 10
172
Tabla 2: anlisis de varianza para el contraste global de los coeficientes
Suma de Promedio de Valor crtico
Grados de libertad cuadrados los cuadrados F de F
Regresin 3 0,021564539 0,00718818 4,06071269 0,068130513
Residuos 6 0,010621061 0,001770177
Total 9 0,0321856
173
Correlaciones entre variables
Tabla 4
Correlaciones entre variables
Consumo Precio Ingreso Temperatura
Correlacin de 1 ,338 ,116 ,592
Pearson
Consumo
Sig. (bilateral) ,340 ,749 ,072
N 10 10 10 10
Correlacin de ,338 1 ,567 ,180
Pearson
Precio
Sig. (bilateral) ,340 ,087 ,619
N 10 10 10 10
Correlacin de ,116 ,567 1 ,585
Pearson
Ingreso
Sig. (bilateral) ,749 ,087 ,076
N 10 10 10 10
Correlacin de ,592 ,180 ,585 1
Pearson
Temperatura
Sig. (bilateral) ,072 ,619 ,076
N 10 10 10 10
174
De la tabla 1 se puede observar una alta correlacin entre las variables (dependiente e
independientes: 0.82). El 67% de la variacin de la variable dependiente es explicado
por las variables independientes.
Con respecto al contraste global:
H 0 : 1 2 p 0
H 1 : al menos un j no es cero
De la tabla 2 se puede observar el valor crtico F mayor que 0.05, por lo que se acepta
Ho, es decir no existe una relacin lineal entre el consumo, precio, ingreso y
temperatura.
Con respecto a los contrastes individuales
175
PROBLEMAS PROPUESTOS
176
4. Una empresa de mecnica industrial, tiene informacin de 10 meses, y quiere
determinar si existe alguna relacin entre el gasto mensual en miles de dlares y el
nmero de piezas fabricadas. Y: Gasto mensual y X: nmero de piezas fabricadas. Los
datos se presentan a continuacin:
Y 191 170 272 155 280 173 234 116 153 178
X 40 42 53 35 56 39 48 30 37 40
8. Un investigador cree que la inteligencia de los nios, medida a travs del coeficiente
intelectual (CI en puntos), depende del nmero de hermanos. Toma una muestra
aleatoria de 15 nios y ajusta una regresin lineal simple. Los resultados aparecen en la
salida adjunta.
CI 110 115 120 118 110 108 105 104 98 99 98 100 90 93 90
Hermanos 0 1 1 1 2 2 2 3 3 4 4 5 5 5 6
177