Вы находитесь на странице: 1из 122

UNIVERSIDAD CENTROAMERICANA

FACULTAD DE CIENCIA, TECNOLOGA Y AMBIENTE


DEPERTAMENTO DE CIENCIAS BSICAS

ASIGNATURA

ESTADSTICA

INGENIERA EN SISTEMAS Y TECNOLOGA DE LA INFORMACIN

Recopilado por Clara Pastora Tllez

Septiembre, 2015

ndice de contenido
Objetivos
.
Introduccin ..
1. Unidad I: Estadstica Descriptiva
...
Ramas de la estadstica..
Conceptos
.
Escalas de medicin
Actividad de Autoaprendizaje N 1
.
Organizacin de datos
Representacin Grfica ..
Actividad de Autoaprendizaje N 2
Medidas de posicin central ..
Media
Mediana..
Moda .
Medidas de posicin no central.
Cuartiles y Percentiles ..
Medidas de variacin ..
Varianza, Desviacin estndar ..
Coeficiente de variacin..
Actividad de Autoaprendizaje N 3
2. Unidad II: Probabilidades
..
Enfoques de probabilidad y Conceptos .
Reglas de Probabilidad
..
Actividad de Autoaprendizaje N 4 .
Teorema de Bayes

Actividad de Auto aprendizaje N 5


3. Unidad III: Distribuciones de Probabilidad y Pruebas Estadsticas
Distribucin de probabilidad .
Actividad de Autoaprendizaje N 6 ..
Distribucin Binomial ..
Actividad de Autoaprendizaje N 7
Distribucin de Poisson.
Actividad de Autoaprendizaje N 8
Distribucin Normal ..
Actividad de Autoaprendizaje N 9
Distribucin muestral para la media
Teorema de Limite Central

Actividad de Autoaprendizaje N 10 ..
Estimacin por intervalo y tamao de muestra .
Actividad de Autoaprendizaje N 11 ..
Prueba de Hiptesis .
Actividad de Autoaprendizaje N 12 ..
Prueba de independencia...
Actividad de Autoaprendizaje N 13 ..

4
4
4
6
7
9
11
13
17
19
21
21
23
25
25
26
26
27
27
30
31
31
33
37
43
45
47
47
49
50
52
53
55
56
62
63
65
66
67
73
76
86
87
89

4. Unidad IV: Regresin y Correlacin Lineal Simple


Diagrama de Dispersin.
Regresin Lineal .
Estimacin de la ecuacin. ...........................................
Error estndar de estimacin .
Coeficiente de Correlacin y Determinacin ..
Intervalo de Confianza de la media

Inferencia acerca de los parmetros


Actividad de Autoaprendizaje N 14
Guas de Laboratorio ..
Introduccin resultados de la encuesta .
Procesamiento de datos ..
Procesamiento de variables cuantitativas
Recodificacin de variables .
Procesamiento de variables con opcin mltiple .
Ejercicio de aplicacin
Inferencia estadstica ....
Regresin y Correlacin Lineal Simple ..
Referencias .

91
91
92
92
94
95
95
96
97
99
102
105
107
108
112
113
114
117
122

Objetivos
1. Apropiarse de la terminologa usada en el rea estadstica, con el fin de impulsar la
adquisicin de cultura estadstica por parte de los estudiantes.
2. Identificar maneras adecuadas para la presentacin de informacin y adquirir las
destrezas para construir tablas y grficos estadsticos.
3. Se pretende lograr un aprendizaje significativo con la construccin de objetos de
aprendizaje en cada una de las unidades, adems, del apoyo de herramientas de software
estadstico.
4. Se espera que el curso sea ameno y provechoso para todos (as), logrando potenciar al
estudiante en la aplicacin de la estadstica y fortaleciendo adems, otros valores como: la
honestidad, solidaridad y el trabajo en grupo.
Introduccin
El presente material de estudio no pretende sustituir a ningn texto de Estadstica, por el
contrario es un esfuerzo que trata de resumir los temas que se requieren para cursar la
asignatura; los estudiante que deseen profundizar en el contenido del programa, deben realizar
las consultas necesarias para completar el conocimiento de esta disciplina.
El material cuenta con cuatro unidades donde se presenta una introduccin, el desarrollo
terico, ejercicios resueltos paso a paso, ejercicios propuestos y un formulario creado para
cada unidad. La temtica se resume en: Estadstica descriptiva, Probabilidades, Distribuciones
de Probabilidad y Prueba estadsticas y Regresin y Correlacin Lineal Simple.

UNIDAD I

ESTADSTICA DESCRIPTIVA

En esta Unidad se har un pequeo recorrido por la historia de la estadstica, mencionando


algunos de los personajes que la impulsaron, recalcando sus progresos y aportes a travs del
tiempo.
El uso de herramientas cuantitativas para el tratamiento de datos, tiene origen en
pocas remotas. Se tiene informacin de hace ms de 3000 aos antes de Cristo, donde
las antiguas civilizaciones, como la Egipcia, aplicaron continuamente censos que ayudaban a
la organizacin del estado y la construccin de las pirmides.
El antiguo testamento nos sugiere que Moiss orden un Censo a la poblacin Israelita
para identificar los miembros de las familias. En la antigua Grecia y el Imperio Romano,
era comn la aplicacin de censos para la planificacin de impuestos y la prestacin del
servicio militar.
La primera persona que introdujo el trmino estadstica en Inglaterra fue Sir John
Sinclair (1754-1835) con su trabajo Statistical Account of Scotland (1791-1799)
compilado en 21 volmenes. El autor explica en su libro, que la palabra estadstica la
adopt gracias al estudio de investigaciones realizadas en Alemania, como una palabra
novedosa que llamara la atencin de los ingleses.
A comienzos del siglo XIX, la palabra estadstica adopta un significado ms generalizado
hacia la recoleccin y clasificacin de cualquier tipo de datos cuantitativos.
Herman Hollerith (1860-1929) fue un estadstico estadounidense que desarroll
la primera mquina tabuladora basada en tarjetas perforadas y mecanismos elctricomecnicos para el tratamiento rpido de millones de datos. Su mquina fue usada en el
censo de 1890 en Estados Unidos que redujo la tabulacin de los datos de 7 aos (censo

de 1880) a 2,5 aos. Cre la firma Computing Tabulating Recording Corporation (CTR),
que bajo la presidencia de Thomas J. Watson fue renombrada a International Business

Machines (IBM) en 1924.


1. Definicin
1.1 Estadstica es una disciplina que apoya el proceso de toma de decisiones en diversas
reas del conocimiento, adems, de entregar pautas para la presentacin adecuada de
informacin.
1.2 Estadstica es la ciencia que utilizando las matemticas y de modo particular el c lc ul o
pa ra estud i a r l a s l eye s d e c om po rta m iento d e a quel l os fenm e nos qu e no
esta nd o sometidos a leyes rgidas dependen del azar y basndose en ella, se predicen resultados.
1.3 El famoso diccionario Ingls Word Reference define la estadstica como un rea de la
matemtica aplicada orientada a la recoleccin e interpretacin de datos cuantitativos
y al uso de la teora de la probabilidad para calcular los parmetros de una poblacin.
2. Estudio de la Estadstica
Existen dos razones por las cuales el campo de accin de la estadstica y la necesidad de un
estudio han crecido enormemente en las ltimas dcadas. Una razn es que el enfoque cada
vez ms cuantitativo que se emplea en todas las ciencias, as como en las empresas y en
otras actividades que afectan nuestras vidas. Esto incluye el uso de tcnicas matemticas
para la evaluacin de controles contra la contaminacin, la planeacin de inventarios, el
estudio de la nutricin, la longevidad, la evaluacin de tcnicas de enseanza, etc.
La otra razn es que la cantidad de informacin estadstica que se recolecta, procesa y
disemina al pblico, por un motivo o por otro ha crecido casi ms all de nuestro
entendimiento, y algo que todo mundo se pregunta es qu parte de ella es estadstica
pura y qu parte es impura.
3. Aplicaciones
3.1 Una compaa que fabrica equipos electrnicos complejos produce algunos equipos que
funcionan adecuadamente, pero tambin algunos que, por razones desconocidas, no
funcionan adecuadamente. a que se debe que algunos sean buenos y otros no?
3.2 El departamento de control de calidad de una compaa se encarga de vigilar la
produccin en forma continua, aplicando muestreo y otras tcnicas estadsticas
comunes.
3.3 El contralor y el departamento de contabilidad de una empresa se encargan de la
exactitud en los clculos financieros. Ya que resulta fsicamente imposible verificar cada
documento y determinar su exactitud, se realiza un muestreo de las facturas y se toman
decisiones en base a los resultados de la muestra.
3.4 El departamento de mercadotecnia de una empresa realizar pruebas con los
consumidores y proyectan las ganancias con base en los resultados de la muestra.
3.5 Los analistas de investigacin evalan muchos aspectos de una accin o valor antes de
hacer una recomendacin de compra o venta. Recopilan los datos de ventas anteriores de
la empresa y estiman las ganancias futuras.
3.6 El gobierno realiza un gran nmero de encuestas para determinar la condicin actual de
la economa y la prediccin de las tendencias econmicas futuras. Se elaboran ndices,

3.7

como el ndice de precios al consumidor con el objeto de evaluar la tendencia


inflacionaria.
Los consumidores utilizan los precios unitarios para decidir la cantidad o calidad del
producto a comprar.

3.8

Los resultados de sondeos de opinin pblica se presentan en los medios de comunicacin.


Estos abarcan muchos temas, como evaluacin del desempeo de las alcaldas, ministerios,
asamblea nacional, incluso al presidente, el impacto de las medidas econmicas, etc.

3.9

Dificultades que encuentran los estudiantes al momento de realizar lectura de textos, su


nivel de comprensin, etc.

4. Ramas de la estadstica
Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es la
Descriptiva. Esta parte se dedica nica y exclusivamente al ordenamiento y tratamiento de
la informacin para su presentacin por medio de tablas y de representaciones grficas,
as como de la obtencin de algunos parmetros tiles para la explicacin de la informacin
(la media y la desviacin estndar). Es un primer acercamiento a la informacin.

Estadstica Descriptiva
4.1

La estadstica descriptiva es una ciencia que analiza series de datos (por


ejemplo, edad de una poblacin, altura de los estudiantes de una escuela,
temperatura en los meses de verano, etc.) y trata de extraer conclusiones
sobre el comportamiento de estas variables.

La investigacin cuya finalidad es: el anlisis o experimentacin de situaciones para el


descubrimiento de nuevos hechos, la revisin o establecimiento de teoras y las aplicaciones
prcticas de las mismas, se basa en los principios de Observacin y Razonamiento y
necesita en su carcter cientfico, el anlisis tcnico de datos para obtener de ellos
informacin confiable y oportuna. Este anlisis de datos requiere de la Estadstica como
una de sus principales herramientas, por lo que los investigadores de profesin y las
personas que de una y otra forma la realizan.
Cuando se realiza un estudio de investigacin, se pretende generalmente inferir o
generalizar resultados de una muestra a una poblacin. Se estudia en particular a un
reducido nmero de individuos a los que tenemos acceso con la idea de poder generalizar
los hallazgos a la poblacin de la cual esa muestra procede. Este proceso de inferencia se
efecta por medio de mtodos estadsticos basados en la probabilidad.

Estadstica Inferencial
4.2

Basndose en los resultados obtenidos de una muestra induce o estima las


leyes reales del comportamiento de la poblacin de la que proviene dicha
muestra.

5. Conceptos bsicos

Poblacin

Son todos y cada uno de los elementos que se quieren analizar. Puede ser finita o infinita
(en realidad las poblaciones infinitas no existen, pero cuando se trata de un nmero
grande se supone como si lo fuera).
Ej. 1

Poblacin (se simboliza por N)


1.1
Estudiantes de Ingeniera en Sistema de Nicaragua.
1.2
Trabajadores de una compaa industrial.
1.3
Produccin textil en una zona franca.
1.4
Clientes de un banco.

Muestra

Es un subconjunto de la poblacin o parte de la poblacin que se observa.


(Caracterstica de una poblacin es la propiedad que se estudia.
Ej. 2

Muestra (su smbolo es n)


Si se estudia el precio de la vivienda de una ciudad, lo normal ser no recoger
informacin sobre todas las viviendas de la ciudad (sera una labor muy compleja),
sino que se suele seleccionar un subgrupo (muestra) que se entienda que es
suficientemente representativo.

2.1

Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos
sealar:
1. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.
2. Como consecuencia del punto anterior ahorraremos costos.
3. Estudiar la totalidad de las personas con una caracterstica determinada en muchas
ocasiones puede ser una tarea inaccesible o imposible de realizar.
4. Aumentar la calidad del estudio. Al disponer de ms tiempo y recursos, las observaciones y
mediciones realizadas a un reducido nmero de individuos pueden ser ms exactas y
plurales que si las tuvisemos que realizar a una poblacin.
5. La seleccin de muestras especficas nos permitir reducir la heterogeneidad de una
poblacin al indicar los criterios de inclusin y/o exclusin.

Parmetro
Caracterstica numrica de una poblacin.

Estadstico
Caracterstica numrica de una muestra.

Variable
Es una forma de expresar una caracterstica de un grupo de elementos de
estudio, como el peso de una persona, su estatura, el color de sus ojos,una
poblacin o de una muestra.
Ej. 3

Poblacin: Estudiantes de la UCA.


Variable: Edad, valor que puede asumir: 17, 18, 19, (La caracterstica se designa con
letras maysculas X, Y, Z,)

Las variables pueden ser de dos tipos:


1. Variables cualitativas o atributos: no se pueden medir numricamente (por ejemplo:
nacionalidad, color de la piel, sexo).
2. Variables cuantitativas o numricas: tienen valor numrico (edad, precio de un producto,
ingresos anuales).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
2.1
Discretas: Slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo, nmero
de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podr ser 3,45).
2.2
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la
velocidad de un vehculo puede ser 80,3 km/h, 94,57 km/h, etc.

Categrica
Variable
Numrica

Continua
Discreta

Ej. 4

Clasifique cada una de las siguientes variables en categrica o numricas (discreta o


continua).
1

Variable
Nacionalidad

Resistencia a la tensin

Salario mensual (C$)

N de artculos defectuosos

Temperatura (F)

Tipo de variable

Las variables tambin se pueden clasificar en:


1. Variables unidimensionales: slo recogen informacin sobre una caracterstica (por
ejemplo: edad de los alumnos de una clase).
2. Variables bidimensionales: recogen informacin sobre dos caractersticas de la poblacin
(por ejemplo: edad y altura de los alumnos de una clase).

3. Variables pluridimensionales: recogen informacin sobre tres o ms caractersticas (por

ejemplo: edad, altura y peso de los alumnos de una clase).

Cuando se estudia el comportamiento de una variable hay que distinguir el siguiente concepto:

Individuo

Cualquier elemento que porte informacin sobre el fenmeno que se estudia. As, si
estudiamos la altura de los nios de una clase, cada alumno es un individuo; si estudiamos
el precio de la vivienda, cada vivienda es un individuo.
6. Etapas del anlisis estadstico
R ec ogi d a d e d a tos.
Ordenacin de los mismos en tablas.
Resumen de la informacin recogida a travs de las medidas (Descriptiva).
Analizar los datos provenientes de una muestra para sacar conclusiones sobre la poblacin
de la que proviene la muestra (Inferencial).
7. Niveles o Escalas de medicin
Medir en el campo de las ciencias exactas es comparar una magnitud con otra, tomada de
manera arbitraria como referencia, denominada patrn y expresar cuntas veces la
contiene. En el campo de las ciencias sociales medir es el proceso de vincular conceptos
abstractos con indicadores empricos. Al resultado de medir lo se le llama medida. La
medicin de las variables puede realizarse por medio de cuatro escalas de medicin: la
nominal, ordinal, de intervalo y de razn. Se utilizan para ayudar en la clasificacin de las
variables, el diseo de las preguntas para medir variables, e incluso indican el tipo de
anlisis estadstico apropiado para el tratamiento de los datos. Una caracterstica esencial
de la medicin es la dependencia que tiene de la posibilidad de variacin. La validez y la
confiabilidad de la medicin de una variable depende de las decisiones que se tomen para
operarla y lograr una adecuada comprensin del concepto evitando imprecisiones y
ambigedades, en caso contrario, la variable corre el riesgo inherente de ser invalidada
debido a que no produce informacin confiable.
7.1 Escala nominal

En este nivel de medicin se establecen categoras distintivas que no implican un orden


especfico. Por ejemplo, si la unidad de anlisis es un grupo de personas, para clasificarlas
se puede establecer la categora sexo con dos niveles, masculino (M) y femenino (F), los
encuestados slo tienen que sealar su gnero, no se requiere de un orden real. As, se
pueden asignar nmeros a estas categoras para su identificacin: 1=M, 2=F o bien, se
pueden invertir los nmeros sin que afecte la medicin: 1=F y 2=M. En resumen en la escala
nominal se asignan nmeros a eventos con el propsito de identificarlos. Otros ejemplos:
religin, color de ojos, etc.
7.2 Escala ordinal

Se establecen categoras con dos o ms niveles que implican un orden inherente entre s.
La escala de medicin ordinal es cuantitativa porque permite ordenar a los eventos en
funcin de la mayor o menor posesin de un atributo o caracterstica. Por ejemplo, en las

instituciones escolares de nivel bsico suelen formar por estatura a los estudiantes, se
desarrolla un orden cuantitativo pero no suministra medidas de los sujetos. Estas escalas
admiten la asignacin de nmeros en funcin de un orden prescrito. Las formas ms
comunes de variables ordinales son tems (reactivos) actitudinales estableciendo una serie
de niveles que expresan una actitud de acuerdo o desacuerdo con respecto a algn
referente. Por ejemplo, ante el reactivo: ENACAL debe privatizarse, el respondiente
puede marcar su respuesta de acuerdo a las siguientes alternativas:
Totalmente de acuerdo
En desacuerdo
De acuerdo
Totalmente en desacuerdo
Indiferente
Las anteriores alternativas de respuesta pueden codificarse con nmeros que van del uno al
cinco que sugieren un orden preestablecido pero no implican una distancia entre un nmero
y otro.
7.3

Escala de intervalos
La medicin de intervalo posee las caractersticas de la medicin nominal y ordinal.
Establece la distancia entre una medida y otra. La escala de intervalo se aplica a variables
continuas pero carece de un punto cero absoluto. El ejemplo ms representativo de este
tipo de medicin es un termmetro, cuando registra cero grados centgrados de
temperatura indica el nivel de congelacin del agua y cuando registra 100 grados
centgrados indica el nivel de ebullicin, el punto cero es arbitrario no real, lo que significa
que en este punto no hay ausencia de temperatura.

7.4 Escala de Razn (Cociente)

Una escala de medicin de razn incluye las caractersticas de los tres anteriores niveles
de medicin (nominal, ordinal e intervalo). Determina la distancia exacta entre los
intervalos de una categora. Adicionalmente tiene un punto cero absoluto, es decir, en el
punto cero no existe la caracterstica o atributo que se mide. Las variables de ingreso,
edad, peso, estatura, nmero de hijos, etc. son ejemplos de este tipo de escala. El nivel de
medicin de razn se aplica tanto a variables continuas como discretas.
Ej. 5

Clasifique c/u de las siguientes variables en categricas o numricas, si es numrica


Determine si es discreta o continua. Adems proporcione el nivel de medicin.
Variable
Nmero de mensajes de correo
electrnico enviados por un
planificador
Costo de los libros de texto
usado por un estudiante
Edad
Marca de computadora personal
Nivel acadmico

Tipo de variable

Nivel de medicin

10

ACTIVIDAD DE AUTOAPRENDIZAJE N 1
1.

Origen y Evolucin de la Estadstica.

11

Escriba un ensayo que trate del origen y evolucin de la estadstica.

2. Describa con sus palabras cada uno de los siguientes trminos, proporcionando adems tres
ejemplos diferentes a los vistos en clase.
2.1
2.2

Variable

2.3

Estadstico

Poblacin

2.4
2.5

Muestra
Atributo

2.6
2.7

Dato
Parmetro

3. Ilustracin
Un estudiante de estadstica desea tener una idea acerca del valor (en unidades
monetarias) del automvil tpico que poseen los profesores de su universidad. Para esto se
aplica cada uno de los trminos bsicos que se han definido.
3.1
3.2

La poblacin es el conjunto de todos los vehculos de los profesores de la


universidad.

Una muestra es una porcin o parte de una poblacin. Por ejemplo el nmero de
automviles cuyos propietarios son los profesores del departamento de matemticas,
es una muestra.

3.3

La variable es el valor real de cada automvil.

3.4

Un dato es el valor de un vehculo en particular. Por ejemplo, el auto del profesor


Miranda esta valuado en 12 mil dlares.

3.5
3.6
3.7

Los datos son el conjunto de valores que corresponden a la muestra obtenida (8, 10,
12, miles de $)
El parmetro acerca del cual se busca informacin es el valor promedio en la
poblacin.
El estadstico que se encontrar es el valor promedio de la muestra

4. Un fabricante de equipos electrnicos desea conocer la proporcin de artculos


defectuosos. Se realiza un estudio en 5000 artculos y se encontr que 8% estn
defectuosos. Suponiendo que esos 5000 artculos son representativas para el fabricante,
conteste las siguientes preguntas.
4.1 Cul es la poblacin?
4.2 Cul es la muestra?
4.3 Identifique el parmetro de inters.
4.4 Identifique el estadstico e indique cuales su valor.
4.5 Se conoce el valor del parmetro.
5.

Encuentre un artculo o un anuncio de peridico, que ejemplifique el empleo de la


estadstica.
5.1
Describa e identifique la poblacin de inters.
5.2
Describa e identifique una variable.
5.3
Determine e identifique un estadstico.

6.

Usted estudia los movimientos de precios de un grupo selecto de acciones enlistadas


en la Bolsa de Valores de Nicaragua. Consult un diario local del da 12 de julio del
2012 y encontr.
Movimiento accionario
Aumentaron
Disminuyeron
Sin cambio
Total
6.1
6.2
6.3

Nmero
69
32
11

Se consideran las 112 acciones una muestra o una poblacin? Explique.


Cul es el nivel de medicin? Explique.
Son las categoras mutuamente excluyentes? Explique.

7.

Si dos estudiantes obtienen una calificacin de 90 en el mismo examen, qu


argumentos podran usar para demostrar que la variable calificacin en la prueba, es
continua?

8.

Indique si cada una de las siguientes variables es categrica o numrica. Si es


numrica determine si es discreta o continua. Adems proporcione el nivel de medicin.
N

8.1
8.2

Variable

Cotizacin de una accin en el


mercado de valores
Cociente de inteligencia.

8.4

Tipos de accidentes que ocurren en


una fbrica
Temperatura

8.5

Estado civil

8.6

Precio de un producto

8.7

Factura mensual en electricidad

8.3

8.8
8.9
8.10
8.11

Categoras de los profesores


Universitarios
Nmero de pginas escritas en cada
trabajo
Tiempo que se necesita para auditar
una cuenta en una empresa
Especialidad acadmica

8.13

Nmero de crditos registrados en


el II cuatrimestre
Formas de pago en una compaa

8.14

Color del telfono usado

8.12

8.15
8.16
8.17

Cantidad de dinero gastado en ropa


el mes pasado
Tipo principal de transaccin usada
al comprar la ropa
Nmero de seales de trnsito en
poblados con menos de 50000
habitantes

Tipo de variable

Nivel de medicin

12

8.19

Tiempo que se necesita para


contestar una llamada telefnica en
una oficina de informacin
Lugar de residencia

8.20

N de bits transmitidos.

8.21

Satisfaccin de un producto.

8.18

8.22
8.23
9.

Tiempo de reparacin de un
componente electrnico.
Capacidad de almacenamiento de un
disco duro.

En una facultad universitaria se ha repartido un cuestionario entre los estudiantes


para averiguar el grado de satisfaccin en diversas actividades y servicios. Por ejemplo,
por lo que se refiere al mtodo de matrcula para las clases del III cuatrimestre, se pide
a los estudiantes que pongan una cruz en una de las casillas siguientes:
Muy satisfecho
Moderadamente insatisfecho
Moderadamente satisfecho
Muy insatisfecho
Neutral
Es la respuesta de un estudiante a esta pregunta, numrica o categrica? Si es numrica,
es discreta o continua? Adems indique el nivel de medicin.

10. El gerente de una compaa ha formulado una serie de preguntas al responsable del

Departamento de Informtica acerca de los trabajadores. Identifique el tipo de


dato que se pide en cada pregunta.
10.1
Cuntos trabajadores tiene el Departamento de Informtica?
10.2
Nivel acadmico (secundaria, universitaria, tcnico, otros).
10.3
Cuntas veces al mes ha habido reclamo en el salario de los empleados?
10.4
Nmero de trabajadores ausentes al mes.
10.5
Salario de los trabajadores.

11. Suponga que el gerente de la divisin de servicios al cliente de Xenith est interesado

principalmente en determinar si los clientes que han comprado una computadora durante
los ltimos 12 meses quedaron satisfechos con el producto. Usando las tarjetas de garanta
entregadas despus de la compra, el gerente planea encuestar a 1425 de estos clientes.
11.1
Describa tanto la poblacin como la muestra de inters para el gerente.
11.2
Describa el tipo de dato que el gerente desea recolectar principalmente.
11.3
Desarrolle un primer borrador del cuestionario escribiendo una serie de siete
11.4
preguntas categricas y cinco numricas que piensa serian apropiadas para esta
encuesta.

8. Organizacin de datos
Muchas veces uno se pregunta, para qu sirven las encuestas que a veces se hacen en la
calle?, Cmo saber si una estacin de radio se escucha ms que otra? , Cul candidato
puede ganar? La respuesta se comienza con la recaudacin de datos. Los datos son
informacin que se recoge, esto puede ser opinin de las personas sobre un tema, edad o
sexo de encuestados, dnde viven, cuntas personas viven en una casa, qu tipo de sangre
tiene un grupo de personas, etc. Hay datos que pueden ser de mucha utilidad a diferentes

13

profesionales en la toma de decisiones, para resolver problemas o para mostrar resultados


de investigaciones. Una vez que se haya recogido toda la informacin, se procede a crear
una base de datos, donde se registran todos los datos obtenidos. Algunas veces, si los
datos son muy complicados, se codifican, esto quiere decir que se le coloca una palabra
clave que identifica un ttulo muy largo. Cuando ya est elaborada la base de datos se
parece a una tabla. Es importante recordar que nunca se colocan las tablas y las grficas
juntos, porque en realidad dicen lo mismo, corrientemente se utiliza o una tabla y su
anlisis, o una grfica y su anlisis. Por ejemplo, supngase que se ha preguntado a un
conjunto de n personas: qu opinin tienen acerca de la instalacin de playas en la Ciudad
de Rivas o que ha hecho el Gobierno a partir del 2010? Las n respuestas se encuentran en
una escala que va de 1 a 5, donde 1 representa un total desacuerdo con la medida mientras
que 5 quiere significar un acuerdo total.
Una manera de obtener datos es a travs de la observacin directa. Un experimento
estadstico es una forma de observacin directa en la que se controlan algunos o todos los
factores que pueden influir en la variable que se estudia.

Distribucin de frecuencia
Es la representacin estructurada, en forma de tabla, de toda la informacin
que se ha recogido sobre la variable que se estudia.

Variable
(Valor)
X1

Frecuencias absolutas
Simple (f)
Acumulada (fa)

Xn-1

f1
f2
...
fn-1

f1 + f2
...
f1 + f2 +..+ fn-1

Xn

fn

fa = n

X2

...

f1

Frecuencias relativas
Simple (fr)
Acumulada (fra)

fr1 = f1 / n
fr2 = f2 / n
...
frn-1 = fn-1 / n
frn = fn / n

fr1
fr1 + fr2
...
fr1 + fr2 +..+frn-1
fra = 1

Siendo X los distintos valores que puede tomar la variable.


Siendo f el nmero de veces que se repite cada valor.
Siendo fr el porcentaje que la repeticin de cada valor supone sobre el total

Frecuencia absoluta es el nmero de veces que se repite un determinado valor.


Frecuencia relativa es el cociente entre la frecuencia absoluta y el nmero total de
observaciones, por tanto la frecuencia relativa est siempre entre cero y uno.

Frecuencia absoluta acumulada es decir se suman las frecuencias anteriores a un


valor dado, por tanto la acumulada al final coincide con el tamao de la muestra o la
poblacin (n N).

Frecuencia relativa acumulada se suman las frecuencias relativas anteriores a un


valor dado, al final la suma es 1.

14

Ej. 6

Se utiliza un contador Geiger electrnico para contar el nmero de emisiones


radiactivas en un periodo de 10 segundos, obteniendo las cuentas siguientes: 8, 12, 13,
15, 8, 12, 15, 23, 16, 12, 13, 16, 30, 23, 15. Presente esta informacin en una
distribucin de frecuencias (Comente los resultados)

Emisiones
radiactivas.
8
12
13
15
16
23
30

N de emisiones
(f)
2
3
2
3
2
2
1

(fa)
2
5
7
10
12
14
15

% de emisiones
(fr)
0,1333
0,2000
0,1333
0,2000
0,1333
0,1333
0,0666

(fra)
0,1333
0,3333
0,4666
0,6666
0,8000
0,9333
1,0000

Tabla de frecuencias
Una distribucin de frecuencias es una tabla en la que se organizan los datos en
clases, es decir, en grupos de valores que describen una caracterstica de los datos
y muestra el nmero de observaciones del conjunto de datos que caen en cada una
de las clases.
1. Distribucin de frecuencias agrupadas
1.1 La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si la
variable toman un nmero grande de valores o la variable es continua.
1.2 Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases.
A cada clase se le asigna su frecuencia correspondiente.
1.3
1.4

Rango, es la diferencia entre el lmite superior y el inferior. (R = XM - Xm)


Intervalo de clase, conocido tambin como Amplitud o Ancho de clase,

Si se decide que el ancho de cada clase sea uniforme, deber calcularse por medio de
la expresin,
c

1.5

(Mx. valor observado M n. valor observado)


1 3,322logn

Marca de clase: La marca de clase es el punto medio de cada intervalo y es el


valor que representa a todo el intervalo para el clculo de algunos parmetros.

1.6

Lmites de clase: Cada clase est delimitada por el lmite inferior de la clase y el
lmite superior de la clase.

LS Li c u

En todos los casos debe comprobarse que la diferencia entre el lmite superior e
inferior de cada clase sea igual al ancho de la clase menos una unidad de variacin.

15

2. Pasos para la elaboracin de tablas de distribucin de frecuencias.


2.1 Recopilacin de datos.
2.2 Clasificacin de los datos de menor a mayor (optativo).
2.3 Clculo del ancho de la clase.
2.4 Identificacin de los lmites de clase.
2.5 Conteo de los datos.
Ej. 7

16

Treinta solicitantes interesados en trabajar para un programa de asistencia social,


rindieron un examen diseado para medir su aptitud para el trabajo social. Los
resultados fueron los siguientes:
79
81
73

97
91
78

86
86
98

76
87
88

93
71
96

87
94
72

98
77
79

78
92
97

84
76
83

88
85
79

73
83
92

76
84
93

76
85
94

77
86
96

78
86
97

78
87
97

79
87
98

79
88
98

Clasificacin ordenada.
71
79
88

72
81
91

Calculo del ancho de clase.


c

(Mx. valor observado M n. valor observado)


1 3,322logn

Calificacin
70
75
80
85
90
95

74
79
84
89
94
99

N de
solicitantes (f)
3
8
3
7
4
5

(98 71)
1 3,322log30

(fa)
3
11
14
21
25
30

4,57085061 6 5

% de solicitantes
(fr)
0,1000
0,2666
0,1000
0,2333
0,1333
0,1666

(fra)
0,1000
0,3666
0,4666
0,7000
0,8333
1,0000

Marca
de clase
72
77
82
87
92
97

Limites reales
69,5
74,5
79,5
84,5
89,5
94,5

Con los resultados obtenidos en la tabla, responda las siguientes preguntas:


7.1

Cuntos solicitantes obtuvieron calificacin entre 84,5 y 89,5?

7.2

Qu porcentaje de solicitantes obtuvo a lo sumo 89,5 como calificacin?

7.3

Cuntos solicitantes obtuvieron cuando mucho 94,5 puntos?

74,5
79,5
84,5
89,5
94,5
99,5

7.4

Cunto es la calificacin media representativa ubicada entre 74,5 y 79,5?

17
7.5

Cunto es la calificacin mxima del 83,33% de los solicitantes?

7.6

Qu porcentaje de solicitantes obtuvieron calificacin entre 94,5 y 99,5?

Si los datos se agrupan en categoras numricas, la tabla resultante se denomina distribucin


categrica o cualitativa. Este tipo de distribucin se ilustra por medio de la tabla siguiente
que pertenece a los planes de estudios superiores de un grupo de 548 estudiantes del ltimo
ao de secundaria.
Ej: 8
Planes de estudio superior
Planea ir a la universidad.
Quiz vaya a la universidad.
Planea ir o quiz vaya a una escuela tcnica.
No ir a ninguna universidad.

N de estudiantes del ltimo ao de


secundaria
240
146
57
105
Total 548

9. Representacin grfica
Una grfica es la representacin de datos, generalmente numricos, mediante lneas,
superficies o smbolos, para ver la relacin que esos datos guardan entre s. Sirven para
analizar el comportamiento de un proceso, o un conjunto de elementos o signos que
permiten la interpretacin de un fenmeno.
9.1

Histograma

Los histogramas no muestran frecuencias acumuladas, son preferibles para el tratamiento


de datos cuantitativos y la barra con mayor altura representa la mayor frecuencia. La
sumatoria de las alturas de las columnas equivale al 100% de los datos.
Es una representacin grfica de una
variable en forma de barras, donde la
superficie de cada barra es
proporcional a la frecuencia de los
valores representados. En el eje
vertical se representan las f. y en el
eje horizontal los valores de las
variables (lmites reales de clase).

9.2

Polgono de frecuencias
Es un grfico de lneas que se usa
para presentar las frecuencias
absolutas de los valores de una
distribucin en el cual la altura del
punto medio asociado a un valor de
la variable es proporcional a la
frecuencia de dicho valor.

9.3

Ojiva

La diferencia fundamental entre las ojivas y los polgonos de frecuencias es que en el eje
horizontal (x) en lugar de colocar las marcas de clase se colocan las fronteras de clase.
Para el caso de la ojiva mayor que es la frontera menor y para la ojiva menor que, la
mayor.
Una grfica similar al polgono de
frecuencias es la ojiva, pero sta se
obtiene al aplicar parcialmente la
misma tcnica a una distribucin
acumulativa y de igual manera que
stas, existen las ojivas mayores que
y las ojivas menores que.

9.4

Grficas de barras

Se emplea cuando la variable independiente es categrica.


Cada barra slida, ya sea vertical u
horizontal representa un tipo de dato.
Cuando es necesario representar
divisiones de datos se utiliza un grfica
de barras subdivididas.

18

9.5

Grfica de lneas

Son ideales para representar tendencias de ventas, importaciones y otra serie de valores
durante un cierto perodo.

Esta ilustra mediante segmento


de lneas los cambios en
cantidades con respecto al
tiempo.

9.6

Grfica circular

Los grficos circulares,


denominados tambin grficos de
pastel, se utilizan para mostrar
porcentajes y proporciones.

ACTIVIDAD DE AUTOAPRENDIZAJE N 2
1.

Los siguientes datos representan el tiempo (en horas) que dedican 50 estudiantes de una
universidad a actividades de horas libres, durante una semana comn de asistencia a clase.
23
16
29
16
30
1.1
1.2
1.3
1.4

17
21
38
24
15

22
28
17
12
20

16
18
19
07
19

22
15
23
18
14

20
28
18
22
24

18
20
20
17
34

12
29
25
27
23

24
14
32
24
18

21
25
19
29
13

Clasifique la variable involucrada.


Desarrolle la clasificacin ordenada.
Organice los datos en una tabla de distribucin de frecuencia.
Presente estos datos mediante: Un Histograma.
Un Polgono de frecuencia.
Una Ojiva y una Ojiva porcentual.

Los tiempos de reparacin (medidos en horas) de 40 instrumentos electrnicos se


muestran enseguida:
21
12
08
10

15
18
17
22

25
19
13
12

13
16
23
24

12
16
18
19

11
20
15
09

14
12
12
15

24
10
16
23

09
11
13
18

20
24
18
15

19

2.1
2.2
2.3
2.4

Clasifique la variable involucrada.


Desarrolle la clasificacin ordenada.
Organice los datos en una tabla de distribucin de frecuencia.
Presente estos datos mediante: Un Histograma.
Un Polgono de frecuencia.
Una Ojiva y una Ojiva porcentual.

3. La prueba KSW de aptitud en ciencias de la computacin fue aplicada a 50 estudiantes,


obteniendo la siguiente distribucin de frecuencia de sus calificaciones o puntajes.
Puntaje de la
prueba KSW
1 - 4
5 - 8
9 - 12
13 - 16
17 - 20
Total
3.1
3.2
3.3
3.4
3.5

N de
estudiantes
4
8
10
20
8

Complete la tabla. Cul es el ancho de cada clase?


Cuntos estudiantes obtuvieron entre 12,5 y 16,5 puntos en la prueba KSW?
Que % de estudiantes obtuvieron entre 4,5 y 8,5 puntos en la prueba?
Cul es la puntuacin mxima del 84% de los estudiantes?
Que % de estudiantes obtuvo cuando mucho 12,5 puntos?

4. Los siguientes datos representan las acciones de mercado (en porcentaje) propiedad de un
fabricante de software de aplicaciones de negocios de Windows durante el ao 2014.
Fabricante
Aldus
Lotus
Microsoft
Software Publishing
Otros
4.1
4.2

5.

Acciones del mercado (%)


5,5
15,3
60,0
12,7
6,5

Construya una grfica de barras y uno de pastel.


Escriba un informe describiendo los datos anteriores y ofrezca sugerencias
sobre como Lotus podra incrementar su posicin de acciones del mercado.

La conservacin ambiental es un asunto


nacional de principal importancia. Los
siguientes datos representan las acciones de
mercado (en porcentaje) propiedad de
fabricantes de telfonos celulares porttiles,
transportables y mviles vendidos en el ao
2014. Presente los datos mediante una grfica
de barras.

Fabricante
Motorola
Sony Ericsson
Nokia
Samsung
Otros

Acciones del mercado (%)


16
20
18
25
21

20

6. Los pases industrializados tiraron 227,1 millones de


toneladas de basura en un ao reciente. Por lo
general el desecho de basura se hace mediante
rellenos sanitarios (87%), incineracin (7%) y
reciclamiento (5%). Suponga que la compaa
consultora donde Ud. trabaja proporciona la siguiente
tabla que muestra el desglose de porcentajes de las
fuentes de desecho: Construya la grfica apropiada
para representar estos datos.

Fuente
Papel
Basura de jardn
Desechos slidos
Vidrio
Metales
Plstico
Madera
Otros

%
20
10
26
6
9
10
5
14

10. Medidas de posicin central


Las medidas de posicin nos facilitan informacin sobre la serie de datos que estamos
analizando. Estas medidas permiten conocer diversas caractersticas de esta serie de
datos.
Las medidas de posicin son de dos tipos:
Medidas de posicin central: informan sobre los valores medios de la serie de datos.

Medidas de posicin no centrales: informan de como se distribuye el resto de los


valores de la serie.

Las principales medidas de posicin central son las siguientes:

Media ( x ): Es el valor medio ponderado de la serie de datos. Se pueden calcular


diversos tipos de media, siendo las ms utilizadas.
Media aritmtica: La suma de todos los datos se divide por el total de datos de la
muestra.

Su frmula es:

Ej: 9

La gerente de una tienda de equipos electrnicos, desea estudiar el trnsito en su


tienda, descubre que 295, 300, 520, 350, 400, 520, 495, 680, 520, 700 personas
entraron a la tienda durante los pasados diez das. Determine el nmero medio de
personas que entraron a la tienda durante esos das.

x
n

295 300 ... 520 700


478
10

En conjunto, el nmero de personas que entraron al almacn durante los


pasados 10 das es 478, ste es el nmero medio (o promedio) de personas que
visitaron la tienda por da.

Con su calculadora cientfica verifique esta respuesta.

(Entre a MODE , SD , digite los datos 295 M+ , 300 M+, 700


M+ , luego SHIFT 2 , 1 , = y obtendr el resultado)

21

Media geomtrica: Algunas veces manejamos cantidades que cambian a lo largo de un


periodo, entonces se necesita conocer una tasa promedio de cambio. En tal caso la
media aritmtica no es apropiada, porque no proporciona la respuesta correcta.

Usos principales de la media geomtrica.


Para pronosticar porcentajes, ndices y cifras relativas.
MG n x1 x 2 ...x n
Ej: 10 Una fbrica de telas ha elevado el costo del algodn en un periodo que abarca los
ltimos 5 aos en los siguientes porcentajes. Cul es el aumento porcentual
promedio del costo del algodn en ese periodo?

2010
6%

2011
8%

2012
10,5%

2013
12,3%

2014
13,1%

MG 5 (6)(8)(10,5)(12,3)(13,1) 5 81209,52 9,592269869 9,59%

Es decir el incremento porcentual promedio del costo del algodn fue de 9,59%
aproximadamente, durante ese periodo.

Para determinar el incremento porcentual promedio de ventas, exportaciones,


produccin u otras actividades econmicas o series econmicas de un periodo a otro.
MG n 1

Valor al fi nal del per odo


Valor al i ni ci o del per odo

Ej: 11 La produccin de una fbrica se increment de 25600 unidades en el 2003 a 132520 en


el 2014. Obtenga el incremento porcentual anual.
132520
MG 11
1 11 5,1765625 1 1,161215596 1 0,161215596 16,12%
25600

El incremento porcentual anual de la fbrica fue de 16,12% aproximadamente durante


ese periodo.

Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la media
geomtrica. Esta se suele utilizar en series de datos como tipos de inters anuales, inflacin,
etc., donde el valor de cada ao tiene un efecto multiplicativo sobre el de los aos anteriores.
En todo caso, la media aritmtica es la medida de posicin central ms utilizada. Lo ms
positivo de la media es que en su clculo se utilizan todos los valores de la serie, por lo que no
se pierde ninguna informacin. Sin embargo, presenta el problema de que su valor (tanto en el
caso de la media aritmtica como geomtrica) se puede ver muy influido por valores extremos,
que se aparten en exceso del resto de la serie. Estos valores anmalos podran condicionar en
gran medida el valor de la media, perdiendo sta representatividad.

22

Media ponderada: Nos permite obtener un promedio que tiene en cuenta la


importancia de cada valor para el total global. Se denota por,
xw

23

w x
w
i

Donde wi : es el peso asignado a cada observacin,


xi : es el valor de cada observacin.

Ej: 12

En una agencia de viajes se han vendido 200 pasajes a los precios siguientes:
Precio de venta (cientos de $)
Nmero de pasajes.

xw

w x
w

i i
i

xi
wi

12
60

14
100

16
40

60(12) 100(14) 40(16) 2760

13,8 cientos de $
60 100 40
200

El precio promedio de venta de los 200 pasajes es de $1380


Media armnica: De una serie de n nmeros x1, x2 , xn es la reciproca de la

media aritmtica de los datos, donde ninguno toma el valor cero. Este promedio se
utiliza para que los valores extremos no afecten al valor del promedio. Los valores
extremos s afectan cuando se usa el promedio aritmtico o el promedio geomtrico.
H

n
1

Ej: 13

Calcular el rendimiento promedio para el caso de tres automviles que recorrieron


500 kilmetros y cada auto tuvo el rendimiento siguiente:
Auto
Rendimiento (Km/galn)

n
1
x
i

A
50

B
62,4

C
77,6

3
3

61,33434215
1
1
1
0,048912238

50 62,4 77,6

El resultado muestra que el rendimiento promedio de los autos es de 61,3 Km/galn.


Mediana (Me); Es el valor de la serie de datos que se sita justamente en el centro

de la muestra (un 50% de valores son inferiores y otro 50% son superiores).
No presentan el problema de estar influida por los valores extremos, pero en cambio no
utiliza en su clculo toda la informacin de la serie de datos (no pondera cada valor por
el nmero de veces que se ha repetido).
Para su clculo los datos deben estar ordenados.

Posicin: M e X n 1
2

Ej: 14 La gerente de una tienda de equipos electrnicos, desea estudiar el trnsito en su


tienda, descubre que 295, 300, 520, 350, 400, 520, 495, 680, 520, 700 personas
entraron a la tienda durante los pasados diez das. Determine el nmero mediano de
personas que entraron a la tienda durante esos das.

Ordenar datos,
X1
X2
295 300

X3
350

X4
400

X5
495

X6
520

X7
520

X8
520

X9
680

X10
700

n = 10 (par)
Posicin: M X
e
101 X 5, 5
2

Se ubica entre la posicin 5 y 6. M e X 5,5

495 520
507,5 508
2

El nmero mediano de personas que visitan la tienda es de 508.

En este ejemplo, la mediana se sita exactamente entre el quinto y sexto dato de este grupo,
ya que entre estos dos valores se encuentra la divisin entre el 50% inferior y el 50% superior.

Ej: 15 Los tiempos en minutos que necesitan varias empresas de seguro para revisar
solicitudes de servicios de cobertura mdica son: 230 50 180 63 120
Determine el tiempo mediano de servicio de cobertura de las empresas de seguro.

Ordenar datos,

X1
50

X2
63

X3
120

X4
180

X5
230

n = 5 (impar)
Posicin: M e X 51 X 3
2

Se ubica entre la posicin 3.

Me X 120 mi nutos
3

El tiempo mediano de servicio para revisar las solicitudes de seguro mdico es de


120 minutos.

24

Moda (M0 ): Es el valor que ms se repite en la muestra.


Ej: 16 La gerente de una tienda de equipos electrnicos, desea estudiar el trnsito en su
tienda, descubre que 295, 300, 520, 350, 400, 520, 495, 680, 520, 700 personas
entraron a la tienda durante los pasados diez das. Determine el nmero modal de
personas que entraron a la tienda durante esos das.
295, 300, 520, 350, 400, 520, 495, 680, 520, 700 Observamos que el valor 520 se
repite tres veces.

El nmero modal de personas que visitan la tienda es de 520.

11. Medidas de posicin no central


Las medidas de posicin no centrales permiten conocer otros puntos caractersticos de
la distribucin que no son los valores centrales. Entre otros indicadores, se suelen
utilizar una serie de valores que dividen la muestra en tramos iguales:

Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma


creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos
concentra el 25% de los resultados.
Se determinan mediante las posiciones:

Q1 : X n 1

Q3 : X 3( n 1)

Q2 : M e

Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o
decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los
resultados. Los deciles y percentiles se calculan de igual manera.
Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma
creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra
el 1% de los resultados. La posicin para determinar los percentiles es:

Pp : X

( n 1)

p
100

Ej: 17 Los siguientes datos se refieren a las ganancias por accin de 10 compaas de la
industria de las comunicaciones.
4,62

1,34

1,62

2,11

1,29

6,04

9,56

4,90

0,84

7,25

17.1 Cul es la ganancia mxima por accin del 25% de las compaas?

Ordenar los datos.


X1
0,84

X2
1,29

X3
1,34

X4
1,62

X5
2,11

X6
4,62

X7
4,90

X8
6,04

X9
7,25

X10
9,56

25

n = 10

26

Q1 : X 101 X 2,75

Posicin: Q1 : X n 1
4

Q1 1,29 0,75(1,34 1.29) 1,3275


Q1 1,33

Es decir el 25% de las compaas tienen como ganancia mxima 1,33 por accin.
17.2

Cul es la ganancia mxima por accin del 60% de las compaas?

Ordenar los datos,


X1
0,84

X2
1,29

X3
1,34

Posicin: Pp : X

( n 1)

X4
1,62
p
100

X5
2,11

X6
4,62

P60 : X

(101)

X7
4,90

60
100

X8
6,04

X9
7,25

X10
9,56

X 6, 6

P60 4,62 0,6(4,90 4,62) 4,788


P60 4,79

17.3

Lo que nos muestra es, el 60% de las compaas tienen como ganancia mxima
4,79 por accin.
Cul es la ganancia mxima por accin del 75% de las compaas?

17.4

Cul es la ganancia mxima por accin del 90% de las compaas?

12. Medidas de variacin o dispersin


Estudia la distribucin de los valores de la serie, analizando si estos se encuentran ms
o menos concentrados, o ms o menos dispersos. Existen diversas medidas de
dispersin, entre las ms utilizadas podemos destacar las siguientes:
Rango: Mide la amplitud de los valores de la muestra y se calcula por diferencia entre
el valor ms elevado y el valor ms bajo.
R Valor mxi mo observado Valor m ni mo observado

Varianza: Mide la distancia existente entre los valores de la serie y la media. Se


calcula como la sumatoria de las diferencias al cuadrado entre cada valor y la media,
dividida por el tamao de la muestra menos uno.
La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms
concentrados estn los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, ms dispersos estn.

s2

(x

x) 2

n 1

Desviacin estndar: Tambin llamada desviacin tpica, es una medida de dispersin


usada en estadstica que nos dice que tan dispersos se encuentran en promedio,
los datos con respecto a la media aritmtica o cunto tienden a alejarse los
valores del promedio en una distribucin. De hecho, el cuadrado de la desviacin
estndar es "el promedio del cuadrado de la distancia de cada punto respecto del
promedio". Se suele representar por una S (desviacin estndar muestral) o con la
letra sigma
(desviacin estndar poblacional). Esta medida es ms estable que el
recorrido y toma en consideracin el valor de cada dato. Para conocer con detalle un
conjunto de datos, no basta con conocer las medidas de tendencia central, sino que
necesitamos conocer tambin la desviacin que presentan los datos en su distribucin
respecto de la media aritmtica de dicha distribucin, con objeto de tener una visin
de los mismos ms acorde con la realidad al momento de describirlos e interpretarlos
para la toma de decisiones.

(x

x) 2

n 1

Interpretacin
La desviacin estndar es una medida del grado de dispersin de los datos con respecto
al valor promedio. Dicho de otra manera, la desviacin estndar es simplemente el
"promedio" o variacin esperada con respecto a la media aritmtica.
Por ejemplo, las tres muestras
0

Muestras
0

14

14

14

Cada una tiene una media de 7. Sus desviaciones estndar muestrales son 8,0829,
5,7735 y 1,1547 respectivamente. La tercera muestra tiene una desviacin mucho
menor que las otras dos porque sus valores estn ms cerca de 7.
Coeficiente de variacin: se calcula como el cociente entre la desviacin tpica
(estndar) y la media. El inters del coeficiente de variacin es que al ser un
porcentaje permite comparar el nivel de dispersin de dos muestras. Esto no ocurre
con la desviacin tpica, ya que viene expresada en las mismas unidas que los datos de
la serie.

27

Por ejemplo, para comparar el nivel de dispersin de una serie de datos, como la
altura de los alumnos de una clase y otra serie con el peso de dichos alumnos, no se
puede utilizar las desviaciones tpicas (una se expresa en cm y la otra en kg). En
cambio, sus coeficientes de variacin son ambos porcentajes, por lo que s se pueden
comparar.

s
CV (100%)
x
Coeficiente de asimetra: Karl Pearson desarroll una medida para calcular el sesgo de
una distribucin, llamado Coeficiente de Asimetra. El concepto de asimetra se
refiere, si la curva que forman los valores de la serie presenta la misma forma a la
izquierda y la derecha de un valor central (media aritmtica).

Para medir el nivel de asimetra se utiliza la frmula que viene definida por:

CA

3( x M e )
s

Caractersticas.
Vara de 3.0 a + 3.0
Un valor cero indica una distribucin simtrica.
Si el extremo largo de la distribucin esta a la derecha, se dice que tiene sesgo
positivo.
Si el extremo largo de la distribucin esta a la izquierda, el sesgo es negativo.
Ej: 18 Tomando el Ej. 9.
La gerente de una tienda de equipos electrnicos, desea estudiar el trnsito en su
tienda, descubre que 295, 300, 520, 350, 400, 520, 495, 680, 520, 700 personas
entraron a la tienda durante los pasados diez das.
18.1

Determine e interprete la desviacin estndar.

Para calcularla debemos conocer la media.

28

295 300 ... 520 700


478
10

(x x)

(x x)2

295

295 478 = -183

(-183)2 = 33489

300

300 478 = -178

(-178)2 = 31684

520

520 478 = 42

(42)2 = 1764

350

350 478 = -128

(-128)2 = 16384

400

400 478 = -78

(-78)2 = 6084

520

520 478 = 42

(42)2 = 1764

495

495 478 = 17

(17)2 = 289

680

680 478 = 202

(202)2 = 40804

520

520 478 = 42

(42)2 = 1764

700

700 478 = 222

(222)2 = 49284

Total

183310

Sustituimos en la frmula,
s

(x x)
i

n 1

183310
20367,77778 142,7157237 143
10 1

La cantidad promedio de personas que visitan la tienda es de 478, con una


dispersin de 143 personas aproximadamente, con respecto a la media.

Con su calculadora cientfica verifique esta respuesta.


(Entre a MODE , SD , digite los datos 295 M+ ,
300 M+, 700 M+ , luego SHIFT 2 , 3 , = y
obtendr el resultado)

18.2

Calcule e interprete el coeficiente de variacin.

Conocemos x 478

s 142,7157237

Sustituimos en la frmula.

s
142,7157237
CV (100%)
(100%) 0,298368459(100%) 29,86%
x
478

Es decir

29

18.3

Cul es el coeficiente de asimetra?


Sustituir en la frmula.

30

3( x M e ) 3(478 507,5)
CA

0,620113872 0,62
s
142,7157237

Este valor indica un grado menor de asimetra negativa, provocando que el nmero
promedio de personas que visitan la tienda sea menor que el nmero mediano.

ACTIVIDAD DE AUTOAPRENDIZAJE N 3
1.

Un experto en computadoras, tratando de optimizar la operacin de un sistema, reuni


datos sobre el tiempo, en minutos, entre la solicitud de servicio de un proceso especial.
2 800
4 900

5 913
3 420

3 750
9 530

5 520
8 735

5 000
8 900

4 500

4 900

5 010

7 012

5 400

1.1 Determine e interprete el tiempo medio, mediano y modal de este conjunto de

datos.

1.2 Calcule la desviacin estndar e interprete el resultado.


1.3 Determine el porcentaje de variacin de este conjunto de datos.
1.4 Calcule e interprete el coeficiente de asimetra.

1.5 Cul es el tiempo mximo del 70% de operaciones?


1.6 Cul es el tiempo mximo del 90% de operaciones?

2.

Un fabricante emplea a varios especialistas para hacer reparaciones de urgencia en horas.


Por lo general, los especialistas deben viajar distancias cortas. Se tomo una muestra de 8
comprobantes de gastos de viaje de los tcnicos, con el propsito de estimar los gastos que
debern hacerse el prximo ao por este concepto. La informacin resultante fue la
siguiente.
C$230 635
525
240
252
258
420
260
2.1
2.2
2.3
2.4

Determine el gasto medio y mediano de los tcnicos.


Qu caractersticas en este conjunto de datos es la responsable de la diferencia
sustancial entre estas dos medidas (media y mediana)?
Determine la varianza y la desviacin estndar.
Cul es el porcentaje de variacin de estos datos?

3. Se toma una muestra de seis resistores y se mide su resistencia (en ohm). Los resultados son
los siguientes:

3.1

45

38

47

41

35

43

Calcule:
La varianza y la desviacin estndar muestral.

3.2

Reste 35 a cada una de las mediciones de resistencia originales y calcule s


Compare sus resultados con los obtenidos en el inciso (a).

y s.

3.3

Reste 30 de cada valor y luego multiplique las diferencias por 10. Ahora calcule s

para

el nuevo conjunto de datos. Qu relacin existe entre esta s


originales? Explique.

y la de los datos

4. Considere el siguiente par de muestras.

4.1
4.2
4.3

Muestra 1:

10

10

Muestra 2:

10

10

10

Calcule el rango de ambas muestras. Es posible concluir que las dos muestras exhiben
la misma variabilidad?
Calcule la desviacin estndar de cada una de las muestras. Estas cantidades indican
que las dos muestras tienen la misma variabilidad?
Calcule el coeficiente de variacin de cada una de las muestra y diga cul de las
muestras presenta menor variabilidad relativa.

UNIDAD II

PROBABILIDADES

Introduccin
Para la mayora de las personas, probabilidad es un trmino vago utilizado en el lenguaje
cotidiano para indicar la posibilidad de la ocurrencia de un evento futuro. Esta interpretacin
prctica del trmino puede considerarse aceptable, pero se pretende lograr una comprensin
ms precisa del contexto de su aplicacin, como se mide y de que manera se utiliza la
probabilidad para hacer inferencias. El concepto de probabilidad es necesario cuando se opera
con procesos fsicos, biolgicos y sociales que generan observaciones que no es factible
predecir con exactitud. Adems, la probabilidad y la estadstica se relacionan en una forma
muy curiosa. En esencia la probabilidad es el vehculo que le permite al estadstico usar la
informacin contenida en una muestra para hacer inferencias o para describir la poblacin de
la cual se ha obtenido la muestra.
1.

Enfoques de Probabilidad

Probabilidad clsica a priori


En este caso la probabilidad de xito se basa en el conocimiento anterior al
involucrado.
Probabi li dad de xi to

Ej: 1.
2.

N de resultados favorables
N total de resultados

La probabilidad de sacar una carta con figura negra de una baraja.


La probabilidad que la suma de las caras de dos dados sea siete.

31

Probabilidad clsica emprica


Aunque la probabilidad se sigue definiendo como la proporcin entre el nmero de
resultados favorables y el nmero total de resultados, estos resultados se basan
en datos observados, no en el conocimiento anterior a un proceso.
Ej: 1. La probabilidad que un estudiante tenga un promedio inferior a 80 puntos.
2. La probabilidad que un individuo seleccionado aleatoriamente de una encuesta sobre la
satisfaccin de los empleados, este satisfecho con su trabajo.

Probabilidad subjetiva
Se refiere a la probabilidad de ocurrencia asignada a un evento por un individuo
particular.
Ej: 1. La probabilidad que tenga xito un nuevo producto en el mercado.
2. La probabilidad que un conservador gane la prxima eleccin presidencial.

La asignacin de probabilidades a diversos eventos suele estar basada en la

experiencia previa, opinin personal y el anlisis de una situacin en particular. La


probabilidad subjetiva es de uso especial en la toma de decisiones en situaciones en las
cuales no se puede hacer determinaciones empricas de la probabilidad de diferentes
eventos.

2. Conceptos bsicos de probabilida


Experimento
Es un proceso por medio del cual se obtiene una observacin (o una medicin). Su
smbolo es E .
Ej: 2.1

E1 : Registrar la capacidad productiva de un obrero textil.


E 2 : Entrevistar a un votante para que nos diga su preferencia antes de una
eleccin.

E 3 : Registrar la puntuacin obtenida en una prueba de Estadstica.


Espacio muestra o muestral
Es la coleccin de todos los eventos posibles. Su smbolo es

S.

Ej: 2.2 Con referencia a E1 : Suponga que la capacidad productiva del obrero se

encuentra entre 50 y 60 unidades diarias inclusive. Entonces S 50, 51, ...., 60

Evento (o Suceso)
Un evento simple es el que se puede describir con una caracterstica.
Se simboliza por A, B, C...
Ej: 2.3 Para E 2 existen 3 eventos simples.

A : Votante simpatizante PLC


C : Votante simpatizante FSLN

B : Votante simpatizante PLI

32

El complemento de un evento
evento A . Su smbolo es A .

A , incluye todos los eventos que no son parte del


33

Un evento conjunto es un evento que tiene dos o ms caractersticas.


Ej: 2.4 Para

E3

podemos determinar eventos conjuntos como,

F y S : Estudiante mujer y con alta puntuacin.


M y B : Estudiante varn y con baja calificacin.
3. Axiomas de Probabilidad
Suponga que un espacio muestral S , est asociado a un experimento. A cada evento A
definido en S A S , se le asigna un nmero P(A) , llamado probabilidad de A , de tal
manera que cumpla lo siguiente.
3.1
3.2
3.3

P( A) 0
0 P( A) 1
P( A) 1 P( A)

3.4
3.5

P( S ) 1
P( ) 0

3.1.1 Probabilidad Simple (o Marginal)


Significa la probabilidad de ocurrencia de un evento simple P(A).
Ej: 3.1 La probabilidad que un estudiante obtenga una puntuacin alta en la asignatura de
Estadstica.
3.2 La probabilidad que un votante sea simpatizante liberal.
3.3 Suponga que una encuesta a 200 trabajadores de una industria, se desarrolla usando
un paquete de computacin para hacer una clasificacin cruzada de los eventos de
inters: la satisfaccin en el trabajo y el progreso en la organizacin, de los cuales
166 trabajadores estn satisfechos en el trabajo, 116 han avanzado en la organizacin
y 96 participan en ambos eventos, los resultados son.
Satisfaccin
en el trabajo
Si [A]
No [A]
Total

Avance en la organizacin
Si [B]
No [B]
96
70
20
14
116
84

Presente estos datos en un diagrama de Venn.

B
A

70

96
20

A B 14

A B 186

Total
166
34
200

Definimos los sucesos involucrados.


A:
A :
B:
B :
3.3.1

Estar satisfecho en el trabajo.


No estar satisfecho en el trabajo.
Haber avanzado en la organizacin.
No haber avanzado en la organizacin.

Calcule la probabilidad que un empleado seleccionado aleatoriamente este


satisfecho con su trabajo.
N de empleados satisfecho s con su trabajo
P( A)
N total de empleados
P( A)

166
0,83
200

El resultado 0,83 nos indica la probabilidad que un empleado escogido al azar este
satisfecho con su trabajo.

3.3.2

Calcule la probabilidad que un empleado seleccionado al azar haya avanzado en la


organizacin.
N de empleados que han avanzado en la organizacin
P( B)
N total deempleado s
116
P( B)
0,58
200

..

4. Probabilidad Conjunta

Se refiere a fenmenos que contienen dos o ms eventos.


Ej: 4.1 Refirindose al ejemplo 3.3
4.1.1

Calcule la probabilidad que un empleado escogido al azar est satisfecho con su


trabajo y no haya avanzado en la organizacin.
N de empleados satisfecho s y no han avanzado en la organizacin
P( A y B )
N total de empleados
P( A y B)

4.1.2

Calcule la probabilidad que un empleado escogido al azar no est satisfecho con su


trabajo, ni haya progresado en la organizacin.
N de empleados no satifechos y no han avanzado en la organizacin
P( A y B )
N total deempleado s
P( A y B)

70
0,35
200

14
0,07
200

34

5. Regla de la Adicin

Ya se ha desarrollado una forma para encontrar la probabilidad del evento A y la


probabilidad del evento A y B ( A B) . Ahora examinaremos una regla para encontrar
la probabilidad del evento A o B

(A B) . Esta regla se llama unin, se refiere a la

ocurrencia, ya sea, del evento A, del evento B o de A y B. Se expresa,

P( A B) P( A o B) P( A) P( B) P( A B)
Y se le llama regla general de la adicin.
Ej: 5.1 Refirindonos al ejemplo 3.3
5.1.1 Calcule la probabilidad que un empleado seleccionado al azar este satisfecho
con su trabajo o no haya avanzado en la organizacin.
P( A B )

5.1.2

166
84
70
180

0,90
200 200 200 200

Calcule la probabilidad que un empleado escogido aleatoriamente no est satisfecho con


su trabajo o no haya avanzado en la organizacin.
P( A B)

34
84
14 104

0,52
200 200 200 200

Siempre que la probabilidad conjunta no tenga resultado, los eventos involucrados


se consideran mutuamente excluyentes (es decir, si ambos eventos no pueden
ocurrir al mismo tiempo), en tal caso la regla de la adicin se reduce a.

P( A B) P( A o B) P( A) P( B)
Ej: 5.2 Un estudio de 200 tiendas de abarrotes revel los siguientes ingresos, despus
del pago de impuestos.
Ingresos despus de los impuestos
Menos de 10 millones de C$
C$10 millones - C$20 millones
Mas de C$20 millones

Sucesos
A
B
C
Total

N de empresas
102
61
37

Cul es la probabilidad de que una tienda de abarrotes seleccionada al azar tenga un


ingreso entre 10 y 20 millones de C$ o un ingreso de ms de 20 millones de C$?
P( B C )

61
37
98

0,49
200 200 200

35

6. Probabilidad Condicional

La probabilidad condicional de un evento es la probabilidad del evento, dado el hecho de


que ya ocurrieron uno o ms eventos. Se denota de la siguiente manera:
P( A / B)

P( A B)
P( B)

P( B) 0

Ej: 6.1 Refirindonos al ejemplo 3.3


6.1.1 Suponga que un empleado ha progresado en la organizacin. Cul es la probabilidad
que est satisfecho con el trabajo?
A: Empleado satisfecho con su trabajo.
B: Empleado ha progresado en la organizacin.
P( A / B)

96
P( A B)
200 0,8276

116
P( B)
200

6.1.2

Si un empleado est satisfecho con su trabajo. Cul es la probabilidad que haya


avanzado en la organizacin?
P( B / A)

96
P( B A)
200 96 0,5783

166
P( A)
166
200

7. Independencia estadstica

El conocimiento previo de un evento no afecta la probabilidad de otro evento. Esta


caracterstica se llama independencia estadstica.
P( A / B) P( A)

Ej: 7.1 Refirindonos al ejemplo 3.3


7.1.1
El evento estar satisfecho en el trabajo es independiente si el trabajador ha
progresado en la organizacin?
A:
Empleado satisfecho con su trabajo.
B:
Empleado ha progresado en la organizacin.
P( A / B)

P( A)

96

200 96 0,8276
116
116
200

166
0,83
200

Puesto que 0,8276

0,83, indica que estar satisfecho en el trabajo y haber


progresado en la organizacin no son estadsticamente independiente.

36

8. Regla de la Multiplicacin
La frmula para la probabilidad condicional se puede manejar algebraicamente, con lo que
la probabilidad conjunta (A y B) se puede determinar la probabilidad condicional de un
evento.
Se le llama regla general de la Multiplicacin.
P( A B) P( A) P( B / A)

Ej: 8

De 20 cuentas que se tienen en un archivo, 5 tienen error de procedimiento en la


elaboracin de los saldos. Si un auditor elige al azar 2 de las 20 cuentas. Cul es
la probabilidad de que ninguna de las cuentas contenga error de procedimiento?
C : Cuenta contiene error de procedimiento.
C : Cuenta no contiene error de procedimiento.
P(C1 C2 ) P(C1 ) P(C 2 / C1 )
15 14 210
P(C1 C 2 )
0,5526

20 19 380

Regla de la Multiplicacin para eventos independientes.

P( A B) P( A) P( B)

Por lo tanto hay dos formas de determinar la independencia estadstica.


Los eventos A y B son estadsticamente independientes si y slo si,
Los evento A y B son estadsticamente independientes si y slo si,

P( A / B) P( A)
P( A B) P( A) P( B)

ACTIVIDAD DE AUTOAPRENDIZAJE N 4
1.

Presente una descripcin del espacio muestral para cada uno de los experimentos aleatorios.
1.1 Cada una de tres piezas maquinadas se clasifica como arriba o abajo de las
especificaciones.
1.2 Cada uno de cuatro bits transmitidos se clasifica como error o sin error.
1.3 En la inspeccin final de fuentes de poder electrnicas podran ocurrir tres tipos de
disconformidades: funcionales, secundarias y de acabado. Las fuentes de poder
defectuosas se clasifican adems segn sea el tipo de disconformidad.
1.4 En la fabricacin de cinta para grabacin digital, cada una de 24 pistas se clasifica de
acuerdo a si contiene o no uno o ms bits con error.
1.5 En un proceso de fabricacin pueden producirse algunas piezas que no son aceptables.
Cada una de tres partes se clasifica como aceptable o no aceptable.
1.6 En el pedido de una computadora puede especificarse memoria de 4, 8 12 megabytes
y capacidad de almacenamiento de disco duro de 200, 300 400 megabytes.

37

2. El director general de una empresa expresar maana a los accionistas su consideracin


de que la compaa debe fusionarse con otra empresa. Ha recibido diez cartas acerca d
esa cuestin, y est interesado en el nmero de personas que estn de acuerdo con l.
2.1 Cul es el experimento?
2.2 Cules son algunos de los eventos posibles? Exprese dos posibles resultados.
3. Se ha desarrollado un nuevo juego de computadora. Su potencial de mercado lo van a
probar 80 jugadores veteranos de este equipo de diversin.
3.1
Cul es el experimento?
3.2
Cules son algunos de los eventos posibles? Exprese dos posibles resultados.
3.3
Suponga que 65 jugadores probaron el nuevo juego y afirmaron que les gust.
65 es una probabilidad?
4. Antes de efectuar una encuesta a nivel nacional se seleccionaron 50 personas para probar
el cuestionario. Una pregunta acerca de si debe o no legalizarse el aborto teraputico,
requiere una encuesta de s o no.
4.1 Cul es el experimento?
4.2 Cules son algunos de los eventos posibles? Exprese dos posibles resultados.
5. Una empresa adquiere una nueva mquina que debe instalarse y probarse antes de que
est lista para su uso. La empresa est segura de que no tardara ms de 7 das en
instalarla y probarla. Sea A el suceso se necesitaran ms de 4 das para que la mquina
est lista y B el suceso se necesitaran menos de 6 das para que la mquina est lista.
Describa lo siguiente:
5.1 El suceso que es el complemento del suceso A.
5.2 El suceso que es la interseccin de los sucesos A y B.
5.3 El suceso que es la unin de los sucesos A y B.
5.4 Son los sucesos A y B mutuamente excluyentes?
6. En el diagrama de Venn de la figura se muestran tres eventos. Copie la figura y sombree la
regin que corresponda a cada uno de los eventos siguientes.

B
A

C
6.2

A
A B

6.3

( A B) C

6.1

6.5

( B C )
( A B) C

6.6

( A B)

6.4

38

7. Muestras de una pieza de aluminio forjado se clasifica con base en el acabado de la superficie
(en micro-pulgadas) y en las mediciones de la longitud. Los resultados de 100 piezas se
resumen a continuacin.
Acabado de la
Longitud
superficie
Total
Excelente
Bueno
Excelente
75
7
Bueno
10
8
Total
Sea A denote el evento que una muestra tiene un acabado de la superficie excelente y
sea B el evento que una muestra tiene una longitud excelente. Determine el
B y A B .
nmero de muestras en A B,
8. El anlisis de las flechas para un compresor se resumen por su cumplimiento con las
especificaciones.
El acabado de la
superficie cumple
Si
No
Total
8.1
8.2

La redondez cumple
Si
No
345
57
12
8

Total

Si se sabe que una flecha cumple con los requerimientos de redondez. Cul es la
probabilidad que cumpla con los requerimientos del acabado de la superficie?
Si se sabe que una flecha no cumple con los requerimientos de redondez. Cul es
la probabilidad que cumpla con los requerimientos del acabado de la superficie?

9. Un lote de 100 chips semiconductores contiene 20 que estn defectuosos. Se seleccionan dos
chips del lote, al azar, sin reemplazo.
9.1 Cul es la probabilidad de que el primero que se seleccione este defectuoso?
9.2 Cul es la probabilidad de que el segundo que se seleccione este defectuoso, dado
que el primero estuvo defectuoso?
9.3 Cmo cambia la respuesta del inciso (b) si los chips seleccionados se reemplazaron
antes de la siguiente seleccin?
10. Se clasifican muestras de hule espuma de tres proveedores de acuerdo a si cumplen o no con
las especificaciones. Los resultados de 100 muestras se resumen a continuacin.
Proveedor
1
2
3
Total

Cumple
Si
18
17
50

Total

No
2
3
10

Sea que A denote el evento de una muestra del proveedor 1 y sea que B denote el
evento de una muestra cumpla con las especificaciones. Si se selecciona una muestra de
hule espuma al azar, determine las siguientes probabilidades.
10.1

P(A)

10.4

P(B)

39

10.2
10.3

P(A)
P ( A B)

10.5
10.6

P ( A B)
P( A B)

11. Durante un perodo determinado, aument el valor de mercado de las acciones comunes en
circulacin en una industria, que incluye solamente 12 acciones. Si un inversionista escoge dos
de esas acciones al azar. Cul es la probabilidad de que ambos hayan experimentado un
aumento en su valor de mercado durante ese perodo, si se sabe que 8 aumentaron su valor?
12. Se selecciona una muestra de tres calculadoras de una lista de fabricacin y cada una de ellas
se clasifica como defectuosa o aceptable. Sean A, B y C los eventos de la primera, la segunda
y la tercera calculadora esta defectuosa, respectivamente.
12.1 Describa el espacio muestral para este experimento
12.2 Describa cada uno de los eventos siguientes: A, B , A B , B C
13. De 600 empleados de una compaa, 300 participan en un plan de reparto de utilidades,
400 tienen una cobertura de gastos mdicos y 200 empleados participan en ambos programas.
13.1 Describa cada uno de los sucesos involucrados y presente estos datos en una tabla
de contingencia.
13.2 De un ejemplo de un evento simple.
13.3 De un ejemplo de un evento conjunto.
13.4 Cul es el complemento del suceso Empleado participa en cobertura de gastos
mdicos?
13.5 Cul es la probabilidad que un empleado elegido al azar:
13.5.1 Participe por lo menos en uno de los programas?
13.5.2 No participe en ninguno de los programas?
13.5.3 Participe en el plan de reparto de utilidades considerando que tiene
seguro de gastos mdicos?
13.6 Determine si los eventos empleado participa en el programa de reparto de
utilidades es independiente a tener cobertura de gastos mdicos.
14. De 100 personas que solicitan empleo de operador de computadoras en una firma, 40 tenan
experiencia profesional, 30 maestra y 20 tenan experiencia y maestra.
14.1 Describa cada uno de los sucesos involucrados y presente estos datos en una tabla
de contingencia.
14.2 Cul es la probabilidad que un solicitante escogido aleatoriamente tenga experiencia
o maestra?
14.3 Tenga maestra dado que tiene alguna experiencia profesional.
14.4 Determine si la experiencia y poseer maestra son sucesos independientes.
15. Quinientos clientes de crdito de Credicom. S.A. estn categorizados segn el nmero de
aos que han tenido cuenta de crdito y por su promedio de saldo. De estos clientes 210 han
tenido saldos menores a $100, otros 260 han tenido cuenta de crdito cuando menos 5 aos,
80 han tenido saldos mayores de $100 y cuentas de crdito por menos de 5 aos. Presente
estos datos en una tabla de contingencia.
15.1 Describa cada uno de los sucesos involucrados y presente estos datos en una tabla
de contingencia.

40

Si se selecciona al azar un cliente.


Cul es la probabilidad que tenga un saldo de crdito mayor de $100?
15.2.2 Cul es la probabilidad que tenga un saldo de crdito menor de $100 o ha
tenido cuenta de crdito cuando menos 5 aos?
15.2.3 Cul es la probabilidad que tenga un saldo de crdito menor de $100 y han
tenido cuentas de crdito por menos de 5 aos?
15.2.4 Suponga que un cliente ha tenido cuentas de crdito cuando menos 5 aos.
Cul es la probabilidad de que tenga un saldo inferior a $100?
15.3 Muestre si tener un saldo de crdito superior a $100 y poseer cuenta de crdito
cuando menos 5 aos, son estadsticamente independiente.
15.2

15.2.1

16. Un lote contiene 15 piezas fundidas de un proveedor local y 25 piezas fundidas de un


proveedor del estado contiguo. Se seleccionan dos piezas fundidas al azar, sin reemplazo del
lote de 40. Sea A: el evento de que la primera pieza fundida seleccionada es del proveedor
local y sea B: el evento de que la segunda pieza fundida seleccionada es del proveedor del
estado contiguo. Determine:
16.1
16.2

16.3

P(A)
P ( A B)

16.4

P( A / B )
P ( A B)

17. Durante una semana determinada se estima que la probabilidad de que el precio de una accin
especfica aumente (A), permanezca sin cambio (C) o se reduzca (R) es de 0,35, 0,20 y 0,45
respectivamente.
17.1 Cmo son los sucesos A, C y R?
17.2 Cul es la probabilidad de que el precio de la accin aumente o permanezca sin
cambio?
17.3 Cul es la probabilidad de que el precio de la accin cambie durante la semana?
18. Si P( A / B) 0,4

P( A) 0,6

P( B) 0,8 Los eventos A y B son

independientes?
19. Se estima que la probabilidad de que aumenten las ventas de automviles en el siguiente mes
es de 0,40. Se estima que la probabilidad de que aumenten las ventas de refacciones es de
0,50. Se estima que la probabilidad de que ambas industrias experimenten un aumento en
ventas es de 0,10. Cul es la probabilidad de que:
19.1 Hayan aumentado las ventas de automviles durante el mes, dado que existe
informacin de que han aumentado las ventas de refacciones.
19.2 Hayan aumentado las ventas de refacciones, dado que existe informacin de que
aumentaron las ventas de automviles durante ese mes.
20. La proporcin general de artculos defectuosos en un proceso continuo de produccin es 0,08.
Cul es la probabilidad de que:
20.1 Dos artculos elegidos al azar ninguno tenga defecto?
20.2 Dos artculos escogidos al azar tengan defecto?

41

21. La siguiente tabla de contingencia representa la clasificacin de 150 compaas muestreadas


de acuerdo con cuatro grupos industriales, y respecto a si su rendimiento sobre la inversin
est por encima o por debajo del rendimiento promedio.
Categora
Industrial
A
B
C
D
Total

Rendimiento sobre el capital


Superior al promedio (S)
20
10
20
25

Total

Inferior al promedio (I)


40
10
10
15

21.1 Construya una tabla de probabilidad conjunta en base a estos datos muestrales.
21.2 Determine las siguientes probabilidades:

P(A y S)
P(S)
P(B/S)

P(I)
P(D)
P(B o I)

P(C/I)
P(I/S)
P(D y S)

22. La probabilidad de que haya escasez de cemento es 0,28 y la probabilidad de que no habr
escasez y que una obra de construccin se termine a tiempo es 0,64. Cul es la probabilidad
de que la obra se termine a tiempo dado que no habr escasez de cemento?
23. Un estudiante est tomando dos cursos, historia y matemticas. La probabilidad de que
apruebe el curso de historia es 0,60 y matemticas es 0,70. La probabilidad que apruebe
ambas es 0,50. Cul es la probabilidad que pase por lo menos una? Qu regla de
probabilidad aplic?
24. Las probabilidades de dos eventos A y B son 0,20 y 0,30, respectivamente. Los sucesos no
son mutuamente excluyentes. La probabilidad de que ambos A y B ocurran es 0,15 Cul es
la probabilidad de que sucedan A o bien B?
25. Un estudio de las opiniones de los diseadores en lo referente al color primario ms
conveniente para aplicar en oficinas ejecutivas indic:
Color primario
Blanco
Amarillo
Violeta
Verde
Total

N de opiniones
92
86
70
14

25.1 Cul es el experimento?

25.2 Cul es un posible evento?


25.3 Cul es la probabilidad de seleccionar una respuesta especifica y descubrir que el

diseador prefiere rojo o verde?

25.4 Cul es la probabilidad de que un diseador no prefiera amarillo?

42

26. Cada vendedor de una empresa se califica como por debajo del promedio. Promedio o
Arriba del promedio, con respecto a su habilidad para las ventas. Adems, cada vendedor
tambin se califica con respecto a su posibilidad de promocin en: regular, buena o
excelente. En la tabla que sigue se presentan las clasificaciones de estos rasgos para 500
vendedores.
Habilidades en ventas
Por debajo del promedio
Promedio
Arriba del promedio
Total

Posibilidades de promocin
Regular
Buena Excelente
16
12
22
45
60
45
93
72
135

Total

26.1 Cmo se llama esta tabla?

26.2 Cul es la probabilidad que un vendedor seleccionado al azar tenga habilidad de

ventas por encima del promedio y excelente posibilidad de promocin?

27. Suponga que P(A) = 0,40, P(B/A) = 0,30 Cul es la probabilidad conjunta de A y B?
28. Una encuesta a ejecutivos de alto nivel revel que 45% leen con regularidad el diario La
Prensa, 35% El Nuevo Diario y 25% ambos diarios.
28.1 Qu porcentaje de ejecutivos no lee ninguno de los diarios?
28.2 Cmo se le llama a la probabilidad 0,25?
28.3 Los eventos son mutuamente excluyentes? Explique su respuesta.

9. Teorema de Bayes
La probabilidad condicional toma en cuenta la informacin en cuanto a la ocurrencia de un
evento para predecir la probabilidad de otro evento. Este concepto se puede ampliar para
la revisin de las probabilidades basadas en nueva informacin y para determinar la
probabilidad de que un evento particular se debi a una causa especfica. El procedimiento
para la revisin de estas probabilidades se conoce como Teorema de Bayes y la
composicin de los eventos para resolver los problemas de la probabilidad se facilita
algunas veces al considerar el espacio muestral S como una unin de subconjuntos que son
mutuamente excluyentes.
Es decir,
S B1 B2 .... Bk con Bi B j , i j luego cualquier subconjunto A de S se
puede escribir como,

Usando ley distributiva entre conjuntos,


A A ( B1 B2 .... Bk )
A ( A B1 ) ( A B2 ) .... ( A Bk ) Observemos que,

P( A) P( A B1 ) P( A B2 ) ... P( A Bk )
P( A) P( B1 ) P( A / B1 ) P( B2 ) P( A / B2 ) ... P( Bk ) P( A / Bk )
k

P( A) P( Bi ) P( A / Bi )
i 1

Se le llama probabilidad total.

43

Una probabilidad condicional se puede calcular como,


P( Bi / A)

44

P ( Bi ) P ( A / Bi )
k

P( B ) P( A / B )
i 1

9.1 rbol de decisin, diagrama de rbol o arborigrama.


Una forma alternativa de ver la descomposicin de las probabilidades es, a travs del
de un arborigrama.
Ej: 9.11 El gerente de marketing de una firma fabricante de juguetes planea evaluar la
introduccin de un nuevo juguete al mercado. En el pasado 40% de los juguetes
introducidos por esta firma han tenido xito y 60% no lo han tenido. Antes de
lanzar el juguete al mercado, se lleva a cabo una investigacin y se elabora un
informe, favorable o desfavorable. En el pasado 80% de los juguetes con xito
recibieron informes favorables y 30% de los juguetes sin xito tambin recibieron
informes favorables. El gerente de marketing desea conocer la probabilidad de que el
nuevo juguete tenga xito si recibe un informe favorable. Sean,
S : Produccin de juguetes de esa firma.
B1 : Juguete con xito en el mercado.
B2 : Juguete sin xito en el mercado.

A : Informa desfavorable.

A : Informe favorable.
0,8

(0,4) (0,8) = 0,32

0,2

(0,4) (0,2) = 0,08

(0,6) (0,3) = 0,18

B1
0,4

S
0,3
0,6

B2
0,7

Probabilidades
a priori.

A (0,6) (0,7) = 0,42

Probabilidades
condicionales.

P( B1 / A)

P( B1 ) P( A / B1 )
P( B1 ) P( A / B1 ) P( B2 ) P( A / B2 )

P( B1 / A)

(0,4)(0,8)
0,32
0,32

0,64
(0,4)(0,8) (0,6)(0,3) 0,32 0,18 0,50

Probabilidades
conjuntas.

ACTIVIDAD DE AUTOAPRENDIZAJE N 5
1.

El software para detectar fraudes con tarjetas telefnicas personales rastrea el nmero de
reas donde se originan las llamadas cada da. Se ha encontrado que 1% de los usuarios
legtimos hacen llamadas de dos o ms reas en un solo das. Sin embargo, 30% de los
usuarios fraudulentos hacen llamadas de dos o ms reas en un solo da. La proporcin de
usuarios fraudulentos es 0,01%.
1.1 Describa cada uno de los sucesos involucrados y presente esta informacin en un
diagrama de rbol.
1.2 Si el mismo usuario hace llamadas de dos o ms reas en un solo da. Cul es la
probabilidad de que el usuario sea fraudulento?

2.

En una fbrica de zapatos, se sabe por experiencia que la probabilidad es 0,82 de que un
trabajador que ha asistido a un programa de capacitacin de la fbrica cumplir con la cuota
de produccin y que la probabilidad correspondiente es 0,53 para un trabajador que no
asisti al programa de capacitacin. Si el 60% de los trabajadores asisten al programa de
capacitacin de la fbrica.
2.1 Describa cada uno de los sucesos involucrados y presente esta informacin en un
diagrama de rbol.
2.2 Suponga que el trabajador cumpli con la cuota de produccin. Cul es la
probabilidad de que haya asistido al curso?

3.

Suponga que 2% de los rollos de tela de algodn y 3% de los rollos de tela de nylon
contienen defectos. De los rollos usados por un fabricante, 70% son de algodn y 30% son de
nylon.
3.1 Describa cada uno de los sucesos involucrados y presente estos datos en un diagrama
de rbol.
3.2 Cul es la probabilidad que uno de los rollos de tela de nylon usados por el
fabricante seleccionado al azar contenga defectos?

4.

Los clientes acostumbran evaluar en forma preliminar el diseo de los productos. En el


pasado, 95% de los productos de gran xito recibieron crticas favorables, 60% de los
productos con xito moderado recibieron crticas favorables y 10% de los productos sin
mucho xito tambin recibieron crticas favorables. Adems 40% de los productos han sido
de gran xito, 35% de xito moderado y 25% han sido productos sin mucho xito.
4.1 Describa cada uno de los sucesos involucrados y presente esta informacin en un
diagrama de rbol.
4.2 Si un diseo nuevo obtiene una crtica favorable. Cul es la probabilidad que sea un
producto de gran xito?
4.3 Cul es la probabilidad que sea un producto de gran xito, si no consigue una crtica
favorable?

5.

El dueo de una tienda de discos divide a los clientes que entran a su tienda en clientes
en edad escolar, clientes en edad universitaria y clientes mayores y observa que el 30,
50 y 20 por ciento de todos los clientes, respectivamente, pertenecen a estas
categoras. Tambin observa que compran discos el 20 por ciento de los clientes en

45

edad escolar, el 60 por ciento de los clientes en edad universitaria y el 80 por ciento
de los clientes mayores.
5.1 Describa cada uno de los sucesos involucrados y presente esta informacin en un
diagrama de rbol.
5.2 Si un cliente seleccionado aleatoriamente compra un disco. Cul es la probabilidad
que est en edad escolar?
6.

El departamento de crdito de una casa comercial, inform que 30% de sus ventas son en
efectivo, 30% se pagan con cheque en el momento de la adquisicin y 40% se pagan con
tarjetas de crdito. Se tiene que 29% de las compras en efectivo, 90% en cheques y 60% de
las compras con tarjeta de crdito son por ms de $100.
6.1
Describa cada uno de los sucesos involucrados y presente esta informacin en un
diagrama de rbol.
6.2
Alba Marn acaba de comprar un vestido nuevo que cuesta $150. Cul es la
probabilidad de que haya pagado en efectivo?

7.

Tres mquinas M1, M2, M3 producen respectivamente 50%, 30%, 20% del total de artculos
de una fbrica. Las mquinas producen artculos defectuosos en un porcentaje de 7%, 6%,
4% respectivamente. Al colocar la produccin de las tres mquinas en fila y escoger un
artculo.
7.1
Describa cada uno de los sucesos involucrados y presente esta informacin en un
diagrama de rbol.
7.2
Si el artculo escogido es defectuoso. Cul es la probabilidad que haya sido
producido en cualesquiera de las tres mquinas? Tome como decisin el elemento
mayor probabilidad de producir artculos defectuosos.

8.

En cierta Empresa el 6% de los empleados varones y el 4% de los empleados mujeres tienen


salarios mayores de C$ 12 000. Adems el 60% de los empleados son hombres.
8.1 Describa cada uno de los sucesos involucrados y presente esta informacin en un
diagrama de rbol.
8.2 Se despide a un empleado al azar que gana ms de C$12 000.
8.2.1 Cul es la probabilidad que sea varn?
8.2.2 Cul es la probabilidad que sea mujer?

9.

Un comerciante de parte para automviles tiene 4 empleados K, L, M y N, que cometen


errores al llenar un pedido una vez en cien, cuatro veces en cien, dos veces en cien y seis
veces en cien respectivamente. De todos los pedidos llenados, K, L, M y N llenan
respectivamente el 20, 40, 30 y 10%.
9.1 Presente esta informacin en un diagrama de rbol que muestre todas las
probabilidades.
9.2 Si se encuentra un error en un pedido. Cul es la probabilidad que fue llenado por K,
L, M o N.

46

UNIDAD III

DISTRIBUCIONES DE PROBABILIDAD Y PRUEBAS


ESTADSTICAS

Introduccin
La preparacin de un proyecto de investigacin es una tarea compleja, ya que se han de tener
en cuenta multitud de aspectos para que el documento final contemple todos los apartados que
cualquier estructura estndar considera y para que todos los investigadores sepan con qu y
cmo deben proceder en todas las etapas de ejecucin del estudio planteado. Uno de los
dilemas que se presenta cuando se inicia la elaboracin del proyecto es decidir sobre los
individuos o elementos que se incluirn en el estudio: qu caractersticas tendrn criterios de
inclusin y exclusin, a cuntos individuos se estudiar tamao de la muestra y cmo se
elegirn para que entren a formar parte del estudio tcnica de muestreo. Estudiar a toda la
poblacin, que sera la manera ms exacta de conocer lo que se pretende estudiar, es casi
imposible en la prctica. Entre los motivos que lo impiden se encuentran la falta de tiempo, la
escasez de recursos humanos y econmicos, la dificultad para acceder a todos los sujetos, etc.,
por lo que se estudia slo a una parte de ellos, para, posteriormente, generalizar o inferir
los resultados obtenidos a toda la poblacin. Por tanto, cuando se habla de sujetos de estudio,
se ha de diferenciar claramente entre poblacin, muestra e individuo.
1. Distribucin de probabilidad
Una distribucin de probabilidad indica toda la gama de valores que pueden representarse
como resultado de un experimento. Es decir, describe la probabilidad de que un evento
se realice en el futuro y constituye una herramienta fundamental para la prospectiva,
puesto que se puede disear un escenario de acontecimientos futuros considerando las
tendencias actuales de diversos fenmenos naturales. Recordemos inicialmente que
existen las variables aleatorias, siendo aquellas que se asocian a la ocurrencia de un
fenmeno aleatorio. Cuando una de estas variables aleatorias toma diversos valores, la
probabilidad asociada a cada uno de tales valores puede ser organizada como una
distribucin de probabilidad. Las distribuciones de probabilidad pueden representarse a
travs de una tabla, una grfica o una frmula, en cuyo caso tal regla de correspondencia
se le denomina funcin de probabilidad. Toda distribucin de probabilidad es generada por
una variable aleatoria x, y puede ser de dos tipos:
2. Variable aleatoria discreta (x)
Porque solo puede tomar valores enteros y un nmero finito de ellos.
Ej: 2.1 xVariable que nos define el nmero de alumnos aprobados en la asignatura
de Estadstica en un grupo de 40 estudiantes (1, 2 ,3 los 40). Consideraremos
primero las distribuciones de probabilidad para variables discretas. Las propiedades de
las distribuciones de variables discretas son dos, y que posteriormente, al hablar de las
distribuciones de variables continuas, se repetirn de manera muy similar:
0 P(X = x) 1.
P(X = x) = 1, o que es lo mismo: la suma de todas las probabilidades de los
eventos posibles de una variable aleatoria es igual a la unidad.

47

Hay que hacer notar que estas propiedades se enuncian suponiendo que conocemos el
valor de la probabilidad, pero en la realidad esto no ocurre, es decir que no sabemos la
probabilidad y lo que se hace es trabajar con estimaciones. Precisamente esto nos lleva
a modelos tericos que estiman los resultados, los principales son los que a continuacin
se presentan.
3. Valor esperado de una variable aleatoria (v.a)
Para tener una medida del punto central de una distribucin de probabilidad, introducimos
el concepto de esperanza de una variable aleatoria, el valor esperado es la medida
correspondiente del punto central de una variable aleatoria.
Su frmula es:
E ( x) xP( x)

4. Varianza y Desviacin Estndar de una variable aleatoria


En la unidad I observamos que la varianza muestral es una medida til de la dispersin de
un conjunto de observaciones numricas. Y es el promedio de los cuadrados de las
diferencias entre las observaciones y la media. Nos basamos en esta misma idea para medir
la dispersin de la distribucin de probabilidad de una v.a. La varianza de una v.a. es el
promedio ponderado de los cuadrados de sus diferencias posibles con respecto a la media.
Su frmula es:
V ( x ) 2 ( x ) 2 P( x )

Y la desviacin estndar est dada:

(x )

P( x)

Ej: 4.1 Un contratista est interesado en saber cul es el costo total de un proyecto
para el que pretende presentar una oferta. Estima que los materiales costarn
$25000 y su trabajo $900 al da. Si el proyecto tarda en realizarse X das, el costo
laboral total ser 900X $ y el costo total del proyecto (en $) ser
C ( x) 25000 900 x El contratista estima unas probabilidades subjetivas de la
duracin probable del proyecto.
Duracin X (das)
Probabilidad
4.1.1

10
0,1

11
0,3

12
0,3

13
0,2

14
0,1

Determine la media, la varianza y la desviacin estndar de la duracin X del


proyecto.

E ( x) xP( x)
E( x) 10(0,1) 11(0,3) 12(0,3) 13(0,2) 14(0,1) 11,9 das

Este valor indica que sobre un gran nmero de das, el contratista espera que la
duracin promedio de la obra sea de 11,9 das.

48

V ( x ) 2 ( x ) 2 P( x )
2 (10 11,9) 2 (0,1) (11 11,9) 2 (0,3) (12 11,9) 2 (0,3) (13 11,9) 2 (0,2)

49

(14 11,9) 2 (0,1) 1,29

1,29 1,135781669 1,1 da.

ACTIVIDAD DE AUTOAPRENDIZAJE N 6
1.

El nmero de computadoras vendidas al da en una tienda viene definida por la


siguiente distribucin de probabilidad:
X
P(X)
1.1
1.2
1.3
1.4

0
0,05

1
0,10

2
0,20

3
0,20

4
0,20

5
0,15

6
0,10

En promedio cuntas computadoras vende al da la tienda?


Cul es la desviacin estndar de esta distribucin?
Grafique esta funcin de probabilidad.
Cul es la probabilidad que la tienda venda a lo sumo 3 computadoras en un da?

2. Las muestras de cierta materia prima se clasifican de acuerdo con su contenido de


humedad e impurezas, redondeado este al porcentaje ms cercano. A continuacin se
presentan los resultados obtenidos con 80 muestras.
Impurezas
1%
2%
2.1
2.2

3.

Contenido de humedad.
3%
4%
5
14
57
4

Determine la media y la varianza del contenido de humedad de esas muestras.


Calcule la media y la varianza del contenido de impurezas de estas muestras.

Una pastelera ofrece bocadillos con


N de bocadillos vendidos
12
13
decoracin especial para cumpleaos,
Probabilidad
0,25 0,40
bodas y otras ocasiones. En la tabla que
sigue se proporciona el nmero total de bocadillos vendidos al da y las probabilidades
correspondientes. Calcule la media, la varianza y la desviacin estndar para el nmero
promedio de bocadillos vendidos por da.

14
0,25

15
0,10

4. El gerente de personal de una empresa est


N de accidentes
0
1
2
3
4
estudiando el nmero de accidentes en el
Probabilidad
0,4 0,2 0,2 0,1 0,1
trabajo durante un periodo de un mes.
Elabor la distribucin probabilstica que se muestra enseguida. Calcule e interprete la media,
la varianza y la desviacin estndar del nmero de accidentes en un mes.

5.

Una compaa inmobiliaria tiene un


N de vacantes
0
1
2
3
4
gran nmero de apartamentos
Probabilidad
0,40 0,30 0,20 0,08 0,02
disponibles cada mes para rentar. Un
inters de la administracin es el # de apartamentos vacantes mensualmente. Un estudio
reciente revel el porcentaje del tiempo que est vacante un nmero dado de apartamentos.
Calcule la media y la desviacin estndar del nmero de unidades desocupadas.

5. Distribucion Binomial
Consideremos los llamados ensayos de Bernoulli, stos son aquellos experimentos cuyo
resultado es uno de dos posibles y mutuamente excluyentes. Es decir aquel modelo que
sigue un experimento que se realiza una sola vez y que puede tener dos soluciones: xito
(acierto) o fracaso:
Cuando es acierto la variable toma el valor 1
Cuando es fracaso la variable toma el valor 0
Ej: 5.1 Los siguientes son ensayos Bernoulli.
El saldo de una cuenta por cobrar esta correcta o incorrecta.
Un tornillo, puede estar defectuoso o no defectuoso.
El sexo de un beb al nacer: nio o nia.
La respuesta correcta o incorrecta en un examen.
Si consideramos una serie de ensayos Bernoulli que tiene como caractersticas:
La probabilidad de xito permanece constante, ensayo tras ensayo; y
Los ensayos son independientes entre s.
La distribucin binomial se aplica cuando se realizan un nmero "n" de veces el experimento de
Bernoulli, siendo cada ensayo independiente del anterior. La variable puede tomar valores
entre 0 y n
Entonces se tiene lo que se denomina experimento binomial, donde el nmero de ensayos se
denota con n, la probabilidad de xito con

p y la de fracaso con q. Hay que notar que las

probabilidades de xito y de fracaso estn relacionadas de la siguiente manera: p + q = 1.


Ej: 5.2 Consideremos un examen con tres preguntas de opcin mltiple, con cuatro pciones,
y que ser contestado al azar.
Al examinar los registros de facturacin mensual de una editora con ventas por internet, el
auditor tom una muestra de 8 de las facturas no pagadas. La cantidad adeudada a la compaa
es,
$ 260 340
300
320
300
280
240
220
La deuda promedio es:
a.
305
b.

282,5

c.

300

d.

290,5

La mediana es:
a.
280

b.

290

c.

320

d.

240

La varianza es:
a.
1650

b.

1560

c.

1565

d.

1625

50

Con esto contamos con un experimento binomial, ya que la probabilidad de xito


permanece constante en las tres preguntas (p =) y las respuestas de una a otra pregunta son
independientes entre s. Se cuenta con una cantidad n = 3 de ensayos y q = 1 - p = 3/4.
Hay que decir que n y p son los llamados parmetros de la distribucin. Tenemos ahora la
variable aleatoria X que representar el nmero de respuestas correctas, siendo sus posibles
valores: 0, 1, 2, y 3.
En general, si se tienen n ensayos de Bernoulli con probabilidad de xito p y de fracaso q,
entonces la distribucin de probabilidad que la modela es la distribucin de probabilidad
binomial y su regla de correspondencia es:

P( X x ) n C x p x q n x

para x = 0, 1,2,, n.

La media y la desviacin estndar de la distribucin binomial con parmetros n y p es:

E( x) np , npq

Nota:
La eleccin de xito o fracaso es subjetiva y queda a opcin de la persona que resuelve el
problema, pero teniendo cuidado de plantear correctamente lo que se pide.
Ej: 5.3 Suponga que Susana Fermn es agente de seguros y contacta a 5 personas y cree
que la probabilidad de vender un seguro a cada una es de 0,4.
5.3.1 Halle la probabilidad de que no venda seguro.
Es decir, P( X 0)
X: # de seguros a vender.
n=5
p = 0,4 q = 0,6
Sustituyendo en la frmula.

P( X x ) n C x p x q n x
P( X 0) 5 C0 (0,4) 0 (0,6) 50

(1)(1)(0,07776) 0,07776

Es decir, hay un 7,8 % de probabilidad aproximadamente, de que Susana Fermn no


venda seguro.

5.3.2

Cul es la probabilidad que venda a lo mximo un seguro?


En forma simblica P(X 1)
Sustituyendo en la frmula.
P( X 1) P( X 0) P( X 1) 5 C0 (0,4) 0 (0,6) 50 5 C1 (0,4)1 (0,6) 5-1

P( X 1) 0,07776 0,2592 0.33696

Lo que indica que hay una probabilidad de 0,337 de que venda cuando mucho un
seguro.

5.3.3

Halle la probabilidad de que venda entre dos y cuatro seguros (inclusive).

51

5.3.4

Cul es la probabilidad que venda por lo menos un seguro?

52

ACTIVIDAD DE AUTOAPRENDIZAJE N 7
1.

Un director de produccin sabe que el 5% de los componentes producidos en un


determinado proceso tiene algn defecto. Se examinan seis de estos
componentes, cuyas caractersticas pueden suponerse que son independientes entre s.
1.1 Cul es la probabilidad que ningn componente tenga este defecto?
1.2 Cul es la probabilidad que uno de estos componentes tenga un defecto?
1.3 Cul es la probabilidad que al menos dos de estos componentes tenga un defecto?

2. Una mquina de cierta marca est produciendo 10% de piezas defectuosas. El ingeniero de
control de calidad ha estado verificando la produccin por medio de muestreo casi continuo
desde que empez la condicin anormal. Cul es la probabilidad que en una muestra de 10
piezas:
2.1
Exactamente 5 estn defectuosas?
2.2
5 o ms estn defectuosas?
2.3
A lo sumo una esta defectuosa?
3. Un inspector encargado del control de calidad de los camiones de juguete producidos por una
fbrica, ha observado que cierto defecto en las llantas se presenta en el 5% de los vehculos.
En cada uno se colocan seis llantas. Cul es la probabilidad de que en un conjunto de seis
llantas seleccionadas aleatoriamente no se presente el defecto?
4. Un circuito electrnico contiene 10 circuitos integrados. La probabilidad de que cualquier
circuito integrado este defectuoso es 0.05, y los circuitos integrados son independientes.
El artculo trabaja slo si no contiene circuitos defectuosos. Cul es la probabilidad que el
artculo trabaje?
5. En un proceso de produccin se examinan lotes de 50 resortes helicoidales para
determinar si cumplen con los requerimientos del cliente. El nmero promedio de resortes
helicoidales que no cumplen con los requerimientos es de 5 por lote. Suponga que el nmero
de resortes que no cumplen con los requerimientos en un lote, denotado por X, es una v.a.
binomial.
5.1
Que valor tiene n y p?
5.2
Calcule P(X 2) y P(X 49)
6. Las observaciones durante un largo perodo muestran que un vendedor determinado puede
concluir una venta en una sola entrevista con una probabilidad de 0,30 Suponga que el
vendedor entrevista a 6 prospectos (o compradores prospectivos).
6.1
Cul es la probabilidad que exactamente dos prospectos compren el producto?
6.2
Cul es la probabilidad de que todos los prospectos compren el producto?
6.3
Cul es la probabilidad que al menos dos prospectos compren el producto?

6. Distribucin de Poisson
La distribucin de Poisson es tambin un caso particular de probabilidad de variable
aleatoria discreta, el nombre se debe a Simen Denis Poisson (1781-1840), un francs que
la desarroll a partir de los estudios que realiz durante la ltima etapa de su vida, como
una forma lmite de la distribucin binomial que surge cuando se observa un evento raro
despus de un nmero grande de repeticiones. En general, la distribucin de Poisson se
puede utilizar como una aproximacin de la binomial, si el nmero de pruebas n es grande,
pero la probabilidad de xito p es pequea; una regla es que la aproximacin PoissonBinomial es buena si n 20 y p 0,05 y muy buena si n 100 y p 0,01. La distribucin
de Poisson tambin surge cuando un evento o suceso raro ocurre aleatoriamente en el
espacio o el tiempo. La variable asociada es el nmero de ocurrencias del evento en un
intervalo o espacio continuo, por tanto, es una variable aleatoria discreta que toma valores
enteros de 0 en adelante (0, 1, 2, ...). As, el nmero de llamadas que recibe un servicio de
atencin a urgencias durante 1 hora, el nmero de clulas anormales en una superficie
histolgica o el nmero de glbulos blancos en un milmetro cbico de sangre son ejemplos
de variables que siguen una distribucin de Poisson.
Caractersticas:
En este tipo de experimentos los xitos buscados son expresados por unidad de rea o
tiempo.
Ej: 6.1 # de clientes que llegan a una caja de un supermercado en la hora pico.
# de defectos de una tela por m2.
# de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc.
# de bacterias por cm2 de cultivo.
# de llamadas telefnicas a un conmutador por hora, minuto, etc.
# de llegadas de embarcaciones a un puerto por da, mes, etc.
Para determinar la probabilidad de que ocurran x xitos por unidad de tiempo o rea, la
frmula a utilizar sera:

P( X x)

e t ( t ) x
x!

x 0, 1, ...

E ( X ) t

2 t

Donde,

P( X x) Es la probabilidad de que ocurran x xitos, cuando el nmero promedio


de ocurrencia de ellos es t
t : Media o promedio de xitos por unidad de tiempo o rea.

e = 2,718 (Base de logaritmo neperiano o natural)


X : Variable que nos denota el nmero de xitos que se desea que ocurran.
Hay que hacer notar que en esta distribucin el nmero de xitos que ocurren por unidad de
tiempo o rea es totalmente al azar y que cada intervalo de tiempo es independiente de otro,
as como cada rea es independiente de otra rea. Para que una variable siga una distribucin
de Poisson deben cumplirse varias condiciones:
En un intervalo muy pequeo (por ej. un milisegundo) la probabilidad de que ocurra un
evento es proporcional al tamao del intervalo.

53

La probabilidad de que ocurran dos o ms eventos en un intervalo muy pequeo es tan


reducida que, a efectos prcticos, se puede considerar nula.
El nmero de ocurrencias en un intervalo pequeo no depende de lo que ocurra en cualquier
otro intervalo pequeo que no se solape con aqul.
El parmetro de la distribucin, es, t (lambda), representa el nmero promedio de
eventos esperados por unidad de tiempo o de espacio, por lo que tambin se suele hablar de
lambda como la tasa de ocurrencia del fenmeno que se observa.
La distribucin de Poisson tiene iguales la media y la varianza. Si la variacin de los casos
observados en una poblacin excede a la variacin esperada por la Poisson, se est ante la
presencia de un problema conocido como sobredispersin y, en tal caso, la distribucin
binomial negativa es ms adecuada.
Ej: 6.2 El nmero de fallas de un instrumento de prueba debido a las partculas
contaminantes de un producto, tiene una media de 0,02 fallas por hora.
6.2.1 Cul es la probabilidad que el instrumento no falle en una jornada de 8 horas?
Determinar P(X = 0)
0,02 , t 8 horas

Calculamos t 0,02(8) 0,16


Sustituimos en la frmula: P( X x)

P( X 0)

e t (t ) x
x!

e 0.,16 (0,16) 0
0,852143789
0!

Es decir la probabilidad es de 0,8521 de que no falle el instrumento en una jornada


de 8 horas.

6.2.2 Cul es la probabilidad que se presente al menos una falla en un periodo de 24


horas?
Es decir P(X 1), donde 0,02
t 24 horas

Calculamos t 0,02(24) 0,48 ;

P( X 1) 1 P( X 1) 1 P( X 0)

Sustituimos en la frmula: P( X x)

e t (t ) x
x!

P( X 1) 1

e 0, 48 (0,48) 0
1 0,618783391 0,381216608 0,3812
0!

Por consiguiente la probabilidad

que se presente al menos una falla en un periodo de

24 horas es de 0,3812 .
6.2.3 Cul es la probabilidad que se presente a lo sumo una falla en un periodo de 12
horas?
Es decir P(X 1), donde 0,02
t 12 horas

Calculamos t 0,02(12) 0,24 ;

P( X 1) P( X 0) P( X 1)

54

Sustituimos en la frmula: P( X x)

e t (t ) x
x!

e0, 24 (0,24)0 e0, 24 (0,24)1


P( X 1)

0,786627861 0,188790686 0,975418547 0,9754


0!
1!

ACTIVIDAD DE AUTOAPRENDIZAJE N 8
1.

Una persona pasa todas las maanas a la misma hora por un crucero donde el semforo
est en verde el 20% de las veces. Suponga que cada maana representa un ensayo
independiente.
1.1 En cinco maanas consecutivas, Cul es la probabilidad que el semforo este en verde
exactamente un da?
1.2 En 20 maanas, Cul es la probabilidad que el semforo este en verde exactamente
cuatro das?
1.3 En 20 maanas, Cul es la probabilidad que el semforo este en verde ms de cuatro
das?

2. Se supone que el nmero de defectos en los rollos de tela de cierta industria textil es una v.a
de Poisson con una media de 0.10 defectos por metro cuadrado.
2.1 Cul es la probabilidad de tener dos defectos en un metro cuadrado de tela?
2.2 Cul es la probabilidad de tener un defecto en 10 metros cuadrados de tela?
2.3 Cul es la probabilidad de que no haya defectos en 20 metros cuadrados de tela?
2.4 Cul es la probabilidad que existan al menos dos defectos en 10 metros cuadrados de
tela?
3. El nmero de mensajes que se envan por computadora a un boletn electrnico tiene una
media de cinco mensajes por hora.
3.1 Cul es la probabilidad que el boletn reciba cinco mensajes en una hora?
3.2 Cul es la probabilidad que el boletn reciba 10 mensajes en una hora y media?
3.3 Cul es la probabilidad que el boletn reciba menos de dos mensajes en media hora?
3.4 Cul es la probabilidad que el boletn reciba por lo menos tres mensajes en una hora?
4. Un profesor recibe, por trmino medio, 4,2 llamadas telefnicas de los estudiantes el da
antes de realizarse alguna prueba sistemtica. S las llamadas siguen una distribucin de
Poisson. Cul es la probabilidad que:
4.1 Reciba al menos tres llamadas ese da?
4.2 El profesor no reciba llamadas ese da?
4.3 Reciba a lo sumo tres llamadas ese da?
5. Un estudio de las filas en las cajas registradoras de salida en un supermercado revel que
durante un cierto periodo en la hora ms concurrida, el nmero de clientes en espera era en
promedio cuatro. Cul es la probabilidad que durante ese periodo:
5.1 No haya cliente esperando?
5.2 Cuatro o menos clientes estn en espera?
5.3 A lo sumo un cliente este en espera?

55

5.4 Por lo menos un cliente este en espera?

6. Un banco en promedio recibe 6 cheques sin fondos por da. Cul es la probabilidad de que
reciba cuatro cheques sin fondo en un da dado?
7. Variable aleatoria Continua
Una variable aleatoria continua es aquella que puede asumir un nmero infinito de valores
dentro de un determinado rango. Los conceptos y las ideas sobre las variables aleatorias
discretas tambin se aplican a las variables aleatorias continuas. Muchos indicadores
econmicos y empresariales como las ventas, la inversin, el consumo, los costos y los
ingresos pueden representarse por medio de variables aleatorias continuas. Adems, las
medidas del tiempo, la distancia, la temperatura y el peso encajan en esta categora.
8. Distribucin normal
Es el modelo de distribucin ms utilizado en la prctica, ya que multitud de fenmenos se
comportan segn una distribucin normal.
La distribucin normal es, sin duda, la distribucin de probabilidad ms importante del
Clculo de probabilidades y de la Estadstica. Fue descubierta por De Moivre (1773), como
aproximacin de la distribucin binomial. Esta distribucin se caracteriza porque los
valores se distribuyen formando una campana de Gauss, en torno a un valor central que
coincide con el valor medio de la distribucin. La curva de la distribucin normal puede ser
modelada utilizando la funcin de densidad,

Un 50% de los valores estn a la derecha de este valor central y otro 50% a la izquierda.
Esta distribucin viene definida por dos parmetros:
: es el valor medio de la distribucin y es precisamente donde se sita el centro

de la curva (de la campana de Gauss).

: es la varianza e indica si los valores estn ms o menos alejados del valor central:
2

si la varianza es baja los valores estn prximos a la media; si es alta, entonces


los valores estn muy dispersos.
Cuando la media de la distribucin es 0 y la varianza es 1 se denomina "normal
tipificada o estandarizada", y su ventaja reside en que hay tablas donde se recoge la
probabilidad acumulada para cada punto de la curva de esta distribucin. Adems, para
transformarla en una normal tipificada se crea una nueva variable (Z) que ser igual a la
anterior (X) menos su media y dividida por su desviacin tpica (que es la raz cuadrada de la
varianza)
Z

x z

56

Toda distribucin normal se puede transformar en una normal tipificada: La distribucin


normal tipificada tiene la ventaja, como ya hemos indicado, de que las probabilidades para cada
valor de la curva se encuentran recogidas en una tabla.
Propiedades de la curva de distribucin normal.
Los valores de la curva son positivos.
La curva es simtrica con respecto al valor de la media. La curva tiene un valor mximo en
el valor de la media.
La curva tiene puntos de inflexin en aquellos valores de X para los cuales a la media se le
suma o se le resta una desviacin estndar.
La curva, en sus extremos izquierdo y derecho, tiende a acercarse infinitamente al valor
cero, es decir, el eje de las abscisas es asntota horizontal.
El rea bajo la curva es la unidad.

Manejo de la tabla
La t a b l a nos da la p r o b a b il id a d P (Z z ) s iendo z la variable tipificada.
Bsqueda en la tabla el valor Z
E n l a p r i m e ra c ol um na b u s c a m o s el va l o r d e l a s u n id a d e s y l a s d c im a s . E n
l a p r i m e r a f i l a el va l o r d e l a s c en t s im a s . S u in t e r s ec c i n n o s d a l a
p r o b a b il id a d b u sc a d a .

1 . P ( a Z b ) = Z ( b ) - Z (a )

2. P(Z a) = 1 P(Z < a ) = 1 - Z(a)

3. P ( Z a ) = Z ( a )

57

Ej. 8.1 Un cliente tiene una cartera de inversin cuyo valor medio es de 78 mil dlares y
desviacin estndar de 36 mil dlares. Se le ha pedido que calcule:

8.1.1 La probabilidad que el valor de la cartera sea inferior a 132 000 $.


X: Valor de la cartera de inversin (en miles de $)

78 mil $ y 36 mil $

Frmula para estandarizar: Z

132 78

P( X 132) P Z
PZ 1,50 Z (1,50) 0,9332
36

Es decir el 93,32% del valor de la cartera de inversin es inferior a $132 000.

8.1.2 La probabilidad que el valor de la cartera de inversin sea por lo menos de 96 000 $.
X: Valor de la cartera de inversin (en miles de $)

78 mil $ y 36 mil $

Frmula para estandarizar: Z

96 78

P(X 96) P Z
PZ 0,50
36

1 P( Z 0,50) 1 Z (0,50) 1 0,6915 0,3085

Este resultado muestra que el 30,85% del valor de la cartera de inversin es por
lo menos de $ 96 000.

8.1.3 La probabilidad que el valor de la cartera de inversin sea cuando mucho 25 000
dlares.
X: Valor de la cartera de inversin (en miles de $)

78 mil $ y 36 mil $

Frmula para estandarizar: Z

25 78

P(X 25) P Z
PZ -1,47
36

Z (1,47) 0,0708

Lo que indica que el 7,08% del valor de la cartera de inversin es cuanto mucho
de 25 mil dlares.

58

8.1.4 La probabilidad que el valor de la cartera sea superior a $72 000.


X: Valor de la cartera de inversin (en miles de $)

78 mil $ y 36 mil $

Frmula para estandarizar: Z

72 78

P( X 72) P Z
PZ 0,17 1 P( Z 0,17)
36

1 Z (0,17) 1 0,4335 0,5675

El 56,75% del valor de la cartera de inversin es superior a $72 000.


8.1.5 La probabilidad que el valor de la cartera de inversin este entre 80 y 90 mil dlares.
X: Valor de la cartera de inversin (en miles de $)

78 mil $ y 36 mil $

Frmula para estandarizar: Z

90 78
80 78
P(80 X 92) P
Z
P0,06 Z 0,33
36
36
Z (0,33) Z (0,06) 0,6293 0,5239 0,1054

Lo que indica que esta probabilidad de ocurrencia es apenas de un 0,1054, que la cartera de
inversin se ubique entre esos valores.

8.1.6 La probabilidad que el valor de la cartera de inversin este entre 20 mil y 29 mil
dlares.
X: Valor de la cartera de inversin (en miles de $)

78 mil $ y 36 mil $

Frmula para estandarizar: Z

29 78
20 78
P(20 X 29) P
Z

36
36
P 1,61 Z - 1,36
Z (1,36) Z (1,61) 0,0537 0,0869 0,0332

El resultado muestra que la probabilidad de ocurrencia es de un 3,32% de que la cartera


de inversin se encuentre entre esos valores.

8.1.7 La probabilidad que el valor de la cartera se encuentre entre 65 mil y 172 mil dolares.
X: Valor de la cartera de inversin (en miles de $)

78 mil $ y 36 mil $

59

Frmula para estandarizar: Z

60

172 78
65 78
P(65 X 172) P
Z
P 0,36 Z 2,61
36
36
Z (2,61) Z (0,36) 0,9955 0,3594 0,6361

Este resultado nos muestra que 0,6361 es la probabilidad que la cartera de inversin
se encuentre entre 65 y 172 mil dlares.

Nos encontramos con el caso inverso a los anteriores, conocemos el valor de la probabilidad y
se trata de hallar el valor de la abscisa. Ahora tenemos que buscar en la tabla el valor que ms
se aproxime a ste.
Ej: 8.2 Suponga que la cantidad de tiempo que lleva a la superintendencia de contribuciones enviar
reembolsos se distribuye normal con una media de 12 semanas y una varianza de 9.
8.2.1 Cuntas semanas tendr que esperar el 95% de los contribuyentes distribuidos
simtricamente para obtener el reembolso?
= 12
,
2 = 9
= 3
P( z1 Z z 2 ) Por la simetra 95% divida en dos partes iguales.

P(Z z2 ) 0,975
Sustituyendo en

z2 1,96

x z

z1 1,96

x1 12 (1,96)(3) 7,12 semanas x1 7 semanas.


x2 12 (1,96)(3) 17,88 semanas x1 18 semanas.

El contribuyente que solicite reembolso tendr que esperar entre 7 y 18 semanas, con
estas caractersticas.

8.2.2 Cunto tiempo tienen que esperar el 90% de los contribuyentes?

P(Z z1 ) 0,90

z1 1,28

Sustituyendo en x z
x1 12 (1,28)(3) 15,84 semanas x1 16 semanas.

Es decir que el 90% de los contribuyentes que soliciten reembolso tendr que esperar
aprximamente 16 semanas.

Ej. 8.3 Se aplica un test de cultura general y se observa que las puntuaciones obtenidas
siguen una distribucin normal con media 65 y desviacin estndar 18. Se desea
clasificar a los examinados en tres grupos (de baja cultura general, de cultura general
aceptable y de excelente cultura general) de modo que hay en el primero un 20% de la

poblacin, un 65% en el segundo y un 15% en el tercero. Cul ha de ser la puntuacin


que marca el paso de un grupo a otro?

8.3.1 Baja cultura general.


X: Puntuacin en el examen.

65 y 18

Para calcular la variable X usamos la f r m ul a e s ta n d a r i z ad a ( t i p i f ic a d a )

x z

P(Z z1 ) 0,20
Este valor lo ubicamos en el cuerpo de la tabla.
Sustituyendo en

x z

x1 65 (0,84)(18)

z1 0,84

x1 49,88 50

Hasta 50 puntos para cultura baja.

8.3.2 Cultura aceptable.


P(Z z 2 ) 0,85 z 2 1,04
Sustituyendo en

x z

x2 65 (1,04)(18)

x2 83,72 84

De 51 a 84 para cultura general aceptable.

8.2.3 Excelente cultura.

A partir de 85 puntos.

ACTIVIDAD DE AUTOAPRENDIZAJE N 9
1.

Peridicamente se suspende el servicio de una computadora para darle mantenimiento, instalar


nuevo equipo, etc. El tiempo que permanece inactiva una computadora en particular, est
distribuida normalmente con media igual a 1,5 horas y desviacin estndar de 0,4 horas. Cul
es el porcentaje de perodo de inactividad,
1.1 Entre 1 y 2 horas?
1.2 Menos de 1 hora?
1.3 A lo sumo 1,8 horas?
1.4 Cunto es el tiempo de inactividad del 75 % de las computadoras?
1.5 Cunto es el tiempo de inactividad del 25% de las computadoras?

61

2. Una compaa de transporte premia con un bono especial a aquellos empleados que venden
300 o ms boletos durante una jornada de 8 horas. El nmero de boletos vendidos por
empleado en dicha jornada est distribuido de manera aproximadamente normal,
con = 270 y = 16. Cul es la probabilidad que un vendedor seleccionado
aleatoriamente no reciba el premio?
3. La distribucin de los salarios anuales de 10 000 trabajadores de una empresa es normal y
tiene una media de C$ 110 y varianza de C$ 64 (en miles). Cuntos trabajadores tienen
salarios:
3.1 Iguales o inferiores a C$ 110?
3.2 Entre C$ 88 y C$ 115?
3.3 Entre que valores se encuentra simtricamente distribuidos el 95% de los salarios
anuales de esos trabajadores? Y del 90%?
3.4 Cunto es el salario mximo del 95% de los trabajadores? Y del 80%?
4. El 80% de los integrantes de un grupo de personas tienen menos de 30 aos. Sabiendo
que la edad media del grupo es de 24 aos, calcule su desviacin tpica.
5. El tiempo de espera en cierto banco est distribuido en forma normal, aproximadamente, con
media y desviacin estndar iguales a 3,7 y 1,4 minutos, respectivamente. Encuentre la
probabilidad de que un cliente seleccionado aleatoriamente tenga que esperar,
5.1 menos de 2 minutos.
5.2 entre 3 y 3,5 minutos.
5.3 por lo menos 2,3 minutos.
5.4 cunto tiempo tiene que esperar el 90 % de los clientes? y el 10%?
6. Se sabe que la cantidad de dinero que gastan los estudiantes en libros de texto en un ao
en una universidad sigue una distribucin normal que tiene una media de $380 y una
desviacin estndar de $50. Cul es la probabilidad que un estudiante elegido al azar:
6.1 gaste menos de $360 en libros de texto en un ao?
6.2 gaste ms de $400 en libros de texto en un ao?
6.3 gaste entre $300 y $400 en libros de texto en un ao?
6.4 gaste entre $250 y $280 en libros de texto en un ao?
6.5 Quiero hallar un intervalo de gastos en libros de texto que incluya el 80% de todos los
estudiantes de esa universidad.
9. Distribucin muestral de la media
9.1 Distribucin muestral para la media de tamao n, con reemplazo
una poblacin constituida por un nmero N de elementos, cuya media aritmtica es
y donde la desviacin tpica viene dada , pueden formarse N2 muestras posibles. Para
cada una de estas muestras es posible una MEDIA MUESTRAL, que denotaremos con
el smbolo
En una distribucin muestral de las medias, la VARIABLE ALEATORIA
i
MEDIA MUESTRAL sigue una ley normal descrita como N (, /n).

62

Resumen de frmulas para la distribucin de muestreo para la media.


Extraccin
Con reemplazo

Sin reemplazo

Infinita

Poblacin

Finita (N)

Ej: 9

N n
N 1

Dado los elementos de la poblacin {1, 3, 5}, encuentre todas las medias muestrales
posibles de tamao 2, con reemplazo. Las medias aritmticas reflejadas, seran:
Medias muestrales de todas las muestras posibles de tamao 2, con reemplazo.
Muestra
Media
i

1,1
1

1,3
2

1, 5
3

3,1
2

3,3
3

3,5
4

5,1
3

5,3
4

5,5
5

A partir de la variable estadstica original de la poblacin se puede construir una nueva


variable estadstica i , que tendra como valores las medias de las muestras tomadas de la
poblacin. La media aritmtica de esta DISTRIBUCIN MUESTRAL DE LAS MEDIAS se
denota por x , y su desviacin tpica por x .

PARMETROS DE LA DISTRIBUCIN MUESTRAL DE LAS MEDIAS DE TAMAO 2


Distribucin de muestreo para la media de todas la muestras de tamao dos.
Media muestral
1
2
3
4
5
Total

Frecuencia
1
2
3
2
1
=9

Probabilidad
1/9
2/9
3/9
2/9
1/9
=1

Grfica de distribucin de muestreo de tamao 2.

probabilidad

0.33

0.22

0.11

Establecida una distribucin muestral de las medias de tamao 2, su ESPERANZA


MATEMTICA adopta el valor siguiente,

E ( x) x E ( x )

63

Siendo
la media aritmtica de la poblacin, la media aritmtica de cada muestra i , la
media aritmtica de todas las medias x , E (x) la esperanza matemtica de la variable
aleatoria X (para la poblacin) y E (x ) la esperanza matemtica de la variable aleatoria (para
la distribucin muestral de las medias).
Por su parte, los valores de la varianza y la desviacin tpica de esta distribucin muestral de
tamao 2 son:
V ( x) 2 ,
V (x) x ,
x
2
donde
es la desviacin tpica de la poblacin, x la desviacin tpica de la distribucin
muestral, V (x) la varianza de la variable x (poblacin) y V (x ) la varianza de la variable
(distribucin muestral de las medias).

Basado en el ejemplo 9, obtenemos:


Media muestral

x E( x )

1 2 3 2 ... 5 27

3
9
9

Desviacin estndar muestral

(1 3)2 (2 3)2 (3 3)2 ... (5 3)2


9

12
1,333333333
9

x 1,15154700538

Media Poblacional

1 3 5 9
3
3
3

Desviacin estndar poblacional

(1 3)2 (3 3)2 (5 3)2


3

8
2,666666667
3
1,63993162
2,666666667

1,632993162
2

x 1,154700538
Anlisis de la distribucin de muestreo para la media:
x
Se tiene que la media muestral y la poblacional son iguales a 3
La desviacin estndar poblacional es 1,6399 y la muestral es 1.1547. Es decir, que la
desviacin muestral es menor a la poblacional.
Las medias muestrales varan entre 1 y 5, mientras que los datos originales de la poblacin
van de 1, 3, y 5.
Se tiene que la distribucin de muestreo de los valores de las medias tiende a una
distribucin Normal.
NOTA: La diferencia de la DESVIACIN ESTNDAR describe la variabilidad de los valores
de una variable, en cambio el ERROR ESTNDAR describe la precisin del estadstico.
Adems, se cumple que x .

64

9.2 Distribucin muestral de las medias de tamao n, sin reemplazo


Dada una poblacin constituida por un nmero n de elementos, cuya media aritmtica es y
donde la desviacin tpica viene dada , pueden formarse NCn , se lee N combinaciones de n
para encontrar todas las muestras posibles.
Ej: 10 Auxilindonos del ejemplo 9. Dado los elementos de la poblacin {1, 3, 5}, encuentre
todas las medias muestrales posibles de tamao 2, sin reemplazo.
N = 3 ; n = 2, entonces, 3C2 = 3, se refiere al nmero total de muestras posibles y
sera;
Medias muestrales de todas las muestras de tamao 2 sin reemplazo.
Muestra
Media

xi

1, 3
2

1,5
3

3,5
4

Distribucin muestral para la media de todas la muestras de tamao 2 sin reemplazo.


Medias muestral
2
3
4
Total

Frecuencia
1
1
1
=3

Probabilidad
1/3
1/3
1/3
=1

Anlisis de la distribucin de muestreo para la media:


Se tiene que la media muestral y la poblacional son iguales a 3.
La desviacin estndar poblacional es 1,632993162 y la muestral se calcula de la siguiente
manera;

N n 1.632993162

N 1
2

3 2
0,816496581
3 1

Es decir, que la desviacin muestral es menor a la poblacional.


Las medias mustrales varan entre 2 y 4, mientras que los datos originales de la poblacin
van de 1, 3 y 5.
Se tiene que la distribucin de muestreo de los valores de las medias tiende a una
distribucin Normal.
10. Teorema de Lmite Central
El Teorema del Lmite Central consiste en un conjunto de resultados acerca del
comportamiento de las distribuciones muestrales, en l se afirma, bajo ciertas hiptesis,
que la distribucin de las medias de un nmero muy grande de muestras se aproxima a una
distribucin normal. El trmino Central, debido a Poly (1920), describe el rol que cumple
este teorema en la teora de la probabilidad. Grandes matemticos colaboraron para
desarrollar el teorema del lmite central, sin embargo Laplace ocupa un lugar fundamental:
a pesar de que nunca enunci formalmente este resultado, ni lo demostr rigurosamente, a
l le debemos este importante descubrimiento. "Para una poblacin con una media y una
varianza 2, la distribucin de las medias de todas las muestras posibles de tamao n
generadas de la poblacin estarn distribuidas de forma aproximadamente normal
asumiendo que el tamao de la muestra es suficientemente grande."

65

Con relacin al teorema del lmite central debemos enfatizar en:


Si el tamao de la muestra n, es suficientemente grande (n > 30) la distribucin muestral
de las medias ser aproximadamente normal. No importa si la poblacin es normal, sesgada
o uniforme, si la muestra es grande el teorema se aplicar.
La media de la poblacin y la media de todas las posibles muestras son iguales. Si la
poblacin es grande y un gran nmero de muestras son seleccionadas de esa poblacin
entonces la media de las medias muestrales se aproximar a la media poblacional.
La desviacin estndar de la distribucin muestral de las medias, a la que llamaremos error
estndar, es determinado por:

N n
N 1

ACTIVIDAD DE AUTOAPRENDIZAJE N 10
1.

Una empresa industrial tiene 5 trabajadores de produccin (considerados como la


poblacin) La retribucin (salario en horas) de cada empleado se presenta en seguida.
Trabajador
Nelson
Mara
Kevin
Sofa
Marcelo

Salario ($)
8
9
6
10
5

1.1 Cul es la media de la poblacin?

1.2 Cul es la distribucin muestral de medias para una muestra de tamao 2, sin

remplazo?

1.3 Cul es la media de la distribucin muestral y el error estndar de estimacin?

2. Hay cuatro representantes de ventas en Mid-Motors Ford. A continuacin se enlistan los


cuatro representantes y el nmero de automviles que vendieron la semana pasada.
Representante
de ventas
Ileana
Luis
Ramiro
Csar

Autos
vendidos
6
4
10
8

2.1 Cuntas muestras diferentes de tamao dos son posibles, con reemplazo?

66

2.2 Enliste todas las muestras posibles de tamao dos y calcule la media de cada

muestra.
2.3 Compare la media de las medias muestrales con la de la poblacin.
2.4 Calcule y x .

11. Estimaciones
11.1

Estimacin puntual
Estimar un parmetro es proponer un valor para el mismo a partir de la muestra; un
estimador del porcentaje poblacional sera la proporcin de dispositivos electrnicos
que presentan falla a este tipo de estimacin se le llama estimacin puntual. Es
bastante probable que el valor que se obtiene no sea realmente el valor del parmetro
en la poblacin.
Parmetro
Media ()
Desviacin Estndar ()
Proporcin (P)

Estimador

S
p

Ej: 11 Suponga que un ingeniero se interesa en probar el sesgamiento de un medidor


de pH. Se renen datos de una sustancia neutra (pH =7,0), se toma una muestra de las
mediciones y los resultados son:
7,07 7,00 7,10 6,97
6,98 7,08 7,08
7,04
11.1 Determine e interprete

11.2

y S.

Cul es la proporcin de mediciones con pH superior a 7,0?

11.2 Estimacin por intervalos


Una mejor alternativa es la estimacin por intervalos; se da con ella un rango de valores
que contendr el valor del parmetro con una cierta confianza o seguridad, que
habitualmente es del 95%. La afirmacin hecha mediante un intervalo de confianza,
es preferible a la hecha por estimacin puntual, ya que permite cuantificar la magnitud
del error asociado a la estimacin. Un concepto importante al realizar estimaciones es el
error estndar, que est relacionado con la calidad de la estimacin. Se ha
estudiado una muestra de 100 neonatos que tienen una media de peso de 3200 g y una
desviacin estndar de 80; si se estudia otra muestra de 100 se puede encontrar una
media de 3400 y una desviacin estndar de 97; en otra muestra se pueden encontrar
valores de 3100 y 92, respectivamente, etc., y as se podran estudiar muestras
diferentes hallando valores similares pero no iguales.

67

El error estndar mide la variabilidad entre las diferentes medias de las muestras; es
decir, mide la dispersin imaginaria que presentaran las distintas medias obtenidas en las
muestras estudiadas.
Se utilizarn frmulas diferentes segn se pretenda calcular el error estndar de una
media o el error estndar de una proporcin.
11.2.1 Intervalo de confianza para una media
De una poblacin de media y desviacin estndar o tpica () se pueden tomar
muestras de n elementos. Cada una de estas muestras tiene a su vez una media ( ). Se
puede demostrar que la media de todas las medias muestrales coincide con la media
poblacional:
Pero adems, si el tamao de las muestras es lo suficientemente grande, la distribucin
de medias muestrales es, prcticamente, una distribucin normal (o gaussiana) con
media y una desviacin tpica dada por la siguiente expresin:

Esto se representa como sigue:

Si estandarizamos:

En una distribucin Z ~ N (0, 1) puede calcularse fcilmente un intervalo dentro del cual caiga
un determinado porcentaje de las observaciones, esto es sencillo hallar

z1 y z2 tales que P[z1

z z2] = 1 - , donde (1 - )100% es el porcentaje deseado.


Se desea obtener una expresin tal que
En esta distribucin normal de medias se puede calcular el intervalo de confianza donde se
encontrar la media poblacional si slo se conoce una media muestral ( ), con una confianza
determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A

este valor se le llamar 1 (debido a que es el error que se cometer, un trmino opuesto).
Para ello se necesita calcular el punto X 2 o, mejor dicho, su versin estandarizada Z 2 o,
<<valor crtico>> junto con su "opuesto en la distribucin" X 2 Estos puntos delimitan la
probabilidad para el intervalo, como se muestra en la siguiente imagen:

Dicho punto es el nmero tal que:


Y en la versin estandarizada se cumple que:
Haciendo operaciones es posible despejar

z 2 z 2

As:

para obtener el intervalo:

De lo cual se obtendr el intervalo de confianza:

68

Obsrvese que el intervalo de confianza viene dado por la media muestral ( ) el producto
del valor crtico z 2 por el error estndar n .

Si se conoce N debe verificar la fraccin muestral n , luego aplique


N

N n
n
si
0.05 se omite e l FCF .
N

1
N
n

FCF

Si se conoce y n es grande (habitualmente se toma n 30). Aproximaciones para el valor

z 2 los niveles de confianza estndar son 1,96 para 1 = 95% y 2,575 para 1 = 99%.
En la siguiente tabla se detallan algunos niveles de confianza ms comunes:
Nivel de confianza (1 )
90%
95%
99%

Z/2

0,10
0,05
0,01

1,645
1,96
2,575

NOTA: Para un nivel de confianza del 90%, el valor se ubica en el cuerpo de la tabla y se
encuentra un valor aproximado o exacto del percentil de la distribucin Normal. Luego,
Z = 1.645.
2

Si no se conoce y n es grande (n 30)


desviacin tpica de una muestra.
Ej: 12

donde s es la

Se encuentra que la concentracin promedio de zinc que se extrae del agua a


partir de una muestra aleatoria en 36 sitios diferentes es de 2,6 gr por mililitro.
Encuentre e interprete un intervalo de confianza de 95% para la concentracin
media de zinc. Suponga que la desviacin estndar es 0,3.

x 2,6 gr
Uso de la
~ Normal

0,3

1 95% 0,05 0,025


2
z 2 1,96

Sustituyendo en la frmula ( x z x ) la informacin brindada,


2

Obtenemos:

0,3
2,6 1,96

36

2,6 0,098

2,502 2,698 gr

Es decir si se extraen muestras repetidas de tamao 36 del agua, se esperara que


aproximadamente el 95% de las veces la media estara contenida entre
2,502 2,698 gr y el 5% restante estar fuera de dicho intervalo.

69

Si no se conoce y n es pequea (habitualmente se toma n < 30)

( x t

, n 1

s
sx ) donde sx
n

N n
con n 1 gl
N 1

Ej: 13 El contenido de 7 envases similares de cido sulfrico son: 10,8


11,2
11,4
10,8
11,0
11,2
10,6 litros. Encuentre e interprete un intervalo de confianza
del 95% para la media de todos los envases, si se supone una distribucin
aproximadamente normal.

x 11 litros

Usar calculadora

s 0,282842712

Buscar en la ~ t de Student.

1 95% 0,05 0,025


2
gl n 1 7 1 6
t 0, 025, 6 2,45

Sustituimos en la frmula:

( x t

s )

, n 1 x

0,282842712
11 2,45

7

11 0,261916017 10,74 11,26 litros

Es decir si se extraen muestras repetidas de tamao 7 de los envases conteniendo


cido sulfrico, se esperara que aproximadamente el 95% de las veces la media
estara contenida 10,74 11,26 litros y el 5% restante estar fuera de dicho
intervalo.
11.2.2 Tamao de muestra para estimar
Con frecuencia deseamos saber que tan grande necesita ser una muestra para asegurar
que el error al estimar sea menor que una cantidad especfica e, esto significa que
deseamos conocer n de modo que z e . Al resolver esta ecuacin se obtiene la
n

siguiente frmula para n.

z
n 2
e

Procedimiento para calcular n


z
1. n 0 2
e

2. Si

n0
N

0,05 n n 0


Nn 0
0,05 n N n
0

70

Ej: 14 Qu tan grande se requiere una muestra del Ejemplo 12, si queremos tener 95%
de confianza que nuestra estimacin de difiere por ms o menos 0.05.
Uso de la
1 95% 0,05 0,025
2
~ Normal
z 2 1,96

0,3

e 0,05

Como no se conoce N, sustituimos en la frmula,


2
2
z
1,960,3
n = 139
n 2
138,2976
e
0
,
05

= 139
Con estas caractersticas se deben muestrear 139 sitios para el estudio.
Cuando se resuelve para el tamao de muestra, todos los valores fraccionarios se
redondean al siguiente nmero entero.
11.2.3 Intervalo de confianza para una proporcin
El intervalo de confianza para estimar una proporcin P, conocida una proporcin
muestral p de una muestra de tamao n, a un nivel de confianza del (1- )100% es:

P ( p z p ) donde

p (1 p )
x
y p
n
n

En la demostracin de estas frmulas est involucrado el Teorema Central de Lmite como una
aproximacin de una binomial por una normal.l
Ej: 15 Un fabricante de reproductores de discos compactos utiliza un conjunto de
pruebas para evaluar la funcin elctrica de su producto. Todos los reproductores
deben pasar las pruebas antes de venderse. Una muestra de 500 reproductores tiene
como resultado 15 que fallan en una o ms pruebas. Encuentre e interprete un intervalo
de confianza de 90% para la proporcin de los reproductores de discos compactos de la
poblacin que pasan todas las pruebas.

x : # de reproductores de DC que fallan en una o ms pruebas.


n 500
p
Uso de la
~ Normal

x 15 fallan 485 no fallan

485
0,97
500

1 0,90 0,10 0.05


2
z 2 1,645

Sustituyendo en la frmula: P ( p z p ) donde


2

0,97(0,03)

P 0,97 1,645

500

P 0,97 0,012549528

p (1 p )
x
y p
n
n

P 0,97 1,645(0,007628892)

P (0,957450471 ; 0,982549528)

Si se extraen muestras repetidas de tamao 500 de los reproductores DC, se espera


que aproximadamente el 90% de las veces la proporcin de reproductores de discos

71

compactos de la poblacin que pasan todas las pruebas est contenida entre el 95,75%
y el 98,25% y el 10% restante se ubica fuera de ese intervalo.
11.2.4 Tamao de muestra para estimar p
Determinemos que tan grande se requiere que sea una muestra para asegurar que el
error al estimar P sea menor que una cantidad e, esto significa que debemos
elegir n de modo que: z

p(1 p)
e . Al resolver esta ecuacin para n, obtenemos:
n

n0

z22 p(1 p)
e2

Procedimiento para calcular n

1. n0

2. Si

z2 p(1 p)
2

e2
0,05 n n0
n0

Nn0
N
0,05 n N (n 1)
0

NOTA: Si la proporcin de la poblacin no se conoce o bien no se cuenta con un valor estimado


de ste, se debe usar el valor de 0,5
Ej: 16

Se lleva a cabo un estudio para estimar el porcentaje de ciudadanos de una


comunidad que estn a favor de tener agua fluorada. Qu tan grande se requiere
que sea la muestra, si se desea tener una confianza de 95% y que nuestra
estimacin este dentro del 1% del porcentaje real?
Uso de la
1 95% 0,05 0,025
2
~ Normal
z 1,96

e 0,01
p 0,5

No se conoce N, sustituimos en la frmula n 0

z 22 p(1 p)
e2

(1,96) 2 (0,5)(0,5)
9 604
(0,01) 2

n 9 604

La muestra debe ser de 9604 ciudadanos para llevar a

cabo el estudio.

72

ACTIVIDAD DE AUTOAPRENDIZAJE N 11
1.

La asociacin de exalumnos de una universidad quiere estimar los salarios mensuales


promedios de los graduados en 2010. Una muestra aleatoria de 100 personas revel un
salario promedio de $850 con una desviacin estndar de $145. Establezca e
interprete una estimacin por intervalo con una confiabilidad del 90%, del salario
promedio mensual de los graduados en 2010.

2. Un fabricante produce anillos para los pistones de un motor de automvil. Se sabe que el
dimetro del anillo est distribuido aproximadamente normal, y que tiene una desviacin
estndar de 0,1 mm. Una muestra aleatoria de 45 anillos tiene un dimetro promedio de
74,6mm. Construya e interprete un intervalo de confianza del 95% para el dimetro
promedio del anillo.
3. Se sabe que la duracin, en horas, de un foco de 75 watts tiene una distribucin
aproximadamente normal, con una desviacin estndar de 25 horas. Se toma una muestra
aleatoria de 40 focos, la cual resulta tener una duracin promedio de 1 014 horas.
Construya e interprete un intervalo de confianza del 99% para la duracin promedio.
4. En el ejercicio # 3, Suponga que se desea una confianza del 95% en que el error en la
estimacin de la duracin sea de 5 horas. Qu tamao de muestra se necesita?
5. Un ingeniero analiza la resistencia a la compresin del concreto. La resistencia est
distribuida aproximadamente normal, con varianza

2 1 000( psi) 2 . Al tomar una

muestra aleatoria de 36 especmenes, se tiene que x 3 250 psi . Construya e interprete


un intervalo de confianza del 95% para la resistencia a la compresin promedio.
6. Suponga que en el ejercicio # 5, se desea estimar la resistencia a la compresin con un
error menor de 15 psi para un nivel de confianza de 95% Qu tamao de muestra debe
emplearse para este fin?
7. En los resultados del censo de poblacin y vivienda 2005, acerca de la cantidad total de
viviendas que conforman el distrito IV en Managua es de 29 920 y haciendo un supuesto
de que el 60% de las familias de ese distrito tiene casa propia con un margen de error del
4% y nivel de confianza del 90%. Cul es el tamao de muestra para la proporcin de
personas que tienen casa propia?
8. El gerente de control de calidad de una fbrica de lmparas elctricas desea estimar la
duracin promedio de un embarque de lmparas (focos). Los resultados indican que la
desviacin estndar del proceso es de 100 horas y el gerente desea estimar la duracin
promedio con aproximacin de 20 horas del promedio real con una confiabilidad del 95%.
Qu tamao de muestra se necesita?
9. Se va a vender un nuevo cereal para desayuno y se pone a prueba de mercado durante un mes
en las tiendas de una cadena de autoservicio, se desea estimar la suma promedio de venta

73

con aproximacin de $100 con un 95% de confianza y se supone que la desviacin estndar
es de $200. Qu tamao de muestra se necesita?
10. Un grupo de estudio quera estimar la facturacin mensual promedio por luz elctrica en el
mes de julio en casas unifamiliares en una ciudad. Con base en estudios efectuados en otras
ciudades, se supone que la desviacin estndar es de $20. El grupo quiere estimar la
facturacin promedio de julio con aproximacin de $5 del promedio real con un 95% de
confianza. Qu tamao de muestra se necesita?
11. El gerente de una sucursal bancaria en una ciudad quiere determinar la proporcin de su
cuenta habiente a los cuales se les paga el sueldo por semana, por experiencia previa en otras
reas se sabe que slo el 30% prefieren este sistema, si el gerente quiere tener 95% de
confianza de que esta en lo correcto con aproximacin de 0.05 de la proporcin de sus
clientes a quienes se les paga por semana. Qu tamao de muestra se necesita?
12. Se desea hacer una encuesta para determinar la proporcin de familias que carecen de
medios econmicos para atender los problemas de salud. Existe la impresin de que esta
proporcin est prxima a 0,35. Se requiere de una confianza del 95% con un error de
estimacin de 0,05. De qu tamao debe tomarse la muestra?
13. Determine el tamao de muestra que se requiere para estimar la proporcin verdadera de
los estudiantes de una universidad que tienen ojos azules, si se desea que la estimacin
tenga un error mximo de 0,02 y una confianza del 95%. Suponga que la poblacin
estudiantil es de 4 350.
14. Se desea realizar una encuesta entre la poblacin juvenil de una determinada localidad
para determinar la proporcin de jvenes que estaran a favor de una nueva zona de ocio. El
nmero de jvenes de dicha poblacin es N = 2 000. Determinar el tamao de muestra
necesario para estimar la proporcin de estudiantes que estn a favor con un error de
estimacin de 0,05 y un nivel de confianza del 95%.
15. En un proceso qumico se fabrica cierto polmero. Normalmente, se hacen mediciones de
viscosidad despus de cada corrida, y la experiencia acumulada indica que la variabilidad
en el proceso es muy estable. Las siguientes son 15 mediciones de viscosidad por corrida:
724
742

718
740

776
761

745
749

759
739

795
747

756
742

760

Encuentre e interprete un intervalo de confianza del 95% para la viscosidad media


del polmetro.
16. Una mquina produce las varillas de metal usadas en el sistema de suspensin de un
automvil. Se toma una muestra aleatoria de 12 varillas y se mide el dimetro (mm). Los
datos obtenidos aparecen abajo. Suponga que el dimetro de la varilla tiene una
distribucin normal. Construya e interprete un intervalo de confianza del 95% para el
dimetro promedio de la varilla.
8,24

8,23

8,20

8,21

8,20

8,28

8,23

8,25

8,19

8,25

8,26

8,23

74

17. Una lnea de autobuses piensa establecer una ruta desde un suburbio hasta el centro de la
ciudad. Se selecciona una muestra aleatoria de 50 posibles usuarios y 18 indicaron que
utilizaran esa ruta de autobuses. Establezca e interprete una estimacin del intervalo con
95% de confianza de la proporcin real de usuarios para esta nueva ruta de autobuses.
18. Un ingeniero hace pruebas con resistencia a la compresin del concreto. Para ello examina
12 especmenes y obtiene los siguientes datos.
2 212 2 237 2 249 2 204 2 225 2 301
2 281 2 263 2 318 2 255 2 275 2 295
Construya e interprete un intervalo de confianza del 99% para la resistencia promedio.
19. Un artculo publicado en Nuclear Ingineering Internacional describe varias caractersticas
de las varillas de combustibles utilizadas en un reactor propiedad de una empresa noruega
de electricidad. Las mediciones notificadas sobre el porcentaje de enriquecimiento de 12
varillas son las siguientes.
2,94

2,75

2,75

2,81

2,90

2,90

2,82

2,95

3,00

2,95

3,00

3,05

Encuentre e interprete un intervalo de confianza del 95% para el porcentaje promedio


de enriquecimiento.
20. Un artculo publicado en el Journal of Composite Materials describe el efecto de la
prdida de lminas sobre la frecuencia natural, de vigas formadas por varias lminas. Se
sujetaron cinco vigas con prdida de laminas a varias cargas, y las frecuencias resultantes
fueron las siguientes (en Hz)
230,66

233,05

232,58

229,48

232,58

Encuentre e interprete un intervalo de confianza del 95% para la frecuencia natural.


21. Los ingresos del impuesto sobre ventas en una comunidad particular se recaudan cada
trimestre. Los siguientes datos representan los ingresos (en miles de dlares) cobrados
durante el primer trimestre de una muestra de nueve establecimientos de menudeo de la
comunidad:
16
19
11
17
13
10
22 15
16
21.1 Establezca e interprete una estimacin por intervalo con un 99% de confianza, de

los ingresos trimestrales del impuesto sobre ventas en los establecimientos de


menudeo.
21.2 Si hay un total de 300 establecimientos de menudeo en esa comunidad, estime e
interprete un intervalo con un 95% de confianza de los ingresos trimestrales del
impuesto sobre ventas en los establecimientos de menudeo.

22. Se realiz una investigacin de mercadotecnia para estimar la proporcin de amas de casa que
pueden reconocer la marca de un producto de limpieza con base en la forma y color del
recipiente. De las 1 400 amas de casa consultadas, 420 fueron capaces de identificar la marca
del producto. Use un grado de confianza del 95% para determinar e interpretar en que
intervalo se encuentra la proporcin poblacional.

75

23. Un estudio muestral de 256 compaas industriales, determin que el 23% haban sealado a
sus empleados como la decada econmica a principios de 2008 afectara la organizacin.
Determine un intervalo de confianza de 95% para la proporcin de todas las compaas que
explicaran a sus empleados los efectos de la decada. Suponiendo que hay un total de 2 000
compaas.
24. El nmero de autos vendidos en Casa Pellas durante el primer semestre del 2012 fue de
800 automviles de diversas marcas, en una muestra de 400 automviles se observ que de
estos 47 eran de color Rojo.
24.1
Estime la proporcin de compradores que prefirieron automvil color Rojo.
24.2
Establezca el intervalo de confianza del 90% para la proporcin de compradores
que prefirieron el color Rojo e interprete los resultados.
25. Un auditor de una dependencia gubernamental de proteccin al consumidor quiere
determinar la proporcin de reclamos sobre plizas de enfermedades que paga la compaa
de seguros en un plazo de dos meses de haber recibido el reclamo. Se selecciona una
muestra de 200 reclamos y se determina que 80 fueron pagadas en un plazo de dos meses
despus de recibidos. Establezca e interprete una estimacin del intervalo con 99% de
confianza de la proporcin real de reclamos pagadas dentro de ese plazo de dos meses.
12. Prueba de hiptesis
La estadstica inferencial es el proceso de usar la informacin de una muestra para
describir el estado de una poblacin. Sin embargo es frecuente que usemos la informacin
de una muestra para probar un reclamo o conjetura sobre la poblacin. El reclamo o
conjetura se refiere a una hiptesis. El proceso que corrobora si la informacin de una
muestra sostiene o refuta el reclamo se llama prueba de hiptesis.
Hiptesis: Afirmacin acerca de los parmetros de la poblacin.
Al realizar pruebas de hiptesis, se parte de un valor supuesto (hipottico) de un parmetro
poblacional, despus de recolectar una muestra aleatoria, se compara la estadistica muestral (
), con el parmetro hipottico, de una supuesta media poblacional (). Luego se Rechaza o No
se rechaza el valor hipottico, segn proceda. Se rechaza el valor hipottico slo si el
resultado muestral resulta muy poco probable cuando la hiptesis es cierta. En el anlisis
estadstico se hace una aseveracin, es decir, se plantea una hiptesis, despus se hacen las
pruebas para verificar la aseveracin o para determinar que no es verdadera. Por tanto, la
prueba de hiptesis es un procedimiento basado en la evidencia muestral y la teora de
probabilidad; se emplea para determinar si la hiptesis es una afirmacin razonable.
Se realiza mediante un procedimiento sistemtico de cinco paso:

76

Siguiendo este procedimiento sistemtico, al llegar al paso cinco se puede o no rechazar la


hiptesis, pero debemos de tener cuidado con esta determinacin. Analizaremos cada paso en
detalle.
Objetivo de la prueba de hiptesis
El propsito de la prueba de hiptesis no es cuestionar el valor calculado del estadstico
(muestral), sino hacer un juicio con respecto a la diferencia entre el estadstico de muestra y
un valor planteado del parmetro.
Procedimiento sistemtico para una prueba de hiptesis de una muestra
PASO 1: Plantear la hiptesis nula H0 y la hiptesis alternativa H1
Cualquier investigacin estadstica implica la existencia de hiptesis o afirmaciones acerca de
las poblaciones que se estudian. La hiptesis nula (Ho) se refiere siempre a un valor especfico
del parmetro de poblacin, no a una estadstica de muestra. La letra H significa hiptesis y el
subndice cero no hay diferencia. Por lo general hay un "no" en la hiptesis nula que indica que
"no hay cambio" Podemos rechazar o no Ho, adems la hiptesis nula (H0) es una afirmacin que
no se rechaza a menos que los datos muestrales proporcionen evidencia convincente de que es
falsa. El planteamiento de la hiptesis nula siempre contiene un signo de igualdad con respecto
al valor especificado del parmetro.
La hiptesis alternativa (H1) es cualquier hiptesis que difiera de la hiptesis nula. Es una
afirmacin que no se rechaza si los datos muestrales proporcionan evidencia suficiente de que
la hiptesis nula es falsa. Se le conoce tambin como la hiptesis de investigacin. El
planteamiento de la hiptesis alternativa nunca contiene un signo de igualdad con respecto al
valor especificado del parmetro. Si queremos decidir entre dos hiptesis que afectan a un
cierto parmetro de la poblacin, a partir de la informacin de la muestra usaremos el
contraste de hiptesis, cuando optemos por una de estas dos hiptesis, hemos de conocer una
medida del error cometido, es decir, cuantas veces de cada cien nos equivocamos.
En resumen: Veremos cmo se escribiran las hiptesis que queremos contrastar,
H0 se llama hiptesis nula y es lo contrario de lo que sospechamos que va a ocurrir (suele
llevar los signos igual, mayor o igual o menor o igual)
H1 se llama hiptesis alternativa y es lo que sospechamos que va a ser cierto (suele llevar
los signos distinto, mayor o menor)
Los contrastes de hiptesis pueden ser de dos tipos:
Bilateral: En la hiptesis alternativa aparece el signo distinto.
Ej: 17
H0 : = 200
H1 : 200

/2

/2

Unilateral: En la hiptesis alternativa aparece el signo > o el signo <.


Ej: 18
H0 : 200
H0 : 200
H1 : < 200
H1 : > 200

77

PASO 2: Seleccionar el nivel de significancia


Nivel de significancia: Probabilidad de rechazar la hiptesis nula cuando es verdadera. Se le

denota mediante la letra griega (), tambin es denominada como nivel de riesgo, este trmino
es ms adecuado ya que se corre el riesgo de rechazar la hiptesis nula, cuando en realidad es
verdadera. Este nivel esta bajo el control de la persona que realiza la prueba.
Si suponemos que la hiptesis planteada es verdadera, entonces, el nivel de significacin
indicar la probabilidad de rechazar, es decir, est fuera del rea de No rechazo. El nivel de

confianza (1 - ), indica la probabilidad de No rechazar la hiptesis planteada, cuando es


verdadera en la poblacin. La distribucin de muestreo de la estadstica de prueba se divide en
dos regiones, una regin de rechazo (conocida como regin crtica) y una regin de no rechazo.
Si la estadstica de prueba cae dentro de la regin de No rechazo, no se puede rechazar la
hiptesis nula. La regin de rechazo puede considerarse como el conjunto de valores de la
estadstica de prueba que no tienen posibilidad de presentarse si la hiptesis nula es
verdadera. Por otro lado, estos valores no son tan improbables de presentarse si la hiptesis
nula es falsa. El valor crtico separa la regin de rechazo con la de no rechazo.
Tipos de errores
Cualquiera sea la decisin tomada a partir de una prueba de hiptesis, ya sea de No rechazo de
Ho, puede incurrirse en error.
Un error tipo I se presenta si la hiptesis nula Ho es rechazada cuando es verdadera y
deba No rechazarse. La probabilidad de cometer un error tipo I se denomina con la letra
alfa ().
Un error tipo II, se denota con la letra griega se presenta si la hiptesis nula No se
rechaza cuando de hecho es falsa y deba ser rechazada.

En cualquiera de los dos casos se comete un error al tomar una decisin equivocada. En la
siguiente tabla se muestran las decisiones que pueden tomar el investigador y las
consecuencias posibles.

Para que cualquier ensayo de hiptesis sea bueno, debe disearse de forma que minimice los
errores de decisin. En la prctica un tipo de error puede tener ms importancia que el otro, y
se tiene que poner una limitacin al error de mayor importancia. La nica forma de reducir
ambos tipos de errores es incrementar el tamao de la muestra, lo cual puede ser o no posible.
La probabilidad de cometer un error de tipo II denotada con la letra griega beta , depende
de la diferencia entre los valores supuesto y real del parmetro de la poblacin. Como es ms
fcil encontrar diferencias grandes, si la diferencia entre la estadstica de muestra y el
correspondiente parmetro de poblacin es grande, la probabilidad de cometer un error de
tipo II, probablemente sea pequea.

78

De los dos, el ms importante es alfa que llamaremos nivel de significacin y nos informa de la
probabilidad que tenemos de estar equivocados si aceptamos la hiptesis alternativa.
Debido a que los dos errores anteriores a la vez son imposibles de controlar, vamos a fijarnos
solamente en el nivel de significacin, este es el que nos interesa ya que la hiptesis alternativa
que estamos interesados en probar y no queremos aceptarla si en realidad no es cierta, es
decir, si aceptamos la hiptesis alternativa queremos equivocarnos con un margen de error muy
pequeo. El nivel de significacin lo marcamos nosotros. Si es grande es ms fcil No rechazar
la hiptesis alternativa cuando en realidad es falsa. El valor del nivel de significacin suele ser
un 5%, lo que significa que 5 de cada 100 veces No rechazamos la hiptesis alternativa cuando
la verdadera es la nula. El estudio y las conclusiones que obtengamos para una poblacin
cualquiera, se habrn apoyado exclusivamente en el anlisis de una parte de sta. De la
probabilidad con la que estemos dispuestos a asumir estos errores, depender, por ejemplo, el
tamao de la muestra requerida. Las contrastaciones se apoyan en que los datos de partida
siguen una distribucin normal, existe una relacin inversa entre la magnitud de los errores
y : conforme aumenta, disminuye. Esto obliga a establecer con cuidado el valor de

para

las pruebas estadsticas. Lo ideal sera establecer y . En la prctica se establece el nivel y


para disminuir el error se incrementa el nmero de observaciones en la muestra, pues as se
acortan los limites de confianza respecto a la hiptesis planteada. La meta de las pruebas
estadsticas es rechazar la hiptesis planteada. En otras palabras, es deseable aumentar
cuando sta es verdadera, o sea, incrementar lo que se llama poder de la prueba (1- ). La
aceptacin de la hiptesis planteada debe interpretarse como que la informacin aleatoria de
la muestra disponible no permite detectar la falsedad de esta hiptesis.
PASO 3: Clculo del estadstico de prueba
Valor determinado a partir de la informacin muestral, que se utiliza para determinar si se
rechaza la hiptesis nula, existen muchos estadsticos de prueba para nuestro caso
utilizaremos los estadsticos z o t. La eleccin de uno de estos depende de la cantidad de
muestras que se toman, si las muestras son iguales a 30 o ms se utiliza el estadstico z, en
caso contrario se utiliza el estadstico t.
En las pruebas de hiptesis para la media (), cuando se conoce la desviacin estndar ()
poblacional, o cuando el valor de la muestra es grande (30 o ms), el valor del estadstico de
prueba es z y se determina a partir de:
z

El valor del estadstico z, para muestra grande y desviacin estndar poblacional desconocida
se determina por la ecuacin:
x
z

s
n

En la prueba para una media poblacional con muestra pequea y desviacin estndar poblacional
desconocida se utiliza el valor del estadstico t.
t

x
con n 1 grados de libertad
s
n

79

Las pruebas de hiptesis a partir de proporciones se realizan casi en la misma forma utilizada
cuando nos referimos a las medias, cuando se cumplen las suposiciones necesarias para cada
caso. Pueden utilizarse pruebas unilaterales o bilaterales dependiendo de la situacin
particular. En tal caso el estadstico de prueba es.
z

x npo
npo (1 po )

PASO 4: Formular la regla de decisin


Se establecen las condiciones especficas en la que se rechaza la hiptesis nula y las
condiciones en que No se rechaza la hiptesis nula. La regin de rechazo define la ubicacin de
todos los valores que son tan grandes o tan pequeos, que la probabilidad de que se presenten
bajo la suposicin de que la hiptesis nula es verdadera, es muy remota.

Valor critico: Es el punto de divisin entre la regin en la que se rechaza la hiptesis nula y la
regin en la que No se rechaza.
Dado que ya se tiene la distribucin normal, los valores crticos se pueden expresar en
unidades de desviacin. Una regin de rechazo de 0.025 en cada cola de la distribucin
normal, da por resultado un rea de .475 entre la media hipottica y el valor crtico. Si se
busca est rea en la distribucin normal, se encuentra que los valores crticos que dividen
las regiones de rechazo y no rechazo son + 1,96 y 1,96
PASO 5: Tomar una decisin
En este ltimo paso de la prueba de hiptesis, el estadstico de prueba se compara con el valor
crtico y se toma la decisin de rechazar o no la hiptesis nula. Tenga presente que en una
prueba de hiptesis slo se puede tomar una de dos decisiones: Rechazar o No rechazar la
hiptesis nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hiptesis nula
cuando no debera haberse rechazado (error tipo I). Tambin existe la posibilidad de que la
hiptesis nula No se rechace cuando debera haberse Rechazado (error tipo II)
Valor p:
Es un planteamiento alternativo para la toma de una decisin de prueba de hiptesis.
Es la probabilidad de obtener una estadstica de prueba igual o ms exacta que el resultado
obtenido a partir de los datos de la muestra dado que la hiptesis nula, Ho, es realmente
verdadera.
A menudo el Valor p se conoce como nivel de significacin observado, que es el mnimo nivel al
cual Ho puede ser rechazado para un conjunto de datos.
El procedimiento compara el Valor p con el nivel de significacin .
Si el Valor p

Ho se Rechaza

Si el Valor p >

Ho no se Rechaza

80

Ej 19
Establezca las hiptesis nula y alterna.
19.1 En promedio, los estudiantes de una universidad viven a no ms de 15 km de la
misma.

H 0 : 15 km.
H 1 : 15 km.
19.2 El consumo promedio de combustible de un nuevo modelo de auto es de 25km/litro.

19.3 Ms del 65% de los empleados de un colegio aportan a Fondos Sociales.

H 0 : p 0,65
H 1 : p 0,65
19.4 Al menos un 60% de la poblacin adulta de una comunidad votar en las prximas
elecciones municipales.

19.5 Se reclama que al menos el 60% de las compras realizadas en cierta tienda por
departamentos son artculos especiales.

19.6 Una nueva marca de computadora dura en promedio ms de 3 aos.

19.7 Se observa que el 20% de los graduados de cierto colegio privado solicitan
admisin a escuelas de medicina.

19.8 El balance promedio de una cuenta de cheques en el First State Bank es de al


menos $150

81

Ej: 20 Determine si la prueba es de cola derecha, izquierda o ambas, con el nivel de


significancia = 0,05 encuentre el valor critico y dibuje la regin de rechazo.

H 0 : 11

20.1

Uso de la ~ Normal

H 1 : 11

0,05
z 1,645
z 1,645

H 0 : 5,8

20.2

H 1 : 5,8

20.3

H 0 : 110
H 1 : 110

20.4

H 0 : p 0,3
H 1 : p 0,3

Ej: 21 Determine el valor crtico con las caractersticas indicadas.


21.1

Para = 0,01 y n = 40

Si

= 0,01 z

z = 2,33

21.2

/2

21.3

/2

Para = 0,05 y n = 16

Para = 0,01 y n = 10

82

21.4

/2

/2

/2

/2

Para = 0,05 y n = 36

Ej: 22 Un fabricante de cierta marca de cereal de arroz afirma que el contenido


promedio de grasa saturada no excede de 1,5 gramos, con una desviacin estndar de
0,3 gramos. Se toma una muestra de 40 bolsas de cereal y se encuentra que el
contenido medio de grasa saturada es de 1,6 gramos. Pruebe la afirmacin del
fabricante con un nivel de significacin de 0,05. Determine el Valor p.

1.

o = 1,5 gramos.

= 0,3 gramos

x = 1,6 gramos

= 40 bolsas

= 0,05

Formulacin de las Hiptesis

H 0 : 1,5 gr

(El contenido promedio de grasa saturada no excede de 1,5 gr en la marca de cereal)

H 1 : 1,5 gr

(El contenido promedio de grasa saturada es superior a 1,5 gr en la marca de cereal)

2. Nivel de Significacin.

z 1,645

= 0,05

3. Calcular el Estadstico de Prueba

1,6 1,5
2,108185107
0,3
40

z Cal 2,11
4. Regla de Decisin
Observe que este valor z Cal 2,11 se ubica en la Regin de Rechazo, es decir, z Cal z
Por lo tanto Ho se Rechaza.
5. Toma de Decisin

Existe suficiente evidencia a un nivel de significacin de 0,05 que el contenido

promedio de grasa saturada en la marca de cereal de arroz es superior a 1,5 gramos.

Valor p
p P(z 2,11) 1 - P(z 2,11)
p 1 - 0,9826
p 0,0174
Como p 0,0174 0,05 Ho se Rechaza

z Cal 2,11

83

Ej: 23 En el departamento de personal de una compaa de telecomunicaciones se quiere


estimar los gastos familiares en odontologa de sus empleados. Para determinar la
factibilidad de proporcionarles un plan de seguro dental, el gerente del departamento
toma una muestra de 10 empleados y obtuvo la siguiente informacin de los gastos (en
dlares) durante el ao anterior.
110
362
246
85
510
208
173
425
179
316
Con un nivel de significacin de 0,01 Existe evidencia que le permita al gerente de
personal llegar a la conclusin de que los gastos dentales familiares de los empleados
sean diferente de $320? Determine el Valor p.

1.

n = 10 empleados
Con la calculadora
determine:

= 0,01

x $261,4

o = $320

s $138,8045789

Formulacin de las Hiptesis


H 0 : $320
(Los gastos dentales familiares de los empleados son de $320)
(Los gastos dentales familiares de los empleados son diferentes de $320)
H 1 : $320

2. Nivel de Significacin.
= 0,01

gl = n - 1 = 10 1 = 9

3.

0,005
t ( 2

, 9)

3,25

t ( 2 , 9) 3,25

t ( 2 , 9) 3,25

Calcular el Estadstico de Prueba


t

x
261,4 320

1,335038601
s
138,8045789
n
10

t Cal 1,34

4. Regla de Decisin
Observe que este valor t Cal 1,34 se ubica en la Regin de No Rechazo, es decir,
3,25 t Cal 1,34 3,25 . Por lo tanto Ho No se Rechaza.
5. Toma de Decisin

No Existe suficiente evidencia a un nivel de significacin de 0,01 que el gasto promedio


durante el ao pasado en odontologa sea diferente a $320.

Valor p

t Cal 1,34

El valor calculado de la estadstica de prueba es t Cal 1,34 . En la tabla de la distribucin t


de Student observamos que debido a la simetra, slo se muestran los valores crticos del
extremo superior. Pero si omitimos el signo con el propsito de usar la tabla, notamos que el
V.C. para un rea de extremo superior de 0,25 y 9 gl. es 0,7029 y para un rea de extremo
superior de 0,10 es 1,380; comot Cal 1,34 se ubica entre estos dos valores y podemos
establecer que el Valor p para esta prueba est entre 0,25 y 0,10 cada uno de estos valores

84

son mayores ( > ) que 0,01 el nivel escogido de significacin. Por lo tanto, la hiptesis nula,
Ho, No se Rechaza.
Ej: 24 El director de personal de una compaa de seguros est interesado en reducir
la tasa de movimientos de los oficinistas encargados en procesar datos durante su
primer ao de empleo. Registros anteriores indican que 25% del total de las nuevas
contrataciones de esta rea ya no se encuentran en la compaa al final del primer ao.
Se estn aplicando programas de entrenamiento extensivos a una muestra de 150
nuevos oficinistas encargados del procesamiento de datos. Al final de un periodo de un
ao, de los 150 individuos, 30 ya no se encuentran en la compaa. Al nivel de
significancia de 0,01 Existe evidencia de que la proporcin de oficinistas encargados
del procesamiento de datos que estuvieron en el nuevo programa de entrenamiento y
que ya no trabajan para la compaa es menor de 0,25? Calcule el Valor p.

1.

po = 25%.

n = 150 oficinistas

x = 30

= 0,01

Formulacin de las Hiptesis

H 0 : p 25%
H 1 : p 25%

(La proporcin de oficinistas encargados del procesamiento de datos y que ya no


trabajan para la compaa es por lo menos del 25%)
(La proporcin de oficinistas encargados del procesamiento de datos y que ya no
trabajan para la compaa es inferior al 25%)

2. Nivel de Significacin

= 0,01

z 2,33

3. Calcular el Estadstico de Prueba


z

x npo
npo (1 po )

30 150(0,25)

150(0,25)(1 0,25 )

7,5
1,414213562
28,125

z Cal 1,41

4. Regla de Decisin
Observe que este valor z Cal 1,41 se ubica en la Regin de No Rechazo, es decir,
z 2,33 zCal 1,41 Por lo tanto Ho No se Rechaza.
5. Toma de Decisin

No existe suficiente evidencia a un nivel de significacin de 0,01

que la proporcin de
oficinistas encargados del procesamiento de datos y que ya no trabajan para la
compaa sea inferior al 25%.

Valor p

p P(z 1,41) z(1,41)


p 0,0793

zCal 1,41

Como p 0,0793

0,01 Ho No se Rechaza

85

ACTIVIDAD DE AUTOAPRENDIZAJE N 12
1.

Se requiere que la tensin de ruptura de un hilo utilizado en la fabricacin de material de


tapicera sea al menos de 100 psi. La experiencia ha indicado que la desviacin estndar de
la tensin de ruptura es 6 psi. Se prueba una muestra aleatoria de 36 especmenes, y la
tensin de ruptura promedio observada es de 98 psi. Pruebe la hiptesis a un nivel de
significacin de 0,05. Determine el valor p.

2. Se sabe que el dimetro de los agujeros para una montura de cable tiene una desviacin
estndar de 0,01mm. Se obtiene una muestra aleatoria de 40 monturas, donde el dimetro
promedio resulta ser 1,5045mm. Pruebe la hiptesis que el dimetro promedio verdadero
del agujero es de 1,50mm, usando una significancia de 0.05. Cul es el valor de p en esta
prueba?
3. El Gerente de produccin de una Compaa manufacturera estima que la edad media de sus
empleados es 22,8 aos. El tesorero de la firma necesita una cifra de la edad media de los
empleados ms exacta, a fin de estimar el costo de una prestacin por antigedad que se
considera para los empleados. El tesorero toma una muestra aleatoria de 70 trabajadores y
observa que la edad media de los empleados muestreados es de 26,2 aos con una desviacin
estndar de 4,6 aos. Con un nivel de significacin del 1%. Qu puede concluir acerca de la
exactitud de la estimacin del Gerente de produccin?
4. La produccin diaria de una planta industrial qumica registrada durante 50 das, tiene una
media muestral de 871 toneladas y una desviacin estndar de 21kg. Pruebe la hiptesis de
que el promedio de la produccin diaria del producto qumico es de 880kg por da, contra la
alternativa de que es mayor o menor que 880 toneladas por da, usando una significacin del
5%.
5. Una muestra aleatoria de 6 observaciones de una poblacin normal, gener los siguientes
datos:
3,7
8,1
8,8
4,9
5,0
6,4
Proporcionan los datos suficiente evidencia que seale que < 7, a un nivel del 5%.
6. Tina Dennis es la jefa de contabilidad de Meck Industries (MI). Ella cree que los
problemas de flujo de efectivo en MI se deben a la cobranza lenta de cuentas pendientes.
Estima que ms de 60% de las cuentas estn en atraso ms de tres meses. Una muestra de
200 cuentas seal que 140 tenan ms de tres meses de antigedad. Al nivel de
significacin de 0,01. se puede concluir que ms de 60% de las cuentas estn en atraso
por ms de tres meses?
7. Experiencias en la Wills Travel Agency indica que 44% de las personas desean que esa
agencia planee unas vacaciones para viajar a Europa. Durante la temporada ms reciente,
una muestra de 1 000 fue seleccionada al azar de los archivos y se encontr que 480
queran ir a Europa de vacaciones. Ha sido un cambio significativo hacia arriba en el
porcentaje de personas que desean ir a Europa? Pruebe a un nivel del 5%.

86

8. Se analiza una marca particular de margarina diettica para determinar el nivel de cido
graso poliinsaturado (en porcentaje). Se toma una muestra de seis paquetes y se obtienen
los siguientes datos:
16,8
Pruebe la hiptesis

17,2

17,4

H 0 : 17,0

contra

16,9

16,5

17,1

H1 : 17,0 Utilice 0,05 Cules son

sus conclusiones? Cul es el valor de p en esta prueba?


9. Un ingeniero que trabaja para un fabricante de llantas investiga la duracin promedio de un
compuesto nuevo de caucho. Para ello, construye 16 llantas y las prueba en una carretera
hasta alcanzar el fin de la vida til de estas. Los datos, en Km., obtenidos son los
siguientes:
60 623 59 784 60 545 69 947 59 836 60 221 60 257 60 135
59 554

60 311

60 000

60 220

60 252

50 040

59 997

60 523

Al ingeniero le gustara demostrar que la vida til promedio de la nueva llanta excede los
60 mil km. Proponga y pruebe hiptesis apropiadas. Obtenga una conclusin con 0,05
Determine el valor p.
10. Se efecta una prueba de impacto Izod sobre 20 muestras de tubera PVC. El estndar
ASTM para este material requiere que la resistencia al impacto Izod sea mayor que 1.0 ftlbs/in. El promedio y la desviacin estndar muestrales son x 1,25 y s 0,25
respectivamente. Realice la prueba a un nivel de significacin de 0,01. Obtenga
conclusiones. Determine el valor p.

13. Prueba de Independencia


2
La estadstica desempea una funcin importante en muchos problemas en los que se
obtiene informacin a travs del conteo o la enumeracin y no por medio de la medicin. En
tal caso la prueba que se aplica se llama prueba de independencia de una tabla de
contingencia. Es decir, las clasificaciones entre dos caracteres (A y B) de los mismos
individuos en estudio, en la cual las r filas representan los niveles de caracter A y las
c columnas los niveles de caracter B.
El procedimiento para el desarrollo de una prueba es similar al abordado anteriormente, las
hiptesis se planteara de la siguiente manera:
H0: La categora A y la categora B son independientes (es decir, No hay relacin
entre ellas).
H1: La categora A y la categora B son dependientes (Hay relacin entre ellas).

El estadstico de prueba es,

2 i 1
k

( f0 fe )2
fe

con (r - 1)(c - 1) grados de libertad.

Donde, f 0 representa las frecuencias observadas y f e las frecuencias esperadas.

87

Las f e

se obtienen multiplicando el total de la fila a la cual pertenece por el total de la

columna al que pertenece dividiendo entre el gran total de la tabla.

fe

88

( filas )( columnas )
n

La regla de decisin es Rechazar Ho si,


suficiente evidencia para rechazar Ho

2
2
Cal
Tab

en caso contrario No existe

Ej: 25 En un experimento para estudiar la dependencia de la hipertensin con el hbito


de fumar, se tomaron los siguientes datos de 180 individuos.
Padece de
hipertensin?

No fumador

Si
No
Total

21 [33,35]
48 [35,65]
69

Tipo de fumador
Fumador moderado
35 [29,48]
26 [31,52]
61

Fumador
empedernido
31 [24,17]
19 [25,83]
50

Total
87
93
180

Pruebe la hiptesis que la presencia o ausencia de hipertensin es independiente a los


hbitos de fumar. Use un nivel de significancia de 0,01. Determine el Valor p
1.

Formulacin de las Hiptesis


Ho: No existe relacin entre la presencia o ausencia de hipertensin y los hbitos de
fumar.
H1: Existe relacin entre la presencia o ausencia de hipertensin y los hbitos de
fumar.

2. Nivel de Significacin

0,01

gl (2 1)(3 1) 2

02, 01, 2 9,21


3. Calcular el Estadstico de Prueba
f e1 1

(87)(69)
33,35
180

f e2 1

(93)(69)
35,65
180

2 i 1
k

f e1 2

(87)(61)
29,48
180

f e22

(93)(61)
31,52
180

f e13
f e23

(87)(50)
24,17
180
(93)(50)
25,83
180

( f 0 f e ) 2 (21 33,35) 2 (35 24,48) 2


(19 25,83) 2

.....
14,59...
fe
33,35
24,48
25,85

4. Regla de decisin
Como

2
Cal

2
Cal

se ubica en la regin de Rechazo, por consiguiente Ho se rechaza. Es decir,


(14,59 > 9,21)

2
Tab

5. Toma de decisin

Existe suficiente evidencia al nivel de significacin de 0,01 que nos muestre que hay
relacin entre la presencia o ausencia de hipertensin y los hbitos de fumar.

Valor p

2
P( 14,59) con 2 gl.

p 0,005 0,01 Ho se Rechaza.

ACTIVIDAD DE AUTOAPRENDIZAJE N 13
1.

Se efecta un estudio sobre las fallas de un componente electrnico. Existen cuatro tipos
de fallas posibles y dos posiciones de montaje para el dispositivo. Se toman los datos
siguientes:
Posicin de
montaje
1
2
Total

Tipo de falla
A
22
4

B
46
17

C
18
6

D
9
12

Total

Puede concluir que el tipo de falla es independiente de la posicin de montaje. Use

0,05 Determine el valor p.

2. Se realiza un anlisis de datos sobre el tipo de accidente, para determinar la distribucin


del nmero de accidentes automovilsticos segn el tamao del auto. Los datos para 346
accidentes son los siguientes,
Tipo de
accidente
Mortal
No mortal

Tamao del auto


Pequeo
67
128

Mediano
26
63

Grande
16
46

Total

Total

Indican los datos que el tipo de accidentes depende del tamao del automvil? = 0,10

89

3. Se entrevist a un grupo de 306 personas para determinar su opinin respecto a un tema


especfico de poltica exterior. Al mismo tiempo, se registr su afiliacin poltica. Los
datos son los siguientes:
De acuerdo con En desacuerdo con
la poltica
la poltica
Partido de gobierno
114
53
Oposicin
87
27
Total

No opinaron

Total

17
8

Presentan los datos suficiente evidencia que indique que hay relacin entre la afiliacin
poltica y la opinin expresada. Use un nivel de 0,05.
4. De un grupo de estudiantes se toman al mismo tiempo las calificaciones que estos obtienen
en un curso de Estadstica y en otro de Clculo. Los resultados son los siguientes:
Calificaciones
de estadstica
A
B
C
D

A
25
17
18
10

Calificaciones
B
6
16
4
8

de Clculo
C
17
15
18

D
13
6
10

11

20

Total

Total

Existe alguna relacin entre las calificaciones de los cursos de estadstica y Clculo?
0,05 Determine el valor p.
5. La directiva de una compaa est interesada en determinar si existe una asociacin entre
el tiempo de cambio de turno de sus empleados y el nivel de estrs relacionado con
problemas observados en el trabajo. En un estudio de 116 trabajadores de lnea de
ensamblaje se revel lo siguiente.
Tiempo de cambio
Menos de 15 min.
15 a 45 min.
Ms de 15 min.
Total

Alto
9
17
18

Estrs
Moderado
5
8
6

Bajo
18
28
7

Total

A un nivel de significancia de 0,01 Existe evidencia de que haya alguna relacin entre el
tiempo de cambio de turno y el estrs?

90

UNIDAD IV

REGRESIN Y CORRELACIN LINEAL SIMPLE

Introduccin
En la prctica es frecuente que se requiera resolver problemas que implican conjuntos de
variables de las cuales se sabe que tienen alguna relacin inherente entre s. Podra ser de
inters desarrollar un mtodo de pronstico, es decir, un procedimiento de entrada a partir de
informacin experimental.
1. Diagrama de dispersin
Diagrama que refleja la relacin entre dos variables.
Si X y Y denotan las dos variables, entonces un diagrama de dispersin muestra la
localizacin de los puntos (x, y) en un sistema de coordenadas rectangulares.
Definicin de las variables
Variable dependiente (Y)
Variable independiente (X)

Variable que se va a predecir o estimar.


Variable que proporciona la base para el clculo.

Ej: 1

Se dispone de una muestra de observaciones formadas por pares de variables: (x 1, y1),


(x2, y2), .., (xn, yn) A travs de esta muestra, se desea estudiar la relacin existente
entre las variables X e Y. Es posible representar estas observaciones mediante un
grfico de dispersin, como el siguiente:

Ej: 2

El gerente de una tienda de artculos informticos est considerando contratar a una


compaa de publicidad para estimular el negocio. Para lo cual investig el campo de la
publicidad y recolect los siguientes datos de la Cantidad de ganancia (Y) que logra la
compaa y la Cantidad gastada en publicidad (X). Los datos se muestran a
continuacin.
Cantidad en
publicidad
(cientos de $)
Ganancia
(en cientos de $)

3,6

4,8

9,7

12,6

10,8

18,2

10,0

16,6

12,2

14,4

22,6

28,4

27,6

40,2

25,8

34,5

Presente estos datos en un diagrama de dispersin.

91

2. Regresin Lineal
En primer lugar debemos realizar un grfico de dispersin como el del Ej. 2 y estudiar
visualmente si la relacin entre nuestra variable dependiente (Ganancia) y nuestra variable
independiente (Cantidad en publicidad) puede considerarse lineal. Por convenio, se coloca
la variable dependiente en el eje Y de las ordenadas y la variable independiente en el eje X
de las abscisas. Si no observamos un comportamiento lineal, debemos transformar la
variable dependiente o incluso replantearnos el tipo de anlisis, ya que es posible que la
relacin entre ambas variables en caso de existir, pueda no ser lineal. En nuestro ejemplo
2, si parece cumplirse una relacin lineal entre la Ganancia y la Cantidad en publicidad.

El objetivo de la regresin lineal simple es encontrar la mejor recta de ajuste entre todas
las posibles, dentro de la nube de puntos. La mejor recta de ajuste ser aquella que
minimice las distancias verticales entre cada punto y la recta, calculndose normalmente
por el mtodo de mnimos cuadrados. De este modo conseguiremos una
ecuacin para la recta de regresin de Y (variable dependiente) en funcin de X (variable

Y a bX En nuestro ejemplo, el problema radica en


a (constante de la recta) y b (pendiente de la recta) de modo que podamos

independiente) de la forma

estimar
construir la ecuacin o recta de regresin que minimice esas distancias.
Gananci a a b(Canti dad en publi ci dad)

Estimacin de la ecuacin de regresin muestral


Consiste en determinar los valores de "a" y "b " a partir de la muestra. El mtodo de
estimacin es el de Mnimos Cuadrados, mediante el cual se obtiene:

n X i Yi X i Yi
n X i2 X i

a Y bX

Luego, la ecuacin de regresin muestral estimada es:

Y a bX , que se interpreta:

a es una constante y es el valor estimado de la variable Y cuando la variable X = 0 ,


b es el coeficiente de regresin. Indica el nmero de unidades en que vara Y cuando se
produce un cambio, en una unidad, en X (pendiente de la recta de regresin). Un valor negativo
de b sera interpretado como la magnitud del decremento en Y por cada unidad de aumento en
X.

92

Ej: 3

En el supuesto de una relacin lineal, use el mtodo de los mnimos cuadrados para
determinar los coeficientes de regresin del ejemplo 2.

Realice los clculos necesarios o (use la calculadora Mode REG Lin)


X
3,6
4,8
9,7
12,.6
10,8
18,2
10,0
16,6
x = 86,3

Y
12,2
14,4
22,6
28,4
27,6
40,2
25,8
34,5
y = 205,7

XY

X2

Y2

xy = 2550,52

x2 = 1112,29

y2 = 5907,21

Sustituyendo en las frmulas correspondientes,


n X Y X Y 82550,52 86,3205,7
b

81112,29 86,3
n X X
i

2
i

20404,16 17751,91 2652,25

1,828343547
8898,32 7447,69
1450,63

b 1,83
a Y bX

205,7
86,3
1,828343547

8
8

a 25,7125 19,72325602 5,989243984

a 5,99

Por lo tanto la ecuacin ajustada de regresin es:


Y 5,99 1,83 X
El coeficiente estimado de regresin b se calcul en 1.83, lo que indica que por cada
incremento de una unidad en la Cantidad de publicidad (es decir por cada cien $), en
promedio la Ganancia del negocio aumenta en 1.83 cientos de dlares es decir en $183
aproximadamente. El valor de a se interpretara como el valor obtenido, en promedio,
para la Ganancia, cuando la Cantidad en publicidad es cero.
Estimacin de un valor esperado de Y para un valor de X.
Se utiliza la ecuacin de regresin para estimar o predecir valores de Y, dado algn valor de X.
Ej: 4 Cunto se espera que sea la Ganancia del negocio (en promedio), si se invirtieron
20.5 (cientos de $) en publicidad?

Sustituyendo el valor de inters en la ecuacin:

Y 5,99 1,83 X
(cientos de $) Es decir la Ganancia esperada
Y 5,99 1,83(20,5) 43,505
en el negocio es de $4350,5

93

1. Error estndar de la estimacin


Representa una medida de la variacin en torno a la recta ajustada de regresin y se mide
en unidades de la variable dependiente.
Frmula.

SYX
Ej: 5

a Yi b X iYi
n2

Calcule e interprete el error estndar de estimacin del Ejemplo 2.


SYX

5907,21 5,989243984(205,7) 1,828343547(2550,52)


6

S YX

11,995728347.6154
1,999288057 1,41396183
6

SYX 1,41396 (cientos de $)

Es decir si la Ganancia esperada en el negocio fue de $4350.5 cuando se invirtieron


$2050 con un error estndar de $141,40 aproximadamente.

2. Coeficiente de Correlacin
Es la herramienta estadstica que podemos usar para describir el grado en el que una
variable esta linealmente relacionada con otra. Al trabajar con dos variables cuantitativas
podemos estudiar la relacin que existe entre ellas mediante la correlacin y la regresin.
Aunque los clculos de ambas tcnicas pueden ser similares en algunos aspectos e incluso
dar resultados parecidos, no deben confundirse. En la correlacin tan solo medimos la
direccin y la fuerza de la asociacin de una variable frente a la otra, pero nunca una
relacin de causalidad. Slo cuando tenemos una variable que es causa o depende de otra,
podremos realizar una regresin. En esta unidad estudiaremos el coeficiente de correlacin
ms utilizado, como es el Coeficiente de Pearson. Abordamos un ejemplo de regresin lineal
simple y cmo se interpretan sus resultados.
El coeficiente de correlacin de Pearson (r) puede tomar valores entre -1 y +1, de modo
que un valor de r positivo nos indica que al aumentar el valor de una variable tambin
aumenta el valor de la otra (Figura 1A), y por el contrario, r ser negativo si al aumentar
el valor de una variable disminuye la otra (Figura 1B). La correlacin ser perfecta si r = 1,
en este caso los puntos formarn todos una recta. Es importante a priori determinar qu
valor de r vamos a considerar como relevante, puesto que una correlacin tan baja como r
= 0,07 sera significativa con un tamao muestral de unas 1000 personas. Adems es una
medida adimensional por lo que no posee unidades.
A

94

Frmula,

X Y
i

X Y
i

X 2
X i2 i
n

95

Y 2
Yi 2 i
n

Ej: 6 Determine e interprete el Coeficiente de Correlacin del Ejemplo 2.

Sustituimos en la frmula, los clculos correspondientes.


X Y
X Y n

X Y Y
X

n
n

2
i

2550,52 2218,98875

181,32875618,14875

86,3 5907,21 205,7 2


1112,29

8
8

86,3205,7

2550,52

i i

331,53125
112088,1402

331,53125
0,990249517
334,7956693

La cercana a +1 implica una asociacin fuerte entre la Ganancia (en cientos de $) y la


Cantidad en publicidad (en cientos de $) del negocio.

El clculo del coeficiente de correlacin de Pearson dio como resultado 0,9902,


indicando que la asociacin es positiva y por tanto valores altos en la Ganancia se
corresponden a su vez con valores altos en la Cantidad en publicidad. Sin embargo slo
con la correlacin no tendramos la suficiente informacin si quisiramos hacer
predicciones de los valores de la Ganancia en funcin de la Cantidad en publicidad del
negocio.
Coeficiente de Determinacin ( r 2 ) y No Determinacin (1 - r 2 )
Mide la proporcin de variacin que se explica con la variable independiente en el modelo.
En este ejemplo r (0,990249517) 0,980594107 0,9806
2

Significa que el 98.06% de la variacin en la Ganancia (en cientos de $) del


negocio se explica por la variabilidad en la Cantidad en publicidad (en cientos de $).
Slo el 1.94% de la variacin en la Ganancia se puede explicar por otros factores
ajenos a la Cantidad en publicidad tales como

3. Estimacin del Intervalo de Confianza de la media de Y (YX ) para un valor de X

Un examen de la ecuacin indica que el ancho del intervalo de confianza depende de varios
factores. Para un nivel dado de confianza, el aumento en la variacin alrededor de la recta
de regresin, medida con el error estndar de la estimacin, da por resultado un intervalo
ms ancho. Pero, como sera de esperar, el tamao aumentado de la muestra reduce el
ancho del intervalo. As, mismo, el ancho del intervalo vara tambin con diferentes valores

de X. Cuando se predice Y para los valores de X cercanos a


, el intervalo es mucho ms
estrecho que para las predicciones de valores de X ms distantes de la media.

Yi t

Ej: 7

,n2

S YX

X i

2
i

Encuentre una estimacin de intervalo con 95% de confianza, para la ganancia


promedio si se tuvo una inversin de $800 en publicidad.

Calculamos primero el valor de

Yi para X 8 (cientos de $)

Yi 5,99 1,83(8) 20,54


Con la tabla de la distribucin t de Student determinamos.
1 0,95 0,05

0,025

t 0,025;6 2,45

gl n 2 8 2 6

Sustituimos en la formula, los valores encontrados anteriormente.


Yi t

,n2

S YX

X i

2
i

1
(8 10,7875) 2
20,63 2,45.1.13
8
86,32

1112,29

20,63 1,069430734 20,63 1,07

1 7,77015625
20,63 2,451,13
8 181,32875

YX 20,63 1,07 YX 19,56 , 21,70

Por lo tanto se estima que la ganancia promedio estar entre $1956 y $2170

aproximadamente, si se invirtieron $800 en publicidad, con una confianza de 95%.

4. Inferencia acerca de los parmetros de Regresin y Correlacin.


Se puede determinar si existe o no relacin significativa entre las variables X y Y al probar
si 1 (la pendiente real) es o no igual a cero.
Mtodo 1:

Para la Pendiente 1

Estadstico de prueba t b1
S b1

donde

S YX

S b1

2
i

X
i

96

Mtodo 2: Estimacin del intervalo de confianza para: b1 t

Mtodo 3: Para la Correlacin


Estadstico de prueba t

,n 2

97

Sb1

r
1 r2
n2

Ej: 8 Con un nivel de significacin de 0,05. Hay relacin lineal entre las variables en
estudio? (Aplique los tres mtodos)

ACTIVIDAD DE AUTOAPRENDIZAJE N 14
1.

El gerente de marketing de una cadena de tiendas de autoservicio quiere determinar el


efecto del espacio en las estanteras, sobre las ventas de alimentos para animales
domsticos. Se seleccion una muestra aleatoria de 9 tiendas de igual tamao cuyos
resultados se muestran en seguida.
Espacio en estantera (m2)
Ventas semanales (miles de $)
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9

5
1,6

6
2,2

8
1,4

4
1,9

9
2,4

8
2,8

10
2,6

12
3,1

15
4,5

Identifique las variables.


Presente estos datos en un diagrama de dispersin.
En el supuesto de una relacin lineal, use el mtodo de los mnimos cuadrados para
estimar los coeficientes de regresin e interprtelos.
Prediga las ventas semanales (en miles de $) de alimentos para animales
domsticos para una tienda con 7m2 de estantera para esos alimentos.
Calcule e interprete el coeficiente de correlacin, determinacin y no
determinacin.
Calcule e interprete el error estndar de la estimacin.
Encuentre una estimacin de intervalo con 95% de confianza en las ventas
semanales promedio de una tienda que tiene 8m2 de estantera.
Con un nivel de significacin de 0,05. Hay una relacin lineal entre el espacio en
estantera y las ventas?

2. El gerente de personal de una empresa considera que puede haber una relacin entre el
ausentismo y la edad, y desea usar la edad de un empleado para predecir el nmero de das
de ausencia durante un ao calendario. Para lo cual seleccion una muestra aleatoria de 10
empleados, con los resultados que se muestran a continuacin.
Edad
Das ausentes

27
15

61
6

37
10

23
18

46
9

29
14

36
11

64
5

40
8

50
9

2.1 Identifique las variables.

2.2 Presente estos datos en un diagrama de dispersin.

2.3 En el supuesto de una relacin lineal, use el mtodo de los mnimos cuadrados para

estimar los coeficientes de regresin e interprtelos.

2.4 Cuntos das en promedio predecira usted que va a estar ausente un empleado de
2.5
2.6
2.7
2.8

45 aos de edad?
Calcule e interprete el coeficiente de correlacin, determinacin y no
determinacin.
Calcule e interprete el error estndar de la estimacin.
Encuentre una estimacin de intervalo con 95% de confianza del promedio de das
de ausencia de un empleado de 40 aos de edad.
Con un nivel de significacin de 0,05. Hay una relacin lineal entre la edad y el
ausentismo?

3. El contralor de una cadena de tiendas de departamentos quiere predecir el saldo de las


cuentas al final del perodo de facturacin con base en el nmero de transacciones
efectuadas durante el perodo de facturacin. Se seleccion una muestra aleatoria de 12
cuentas, con los resultados dados a continuacin.
N de transacciones
Saldo de la cuenta ($)

1
15

2
36

3
40

4
69

5
78

6
84

5
75

7
100

8
175

9
120

11
150

12
198

3.1 Identifique las variables.

3.2 Presente estos datos en un diagrama de dispersin.

3.3 En el supuesto de una relacin lineal, use el mtodo de los mnimos cuadrados para

estimar los coeficientes de regresin e interprtelos.

3.4 Prediga el saldo de la cuenta, para una cuenta que ha tenido 5 transacciones en el

ltimo periodo de facturacin.

3.5 Calcule e interprete el coeficiente de correlacin, determinacin y no

determinacin.

3.6 Calcule e interprete el error estndar de la estimacin.

3.7 Encuentre una estimacin de intervalo con 95% de confianza del saldo promedio de

una cuenta en la cual hubo cinco transacciones en el ltimo periodo de facturacin.


3.8 Con un nivel de significacin de 0,05. Hay una relacin lineal entre el nmero de
transacciones y el saldo de la cuenta?

98

4. Una mujer desea abrir una pequea tienda de ropa. Antes de seleccionar un local, le
gustara poder pronosticar la utilidad (en dlares) que se puede esperar que logre la tienda
por metro cuadrado de exhibicin y venta. Ella recolecta la siguiente informacin de otros
propietarios de tiendas comparables.
Tamao de la tienda (cientos de m2)
Utilidad (miles de $)

35
20

22
15

27
17

16
9

28
16

12
7

40
22

32
23

Identifique las variables.


Presente estos datos en un diagrama de dispersin.
4.3
En el supuesto de una regresin lineal, utilice el mtodo de mnimos cuadrados para
encontrar e interprete los coeficientes de regresin a y b . Cul es la
ecuacin de regresin estimada?
4.4
Dibuje en el diagrama de dispersin la ecuacin de la recta estimada.
4.5
Calcule e interprete el coeficiente de correlacin, determinacin y no
determinacin.
4.6
Qu utilidad espera percibir de una tienda de tamao 1 500m2?
4.7
Qu porcentaje de la variacin total en las utilidades se atribuye a diferencias en
el tamao variable de las tiendas?
4.8
Calcule e interprete el error estndar de la estimacin.
4.9
Encuentre una estimacin de intervalo con 95% de confianza para la utilidad
promedio si se tiene una tienda de 1 500m2.
4.10 Con un nivel de significacin de 0,05. Hay una relacin lineal entre el tamao de la
tienda y la utilidad?
4.1
4.2

Guas de laboratorio
Introduccin
El software PASW Statistics 18 es un programa que posee las herramientas necesarias para
realizar los anlisis estadsticos ms frecuentes, tanto en un saln de clase como en el mbito
profesional. A travs de este programa es posible la descripcin y tabulacin de datos, la
realizacin de pruebas de hiptesis, el anlisis de correlacin y regresin entre otros.
Para realizar la prctica de laboratorio supongamos que se aplicaron las siguientes encuestas a
una muestra aleatoria simple de 16 trabajadores de una pequea empresa.
ENCUESTAS.
I

EDAD: 37
SEXO: 1.
M
2. F
SALARIO EN C$ 3 250
REA DE TRABAJO: 1. Produccin
2. Recursos Humanos
3. Finanzas
4.
Servicios Generales
QUE LUGARES VISTAS LOS FINES DE SEMANA:
1. Cines
2. Restaurantes
3. Bares
4.
Parques
5. Centros Comerciales

99

II

III

EDAD: 30
SEXO: 1. M
2.
F
SALARIO EN C$ 4 600
REA DE TRABAJO: 1. Produccin
2. Recursos Humanos
3.
Finanzas
4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines
2.
Restaurantes
3. Bares
4. Parques
5. Centros Comerciales
EDAD: 27
SEXO: 1. M
2.
F
SALARIO EN C$ 5 205
REA DE TRABAJO: 1. Produccin
2.
Recursos Humanos
3. Finanzas
4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1.
Cines
2.
Restaurantes
3.
4. Parques
5. Centros Comerciales

Bares

IV

EDAD: 21
SEXO: 1.
M
2. F
SALARIO EN C$ 3 000
REA DE TRABAJO: 1. Produccin
2. Recursos Humanos
3. Finanzas
4.
Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1.
Cines
2. Restaurantes
3. Bares
4.
Parques
5.
Centros Comerciales

EDAD: 25
SEXO: 1.
M
2. F
SALARIO EN C$ 4 650
REA DE TRABAJO: 1.
Produccin
3. Finanzas
QUE LUGARES VISITAS LOS FINES DE
1.
Cines
4. Parques

VI

VII

2. Recursos Humanos
4. Servicios Generales
SEMANA:
2. Restaurantes
3. Bares
5.
Centros Comerciales

EDAD: 42
SEXO: 1. M
2.
F
SALARIO EN C$ 6 800
REA DE TRABAJO: 1. Produccin
2. Recursos Humanos
3.
Finanzas
4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines
2.
Restaurantes
3.
4. Parques
5. Centros Comerciales
EDAD: 31
SEXO: 1.
M
2. F
SALARIO EN C$ 4 350
REA DE TRABAJO: 1.
Produccin
3. Finanzas

2. Recursos Humanos
4. Servicios Generales

Bares

100

VIII

IX

XI

XII

XIII

QUE LUGARES VISITAS LOS FINES DE


1. Cines
4. Parques
EDAD: 26
SEXO: 1. M
2.
F
SALARIO EN C$ 3 250
REA DE TRABAJO: 1.
Produccin
3. Finanzas
QUE LUGARES VISITAS LOS FINES DE
1. Cines
4.
Parques
EDAD: 30
SEXO: 1.
M
2. F
SALARIO EN C$ 5 100
REA DE TRABAJO: 1. Produccin
3. Finanzas
QUE LUGARES VISITAS LOS FINES DE
1. Cines
4. Parques
EDAD: 22
SEXO: 1. M
2.
F
SALARIO EN C$ 3 650
REA DE TRABAJO: 1.
Produccin
3. Finanzas
QUE LUGARES VISITAS LOS FINES DE
1. Cines
4. Parques
EDAD: 37
SEXO: 1.
M
2. F
SALARIO EN C$ 6 300
REA DE TRABAJO: 1. Produccin
3.
Finanzas
QUE LUGARES VISITAS LOS FINES DE
1. Cines
4. Parques
EDAD: 51
SEXO: 1.
M
2. F
SALARIO EN C$ 4 850
REA DE TRABAJO: 1.
Produccin
3. Finanzas
QUE LUGARES VISITAS LOS FINES DE
1. Cines
4.
Parques
EDAD: 47
SEXO: 1. M
2.
F
SALARIO EN C$ 3 250

SEMANA:
2.
Restaurantes
3.
5. Centros Comerciales

Bares

2. Recursos Humanos
4. Servicios Generales
SEMANA:
2. Restaurantes
3. Bares
5.
Centros Comerciales

2.
Recursos Humanos
4. Servicios Generales
SEMANA:
2. Restaurantes
3. Bares
5.
Centros Comerciales

2. Recursos Humanos
4. Servicios Generales
SEMANA:
2.
Restaurantes
3. Bares
5.
Centros Comerciales

2. Recursos Humanos
4. Servicios Generales
SEMANA
2.
Restaurantes
3. Bares
5.
Centros Comerciales

2. Recursos Humanos
4. Servicios Generales
SEMANA:
2. Restaurantes
3. Bares
5.
Centros Comerciales

101

REA DE TRABAJO: 1.
Produccin
2. Recursos Humanos
3. Finanzas
4. Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1. Cines
2.
Restaurantes
3. Bares
4. Parques
5.
Centros Comerciales
XIV

XV

XVI

EDAD: 23
SEXO: 1. M
2.
F
SALARIO EN C$ 2 500
REA DE TRABAJO: 1.
Produccin
3. Finanzas
QUE LUGARES VISITAS LOS FINES DE
1.
Cines
4. Parques

2. Recursos Humanos
4. Servicios Generales
SEMANA:
2. Restaurantes
3. Bares
5.
Centros Comerciales

EDAD: 31
SEXO: 1. M
2.
F
SALARIO EN C$ 5 400
REA DE TRABAJO: 1. Produccin
2. Recursos Humanos
3. Finanzas
4.
Servicios Generales
QUE LUGARES VISITAS LOS FINES DE SEMANA:
1.
Cines
2. Restaurantes
3.
4. Parques
5.
Centros Comerciales
EDAD: 29
SEXO: 1. M
2.
F
SALARIO EN C$ 4 600
REA DE TRABAJO: 1.
Produccin
3. Finanzas
QUE LUGARES VISITAS LOS FINES DE
1. Cines
4.
Parques

Bares

2. Recursos Humanos
4. Servicios Generales
SEMANA:
2. Restaurantes
3. Bares
5.
Centros Comerciales

INTRODUCCIN DE LOS RESULTADOS DE LA ENCUESTA


Para entrar en el programa: Inicio, Programas PASW Statistics 18. Use el Icono
o mire si en el escritorio est el acceso directo.
Al entrar en el programa obtendr la siguiente vista. Observe que abajo hay dos pestaas

Para definir las variables entre en la


segunda pestaa:.

Vista de variables

Ubquese en la primera lnea, donde va a definir la informacin de la primera variable Edad.

102

En la primera opcin Nombre tiene que dar nombre a su variable, tomando


en cuenta lo siguiente:

No se puede usar espacio vaco, ni los smbolos siguientes: , . - : ;? !


Puede usar letras maysculas o minsculas, no habr error, pero el programa al final

siempre dejar el nombre en minsculas.


Al entrar en la opcin Tipo aparece en la parte derecha un cuadrito gris con tres puntos ,
De clic en este cuadro y aparece lo siguiente:
Vamos a usar el tipo de variable numrica. Aunque la
variable sea cualitativa, tambin usaremos numrica
porque los valores que ella puede tomar vamos a
codificar con 1, 2,, si los valores de variable no tienen
decimales en el lugar de decimal escriba 0. Si es una
variable cuyos valores quiere denotar con letras, use
(Cadena).
Coma: Se usa como separador de miles y como separador de decimales punto.
Punto: Se usa como separador de miles y como separador de decimales coma.

Las siguientes celdas son


indica la cantidad de caracteres que se
necesitarn para definir los valores de la variable y nmeros decimales que ya lo habamos
escrito en el cuadro anterior. (Vea cuadro anterior en la parte derecha.)
Etiqueta: en esta casilla se indica la etiqueta de variable, a diferencia del nombre, se
puede poner cualquier carcter y la cantidad de los caracteres no es restringida.

En el caso de la variable edad etiqueta y nombre sern iguales.

La siguiente columna es Valores.

Si das clic en el cuadrito gris aparecer el siguiente cuadro de dilogo, la


variable edad es cuantitativa no vamos a poner nada en ste, lo usaremos
en el caso de las variables cualitativas.
Para introducir la segunda variable Sexo usamos las mismas opciones,
obtenemos lo siguiente:

En el caso de variables cualitativas, en opcin Valores debemos definir los


valores de la variable.
Observe en el siguiente cuadro, que en Valor escribimos 1 (es el cdigo
que asignaremos al sexo masculino) y en la parte Etiqueta de valor

103

escribimos Masculino. Posteriormente dar Aadir. De igual manera se digita el valor 2 con la
etiqueta de Femenino.
Si desea corregir algo en los valores introducidos, seleccione el valor, corrija y seleccione
opcin Cambiar. Cuando termine de introducir todos los valores dar Aceptar.
De la misma manera introduzca las variables: Salario y rea de Trabajo.

Insertar nueva variable


Es recomendable tener como variable: Nmero de la encuesta
Ubquese en la primera columna y Seleccione en el Men: Edicin, Insertar
variable. Se agregar una nueva columna. Posteriormente demos como
nombre de la variable nmero y en etiqueta Nmero de encuesta. As
antes de introducir los resultados de la encuesta ponemos nmero a la
misma.
La pregunta Qu lugares visitas los fines de semana? tiene
mltiples opciones de seleccin. En este caso en la base de datos se introduce tantas variables
cuantas opciones hay:
Cines
Restaurantes
Bares
Parques
Centros Comerciales.
En valores 0 representa No y 1 representa Si
Al final obtenemos.

En seguida seleccionamos la pestaa Vista de datos


y empezamos a introducir los resultados de la encuesta.
En la primera lnea escribimos los resultados de la primera encuesta para cada una de las
variables

104

Observe lo siguiente: cuando el icono Etiqueta de valor est desactivado


aparecen valores de las variables y si est activado aparecen las etiquetas.

105

Al terminar de introducir los resultados de las encuestas obtenemos la siguiente vista:

PROCESAMIENTO DE DATOS: CUADROS Y GRFICOS


Para obtener cuadros de frecuencia de una variable y los grficos
realizamos los siguientes pasos: Analizar, Estadsticos

descriptivos, Frecuencias.
Aparece el cuadro de dilogo:

Seleccione en la parte izquierda la variable


Sexo y dar clic en la flecha del centro,
arrastre esta variable a la derecha.
Despus entre en la opcin Grficos
seleccione Grfico de barra,
Porcentajes y dar clic en Continuar,

Aceptar.
Obtenemos la tabla de frecuencia y el grfico de la variable. Puede modificar los resultados
dando doble clic derecho sobre sta. La tabla puede copiar como objeto y pasar a WORD.
Sexo de los trabajadores.
Frecuencia
Vlidos

Masculino
Femenino
Total

Porcentaje
43.8

Porcentaje
vlido

Porcentaje
acumulado

43.8

43.8
100.0

56.3

56.3

16

100.0

100.0

El grfico que resulta es el siguiente:

106

Para modificar el grfico dar doble clic sobre ste, se abre la


ventana Editor de grficos. Si desea cambiar las barras (su
color, dimensin,) tiene que dar doble clic sobre las barras y se
abre siguiente cuadro:
En opcin Relleno y borde puede cambiar colores. En Profundidad y
ngulo puede elegir grfico en tres dimensiones.
Si desea solamente cambiar los colores de las barras, tiene que
seleccionar las barras una por una y elegir el color en la parte
sealada con flecha:

Al seleccionar todas las barras juntas y dar clic derecho


aparece el cuadro, donde pueden seleccionar Mostrar

etiquetas de datos.
Tambin puede Transponer el Grfico. Al terminar el uso
de Editor de grficos debe cerrar esta ventana. Despus
de haber modificado el grfico el resultado es:

Para procesar la variable rea de trabajo, realice los siguientes pasos, solo que en opcin

Grficos seleccione Grfico de sectores con Porcentajes.


La modificacin de este grfico es similar al anterior.
Antes de modificar
Despus de modificar

107

PROCESAMIENTO DE VARIABLE CUANTITATIVA


Vamos a procesar la variable Edad. Los pasos son los mismos

Analizar, Estadsticos descriptivos, Frecuencias.


Pero, adems, entramos en la opcin Estadsticos y activamos
todas las opciones que aparecen en la figura siguiente. Despus
dar Continuar y en la opcin Grficos activamos el diagrama de
barras de porcentaje. Aceptar.
Como resultado se obtiene la tabla de distribucin de frecuencia, grficos (los cuales ya sabe
como modificar), adems aparece el cuadro Estadsticos. En este cuadro estn todas las
medidas que usted solicit. Si observa la tabla de frecuencia y el grfico, puede ver que
presentar de esta manera en el informe no es muy adecuado, lo mejor es agrupar estos datos.
Estadsticos
Edad de los trabajadores.

Ed ades

Vlidos

Frecuencia
1
1
1
1
1
1
1
2
2
2
1
1
1
16

21
22
23
25
26
27
29
30
31
37
42
47
51
Total

Porcentaje
6,3
6,3
6,3
6,3
6,3
6,3
6,3
12,5
12,5
12,5
6,3
6,3
6,3
100,0

Porcentaje
acumulado
6,3
12,5
18,8
25,0
31,3
37,5
43,8
56,3
68,8
81,3
87,5
93,8
100,0

Vlidos
Perdidos

0
31.81

Mediana

30.00

Moda

30a

Desv. tp.

8.818

Varianza

77.763

Rango

30

Mnimo

21

Percentiles 70

12

16

Media

Mximo

Edades

51
36.40

a. Existen varias modas. Se mostrar

10

Porcentaje

Porcentaje
v lido
6,3
6,3
6,3
6,3
6,3
6,3
6,3
12,5
12,5
12,5
6,3
6,3
6,3
100,0

el menor de los valores.

0
21

22

23

25

26

27

29

Edades

30

31

37

42

47

51

Para esto primero diseamos los intervalos de clase manualmente en una hoja de
papel. Realizamos los siguientes clculos:
R= 30 (vea la tabla Estadsticos);
El ancho calculado nos dio 6, pero podemos variar un poco, dejemos el ancho 5 y
empezamos con el dato 20 (dato mnimo es 21) para que los intervalos de clase
quede bonitos.
Vamos a recodificar los datos de las edades con estos intervalos de clase.
Realice los siguientes pasos:

20-24
25-29
30-34
35-39
40-44
45-49
50-54

Transformar, Recodificar en distintas variables


Seleccione la variable que se desea recodificar y pase a la derecha, en el
cuadro de Nombre escribe el nuevo nombre de la variable por ejemplo
edad_ag (edades agrupadas), en Etiqueta escriba Edades de los
trabajadores, pulse Cambiar.

Posteriormente entre en opcin Valores antiguos y nuevos


Obtiene nuevo cuadro de dilogo. En la parte izquierda active la
posicin Rango ubique en estos espacios los lmites del primer
intervalo 20 -24 y en la parte derecha en opcin Valor ubique 1
(es el primer intervalo de clase), despus de Aadir. As
sucesivamente se van introduciendo todos los intervalos de
clase. Continuar y Aceptar.
En la base de datos se agregar una nueva variable, tiene que
dar etiquetas a los valores para esta variable. Al final la base de datos quedar as:
Despus de esto puede, crear la tabla de frecuencia y el grfico de los datos agrupados
de la edad.
Edades de los alumnos

Valid

20-24
25-29
30-34
35-39
40-44
45-49
50-54
Total

Frequency
3
4
4
2
1
1
1
16

Percent
18.8
25.0
25.0
12.5
6.3
6.3
6.3
100.0

Valid Percent
18.8
25.0
25.0
12.5
6.3
6.3
6.3
100.0

Cumulativ e
Percent
18.8
43.8
68.8
81.3
87.5
93.8
100.0

108

OTRA OPCIN PARA RECODIFICAR VARIABLES NUMRICAS


Vamos a recodificar la variable Edad
Entrar en Opcin: Transformar, Agrupacin visual.

En el cuadro de dilogo que aparece, seleccione la


variable Edad y dando clic en la flecha, pase esta
variable a la parte derecha. Posteriormente dar clic en Continuar.
En el nuevo cuadro de dilogo,
en la parte de Nombre de
Variable agrupada se puede
repetir el mismo nombre de la
variable

que

recodificar,

se

desea

agregando

a
una

letra A, de Agrupada (EdadA).


Recuerde que no se puede
tener dos variables con el
mismo nombre. En el cuadro se
muestra

informacin

de

mnimo y mximo valores que


toma la variable. (21 y 51).
Podemos agrupar la variable edad por dcadas, de 20 a 29, de 30 a 39,.
A continuacin pulse opcin Crear puntos de corte.
En esta opcin aparecen tres espacios: Posicin del primer punto de corte, Nmero de puntos
de corte, Anchura.

109

En el espacio de Posicin del primer punto


de corte escribe el valor anterior al lmite
inferior de su primera clase. La primera
clase empieza en 20, entonces escribe 19.
En el espacio de Anchura escribe 10, ya que
decidimos que las clases van a tener el
ancho 10. A continuacin solamente d clic
en espacio de Nmero de puntos de corte,
el sistema automticamente ubica el valor
correspondiente. Despus pulse Aplicar.

En el siguiente cuadro pulse Crear etiquetas y Aceptar.


El sistema muestra un cuadro, anunciando que se crear una nueva variable en la base de datos,
pulsa Aceptar.

Pueden revisar que en su base de datos


aparece una variable ms, la edad
recodificada,

observan

que

esta

variable tiene medida Ordinal y todas


sus etiquetas. Pueden hacer una tabla
de frecuencia y un grfico con esta
variable agrupada, recuerde que los
estadsticos deben ser calculados con la variable original.

110

PROCESAMIENTO DE VARIABLES CON OPCIN MLTIPLE


La variable, Qu lugares visitas los fines

de semana? Tiene varias opciones de


seleccin. Para determinar el grfico de esta
variable realizamos los siguientes pasos:
Grficos
Cuadros de dilogos antiguos
Barras
Seleccione Grfico de barras, Simple y en la opcin Los datos del
grfico son Resmenes para distintas variables. Pulsar. Definir.
En el cuadro de dilogo que se presenta seleccionar las variables:
cine, restaurante, bares, parques, centros comerciales, y pasar a la derecha.
Despus entrar en opcin Cambiar estadstico. En esta ventana active la
opcin Porcentaje por encima y en Valor ubique el valor mnimo que
tena estas variables (0 que corresponde a la respuesta No). Pulse

Continuar.

Entre en la opcin Ttulos y escribe la pregunta que se plante en la encuesta: Qu lugares

visitas los fines de semana?


Despus de Continuar y Aceptar.
Al modificar el grfico se obtiene lo siguiente:

111

TABLAS DE CONTINGENCIA
Para ver las opciones de este procedimiento
seleccione del men: Analizar, Estadsticos,

112

Descriptivos, Tablas de Contingencia. Cuando


se lleva a cabo tal accin, se abre una ventana como
la de la figura siguiente.
Aparece el cuadro de dilogo. Como se ve, a la izquierda aparece la tpica caja con el conjunto
de las variables presentes en el fichero activo. De entre ellas se elegirn las que van por filas
(se colocarn en la caja Filas), las que irn por columnas (se
colocarn en la caja Columnas), El procedimiento obtendr
una tabla de contingencia para cada combinacin de dos
variables, una de filas y otra de columnas
Si escogemos las variables sexo (fila) y lugar de trabajo
(columna).

Pinchamos casillas y seleccionamos Porcentajes,

Totales. Dar Continuar. Aceptar.

Esperamos el resultado,
Tabla de contingencia Sexo de los trabajadores. * rea de trabajo.

rea de trabajo.

Sexo de los
trabajadores.

Masculino

Recuento
% del total

Femenino

Recuento
% del total

Total

Recuento
% del total

Produccin

Recursos
Humanos

Finanzas

Servicios
generales

Total

18.8%

6.3%

6.3%

12.5%

43.8%

31.3%

6.3%

12.5%

6.3%

56.3%

16

50.0%

12.5%

18.8%

18.8%

100.0%

Ejercicio de aplicacin
Se obtuvieron los siguientes datos a partir de una encuesta que se realiz en una Empresa en la
ciudad de Managua. (30 casos)
1.

Defina las Variables


V1:
Edad ________
V2:

Sexo: 1. Femenino

V3:

Estado Civil:

2. Masculino.

1 Casado (a)

2.
3.
4.
5.
6.

2 Divorciado(a)

3 Soltero(a)

4 Otros

V4:

Nivel Acadmico:
3 Contador(a)

4 Mecnico

V5:

1 Licenciado(a)
2 Ingeniero(a)
5 Conductor
6 Otros.
Salario devengado: _______ (en C$)

V6:

Aos de trabajar en la Empresa: _______

V7:

Est de acuerdo que se implante la dolarizacin en nuestro pas.

1 S
2 No.
Recodifique la variable V1: Edad. (Presente un histograma)
1. 0 - 20 aos
2. 21 - 30 aos
3. 31 - 40 aos
4. 41 - 60 aos.
Aplique estadsticos a V1, V5, V6. Grficos de Histograma,
Aplique frecuencias a V2, V3, V4, V7. Grficos de Barras y Diagrama circular.
Aplique tabla de contingencia a las variables V2 y V4.
Recuerda que los resultados obtenidos deben ser analizados e interpretados.

Matriz de Datos
Casos
1
2
3

V1
21
50
22

V2
2
2
1

V3
3
2
1

V4
1
-5
2

V5
12 000
15 500
13 500

V6
1
20
1

V7
2
2
1

40

18 000

15

28

-5

15 000

29

20 000

-5

25

17 000

20

22 000

31

32 000

10

25

-5

28 500

11

-5

-5

10

12

42

27 500

20

13

51

-5

10 500

27

14

26

36 000

15

38

34 500

16

36

35 000

10

17

43

23 800

24

113

18

48

44 200

19

-5

19

33

-5

36 200

20

38

27 000

15

21

53

41 500

30

22

44

32 500

15

23

49

43 000

-5

24

30

25 000

25

29

15 700

26

37

18 000

12

27

-5

16 800

10

28

43

15 000

12

-5

29

50

30 000

18

30

23

32 000

114

Inferencia Estadstica

Crear base de datos con la siguiente matriz


Defina las variables
Sexo 1: Masculino
Tiene telfono 1: Si
2: Femenino
Caso

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

V1
Sexo

V2
Edad

2
2
1
1
1
1
2
2
1
2
1
2
2
1
2
2
1
1
1
2
2
2
2
2
1

28
21
40
22
24
41
25
30
19
30
21
25
26
28
21
22
20
30
35
25
20
24
22
30
22

Tiene casa propia 1: Si

2: No
V3
Pago en energa
(C$)
1250
920
680
450
360
589
1270
1590
1260
490
-5
950
620
700
552
468
1220
580
450
1256
1128
-5
830
-5
525

V4
Pago de agua
(C$)
450
320
350
-5
350
430
500
290
550
360
130
220
351
456
452
-5
554
350
260
-5
620
260
230
190
520

2: No
Telfono

V5

V6
Casa propia

1
2
1
1
2
1
2
2
1
2
2
2
1
1
1
1
1
2
-5
1
1
2
1
2
2

2
2
1
1
1
-5
1
1
1
2
2
2
2
1
2
2
1
2
2
2
1
1
1
1
1

Con el uso de PASW Statistics 18 podemos obtener Intervalos de Confianza que por
defecto establece una confiabilidad del 95%, puede ser modificado por el usuario.

Aplique el siguiente procedimiento.


Analizar, Estadsticos descriptivos, Explorar, Clic
Arrastre la variable cuantitativa de inters a Lista de
Dependientes... Por ejemplo: Pago de Energa.
Pinche Estadsticos Descriptivos, Continuar,
Aceptar. Espere resultados.

Interprete este intervalo de confianza


Descriptivos
Estadstico
Energa (en C$)

Media
Intervalo de confianza
para la media al 95%

665.26

Lmite superior

983.65
808.89

Mediana

690.00

Varianza

128925.593

Desv. tp.

359.062

Mnimo

360

Mximo

1590

Rango

1230

Asimetra
Curtosis

Lmite inferior

Media recortada al 5%

Amplitud intercuartil

824.45

Error tp.
76.552

711
.559
-.976

.491
.953

115

Prueba de hiptesis para una muestra

Suponga que se desea probar la hiptesis con un nivel de significacin de 0,05 que el
pago promedio en energa (en C$) en el mes de junio C$1 000.
Las hiptesis nula y alternativa son:
respectivamente.
Siga el procedimiento.
Analizar, Compara medias, Prueba T para una muestra , Dar clic.

Arrastre la variable Energa a Variables para contrastar.


Digite 1 000 en Valor de prueba. (Prueba T para una muestra)

Aceptar. Espere los resultados.

A qu conclusin llega?
Estadsticos para una muestra
N
Energa (en C$)

22

Media
824.45

Desviacin tp.
359.062

Error tp. de la
media
76.552

Prueba para una muestra


Valor de prueba = 1000

Energa (en C$)

t
-2.293

gl
21

Sig. (bilateral)
.032

,032

Diferencia de
medias
-175.545

95% Intervalo de confianza


para la diferencia
Inferior
Superior
-334.74
-16.35

El valor del estadstico es -2,293 y la significancia es 0,032, este valor es menor o


igual a = 0,05, por lo tanto se rechazar
, es decir existe suficiente evidencia a un
nivel de significacin de 0,05 que el pago promedio en energa es diferente de C$1 000
en el mes de junio.

Prueba de independencia

Procedimiento.

Analizar, Estadsticos descriptivos, Tablas de


contingencia, Dar clic.

116

Arrastre la variable Sexo a Filas y Telfono


a Columnas. (Tablas de contingencia).

117

Pinche Estadsticos y marque Chi-cuadrado.


(Tablas de contingencia: Estadsticos).

Continuar. Aceptar. Espere resultados.


Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Correccin por continuidad

Sig. asinttica
(bilateral)
.628

.005

.945

.236

.627

Valor
.235a
b

Razn de verosimilitudes

gl

Sig. exacta
(bilateral)

Estadstico exacto de Fisher


Asociacin lineal por lineal
N de casos vlidos

Sig. exacta
(unilateral)

.697
.225

.473

.635

24

a. 1 casillas (25.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 4.58.
b. Calculado slo para una tabla de 2x2.

Realice el correspondiente anlisis

Regresin y Correlacin Lineal Simple


En este laboratorio trabajamos con dos variables, como medio para observar la relacin existente entre
ellas. Se discutirn dos tcnicas: REGRESIN y CORRELACION.
Cul es la relacin entre la cantidad gastada por semana en alimentos y el tamao de una familia? Las
familias grandes gastan ms mensualmente? Una muestra de 10 familias en el rea de una ciudad revel
los siguientes tamaos de familia e importes en dinero gastados en alimentos, en cierto periodo.

Tamao de la familia

Cantidad gastada en alimentos ($)

99

104

151

129

142

111

74

91

119

91

Entre al programa PASW Statistics 18.


Definir las variables en estudio y crear el
archivo.

DIAGRAMA DE DISPERSIN

Entre a Grficos, Cuadros de dilogo antiguos, Dispersin/Puntos


Haga clic en Dispersin/Puntos
Aparece el cuadro.

Dar clic en Dispersin Simple. Pulse Define. Espere.

Nos aparece el nuevo cuadro de dilogo Diagrama de Dispersin


Simple en el que entramos en el Eje Y: Cantidad gastada en
alimentos ($) y en el Eje X: Tamao de familia. En Ttulos escriba
algn comentario relacionado con las variables en estudio.
Pulse Aceptar.
Deje el resto de opciones por defecto, espere y obtiene el
grfico deseado.

118

CURVA ESTIMADA DE REGRESIN


Entre a Analizar, Regresin,
Estimacin Curvilnea

Haga clic en Estimacin curvilnea


En el cuadro de dilogo Estimacin Curvilnea, ingrese las variables, en Dependientes: Cantidad
gastada en alimentos ($) y en Independiente: Tamao de familia. (Seleccione Modelo Lineal).

Aceptar.

El resultado es,

ECUACIN DE REGRESIN
Entre a Analizar, Regresin, Lineales

Hacer clic en Lineales

119

Obtiene el cuadro de dilogo Regresin Lineal.

120

En Dependiente Introduzca la variable: Cantidad


gastada en alimentos ($) y en Independientes la
variable: Tamao de familia. (Seleccione Estadsticos
y en el nuevo cuadro de dilogo: Regresin Lineal
(Estadsticos) escoja Estimaciones. (Deje el resto de
opciones por defecto y ejecute el procedimiento para
obtener el resultado deseado).
Continuar. Aceptar.

Con este resultado se obtienen los coeficientes de regresin,


Coeficientesa
Modelo

Coeficientes no
estandarizados
B

Error tp.

(Constante)

60.359

25.468

x: Tamao de la familia

11.276

5.467

Coeficientes
tipificados
Beta
.589

Sig.

2.370

.045

2.062

.073

a. Variable dependiente: y: Cantidad gastada en alimentos ($)

Escriba la ecuacin de regresin e interprete el coeficiente de regresin b1.

Tambin se obtiene la tabla.


Resumen del modelo
Modelo
dimensin

R
a

.589

R cuadrado

R cuadrado
corregida

Error tp. de la estimacin

.347

.266

20.81855

a. Variables predictoras: (Constante), x: Tamao de la familia

Interprete los coeficientes de determinacin, no determinacin y correlacin para este


modelo. Adems el error estndar de estimacin.

CORRELACION BIVARIADA
Entre a Analizar, Correlaciones, Bivariadas
y obtiene el cuadro de dilogo: Correlaciones Bivariadas.

121

Hacer clic en Bivariadas y obtenemos.

Arrastramos a la lista de variables destinos

Cantidad gastada en alimentos y Tamao


de familia) del archivo y dejamos todas las
opciones por defecto.
Aceptar y ejecutamos el procedimiento para
obtenemos lo buscado.
Correlaciones
x: Tamao de y: Cantidad gastada
la familia
en alimentos ($)
x: Tamao de la familia

Correlacin de
Pearson

Sig. (bilateral)
y: Cantidad gastada en
alimentos ($)

.589
.073

N
Correlacin de
Pearson

10
.589

Sig. (bilateral)

.073

10

10
1

10

INTERVALO DE CONFIANZA PARA 1


Entre a Analizar, Regresin, Lineales
Haga clic en Lineales
Aparece el cuadro de dilogo Regresin Lineal

Traslade las variables en estudio a sus respectivas celdas.

Pinche estadsticos

Seleccione Intervalos de Confianza.

122

Continuar. Aceptar.
El resultado es,
Coeficientesa
Modelo

Intervalo de confianza de 95.0% para B


Lmite inferior

Lmite superior

(Constante)

1.629

119.088

x: Tamao de la familia

-1.332

23.883

a. Variable dependiente: y: Cantidad gastada en alimentos ($)

Interprete este intervalo de confianza.

Referencias
Walpole, Ronald E., Myers, Raymond H., y Myers, Sharon L. (1998).
Probabilidad y estadstica para Ingenieros. (6. ed.). Mxico: PrenticeHall.
Johnson, R. (1988). Estadstica Elemental. (4. ed.). Mxico: Iberoamrica.
Mason, R., y Lind, D. (1998). Estadstica para Administracin y
Economa. (8. ed.). Mxico: Alfaomega.
Newbold, P., Carlson, W., y Thorne, B. (2008). Estadstica para
Administracin y Economa. (6. ed.). Madrid: Pearson Educacin.
Conde, Carlos. (2010). Estadstica Descriptiva. Recuperado el 24 de junio de 2012 de
http://www.es.crribd.ci/descriptiva/.pdf.
Navarro, Alfredo. (2010). Probabilidades. Recuperado el 2 de julio de 2012 de
http://www.profesorenlinea.cl/matematica/probabilidades.htm
Arroyo Cervantes, G. (2008). Inferencia Estadstica. Recuperado el 12 de agosto de
2012 de http://es.scribd.com/doc/43058695/PRUEBA-DE-HIPOTESIS.
Becerra Espinoza, J.M. (2009). Regresin y Correlacin Lineal simple. Recuperado
el 18 de agosto de 2012, de http://www.eumed.net/cursecon/medir/index.htm

Вам также может понравиться