Вы находитесь на странице: 1из 135

UNIVERSIDAD RICARDO PALMA

FACULTAD DE INGENIERA
SEPARATA

ESTADSTICA y PROBABILIDADES
ELABORADO POR EL PROFESOR:

Lic. Luis Alberto Chirinos Rueda


2016

PREFACIO

La presente separata est dirigida a estudiantes universitarios, avanzados y


Profesionales de las ciencias sociales, Administrativas, Ingeniera y quienes
necesitan un documento de consulta acerca de la Metodologa Estadstica.
El uso de esta separata requiere de pocos conocimientos matemticos previos,
requiere de una destreza razonable en lgebra para comprender los conceptos y
mtodos que fundamentan los clculos. Asimismo se hace nfasis en el
aprendizaje basado en la comprensin intuitiva de los principios y no en la
comprensin de conceptos matemticos complejos.
Las nuevas tecnologas de enseanza implican el uso de micro computadoras en
la enseanza de la estadstica as como software apropiado, por lo que el profesor
de estadstica puede concentrarse ms en ensear conceptos y principios y
dedicar menos tiempo a corregir los errores de clculo de los alumnos, porque
muchas de las tcnicas que se exponen en esta separata se ofrece los comandos
del Excel y del SPSS

Introduccin
ORIGEN ETIMOLOGICO DE LA PALABRA ESTADISTICA
No est bien determinado existen distinta opiniones:

Para algunos provienen de la palabra griega STATERA que significa


balanza.

Otros sostienen que deriva del latn STATUS que significa situacin.

Algunos sostienen que procede del Alemn STAAT que significa estado, es
por el hecho que una de las funciones tradicionales del gobierno central y del
estado es llevar registros sobre la situacin de la poblacin, nacimientos,
defunciones, produccin, impuestos y otros hechos contables o de control.
Breve Resea Histrica
Las estadsticas son tan antiguas como la humanidad misma. El hombre
siempre se preocup en evaluar cuantitativamente los hechos y acontecimiento
de su realidad as fue:
*En Egipto , recopilaban regularmente datos de la administracin
estatal.
*Los Hebreos realizaron censos, Moiss levanto a instancia de Yav
*En China en el ao 2258 A.C. el emperador Yao dispuso un censo.
*En Roma en el tiempo de Octavio Augusto se realiz un censo.
Llevaban registros numricos para fines tributarios.
*En el ao 0, ao del nacimiento de Jesucristo, est relacionado con
un empadronamiento.
*Los Arabes realizaron un censo casi completo en el ao 727 en la
pennsula Ibrica.
*En la Edad Media ya se encuentran estadsticas sistematizadas. El
Clero se dedic a la recopilacin, ordenamiento y estudio de los
datos de tipo demogrfico.
*En Espaa siglo XV durante el gobierno de los reyes Catlicos, en el
siglo XVI reinado de Felipe II y siguientes se levantaron censos
relativamente completos resaltando el censo del Marqus de la
Ensenada en 1748.

*En Amrica an cuando los pobladores del Tahuantinsuyo no


conocan la estadstica como tal, estaban familiarizados con datos e
informes sobre aspectos demogrficos y econmicos.
*En Prusia durante el despotismo ilustrado de Federico Guillermo I y
de Federico El Grande, la Estadstica paso a ser una organizacin
Estatal.
*En el Concilio de Trento (1545-1563), se establece la obligatoriedad
de inscribir los nacimientos, matrimonios y defunciones.
*Probabilidades, con destacada participacin de Fermat(1601-1665),
Laplace(1749-1827), Poisson (1777-1855), los hermanos Bernoulli
(Daniel, Jacob y Nicols), Gauss y De Moivre (1667-1754). Poco
tiempo despus el clculo de Probabilidades toma gran impulso
gracia a los trabajos de los franceses Borel, Frchet y Levy y de los
rusos Tchevyshev (1821-1894), Tchuprov, Markov, Kintchine y
Kolmogorov (nacido 1903). Entre los ingleses destac el clrigo
Toms Bayes.
*Durante el siglo XIX y principio del siglo XX el trabajo estadstico se
caracterizaba por el estudio de grandes masa de datos, pero al inicio
de los aos treinta se produjo el giro de la estadstica Moderna, la
Estadstica Inductiva o Inferencia cuya palabra clave es la MUESTRA
destacaron Francisco Galton (1822-1911) y Karl Pearson que
desarrollaron ideas de regresin y correlacin, William Gosset
(Student) y Sir Ronald A. Fisher (1890-1962) quienes desarrollaron
mtodos de trabajo usados en el anlisis estadsticos y en la prueba
de hiptesis. Por su parte Jerzy Neyman, conjuntamente con el hijo
de Pearson crearon la teora de Muestreo.

DEFINICION DE ESTADISTICA
La Estadstica es la ciencia que tiene por objeto planificar, recolectar, procesar y
analizar un conjunto de datos con la finalidad de obtener conclusiones valederas
para realizar una buena toma de decisin frente a una incertidumbre.
*Alexander M. Mood y Franklin A. Graybill describen a la estadstica como la
tecnologa del Mtodo cientfico. La estadstica proporciona instrumentos para la
toma de decisiones cuando prevalecen condiciones de incertidumbre. Estos
instrumentos pueden ser de aplicacin y utilidad completamente general en
cualquier campo de la ciencia: Mdica, Biolgica, Ingeniera, Fsica, Social, etc.
Son aplicables no solo en el mundo cientfico, sino tambin en el de la empresa y
en el de los asuntos cotidianos. Por otra parte, ciertos instrumentos pueden estar
especialmente diseados para campos especiales de la INVESTIGACION.
La estadstica puede dividirse en dos amplias ramas:
1. Estadstica Descriptiva: que est relacionada con el resumen y la descripcin
de datos numricos. La estadstica descriptiva nos da normas, mtodos, reglas
para recolectar, procesar, analizar un conjunto de datos Estos mtodos pueden
ser: encuestas, elaborar tablas, grficos o pueden incluir anlisis mediante
clculos de valores resumidos porcentajes, promedios, mediana, moda, varianza
desviacin estndar etc.
Ejemplo: Puede describirse y darle significado al volumen mensual de ventas de
un producto, durante el ao pasado elaborando un grfico de barras o una grfica
lineal
MONTOS EN MILES DE DLARES DE LOS CRDITOS OTORGADOS POR LA
BANCA MLTIPLE A EMPRESAS Y PARTICULARES DURANTE LOS MESES
DE MARZO - AGOSTO DEL 2015
MES
CREDITOS
PORCENTAJE
MARZO
ABRIL
MAYO
JUNIO
JULIO
AGOSTO
TOTAL

22,860
25,057
28,377
34,774
35,730
37,602
184,400

12.4
13.6
15.4
18.9
19.4
20.4
100.0

CRDITOS EN MILES DE DLARES


O TORGADOS , MES ES :MARZO-AGOS TO 2000
DE $ U.S .

MONTOS (EN MILES

Fuente: Banca mltiple a agosto

40.000
30.000
20.000
10.000
0

22.860

25.057

28.377

34.774

MES

35.730

37.602

2. Estadstica Inferencial: relacionada con el proceso de utilizar una muestra de


datos para tomar decisiones en el caso ms general del que forman partes estos
datos. El proceso de tomar decisiones en situaciones generales, sobre la base de
de datos muestrales, es arriesgado y no puede realizarse con certeza; la
Probabilidad es una medida de esta incertidumbre.
Ejemplo: Con el objeto de estimar el voltaje necesario para que un dispositivo
elctrico falle, puede someterse una muestra de estos dispositivos a voltajes cada
vez ms altos hasta que fallen. Con base en los resultados de esta muestra,
puede calcularse probabilidades de fallas para los otros dispositivos de la
poblacin muestreada en los diversos niveles de voltaje.
CONCEPTO ESTADISTICOS GENERALES

Poblacin: Es el conjunto total de personas, animales o cosas llamadas unidades


estadsticas que tienen al menos una caracterstica en comn.
Tales como la edad y sexo de los empleados de una empresa, de una universidad
o el nmero de productos defectuosos y no defectuosos producido en un ao
determinado, las estrellas del cielo etc.
Poblacin Finita compuesta por un conjunto finito de elementos o Unidades
Estadsticas
Poblacin Infinita compuesta por un conjunto infinito de elementos o unidades
estadsticas.
Ejemplos

Poblacin de Trabajadores
Poblacin de Enchufes

Unidad Estadstica: es el elemento fundamental e indivisible de la poblacin


(persona, animal o cosa), sobre las cuales se va a obtener datos, en otras
palabras es el que proporciona el dato en la investigacin. En los ejemplos
anteriores es: un trabajador, un enchufe. Tambin puede ser una empresa, una
persona, una familia etc.
Muestra: Es un sub_conjunto o parte pequea de elementos de la Poblacin.
Para hacer inferencia acerca de una proporcin, partiendo de una poblacin finita
el tamao de muestra se calcula mediante la siguiente frmula:
Z2*P*Q*N
n=
(N-1)*e2+Z2*P*Q
n= es el tamao de la muestra
N= es el tamao de la poblacin
P =la proporcin de xito
Q= la proporcin de fracaso
Z= es un valor de la abscisa de la variable que se distribuye normalmente
e= es el error relativo
Para hacer inferencia acerca de una proporcin, partiendo de una poblacin
infinita la frmula debe ser la siguiente:
Z*P*Q*

n=
e2
:

Problema de aplicacin: queremos estudiar la poblacin de


Industrias Manufactureras registradas en Lima que son
alrededor de 1530
mediante una encuesta por muestreo de
esta poblacin. Por el hecho de que la muestra es de un tamao
inferior al total de la poblacin, vamos a cometer cierto error en
los datos que observemos. Si estamos dispuestos a aceptar un
% de error determinado, cul es el tamao de muestra mnimo
que necesito encuestar?
La forma en que mido el error
Cuando quiero fijar el mximo error que estoy dispuesto a
aceptar en una encuesta, lo habitual es referirnos a dos
parmetros: el margen de error y el nivel de confianza.
Qu significa cada cosa?
El margen de error es el intervalo en el cul espero encontrar
el dato que quiero medir de mi poblacin. El dato puede ser en
general de dos tipos: una media o una proporcin. Por ejemplo,
si quiero calcular la media de hijos que tienen los habitantes de
Brasil entre 15 y 65 aos, me gustara poder decir que la media
es 2,1 hijos/persona con un margen de error del 5%. Eso
significara que espero que la media est entre 2,1 5% y 2,1 +
5%, lo que da un intervalo de 2,00 <-> 2,21.
Si quisiera definir un margen de error para una proporcin,
procedera de forma similar. Por ejemplo, me gustara poder
estimar el nmero de personas de Brasil entre 15 y 65 aos que
viven en un piso de propiedad, afirmando que son un total de
61.35 millones personas (45% de la poblacin) con un margen
del 5% de error, lo que significara que la realidad est entre
68 millones (50%) y 54,5 millones (40%).
El nivel de confianza expresa la certeza de que realmente el
dato que buscamos est dentro del margen de error. Por

ejemplo, siguiendo con el caso anterior, si obtenemos un nivel


de confianza del 95%, podramos decir que el porcentaje de
personas de mi universo que viven en un piso de propiedad, en
el 95% de los casos se encontrar entre el 40% y el 50%. O
dicho de otra manera, si repitiese 100 veces mi encuesta
seleccionando muestras aleatorias del mismo tamao, 95 veces
la proporcin que busco estara dentro del intervalo y 5 veces
fuera.
Relacin entre error y tamao de muestra
Margen de error, nivel de confianza y tamao de la muestra
siempre van de la mano. Si quiero obtener un margen de error y
un nivel de confianza determinado (por ejemplo, error del 5%
con confianza 95%) necesitar un tamao de muestra mnimo
correspondiente. Modificar cualquiera de los 3 parmetros,
altera los restantes:
1. Reducir el margen de error obliga a aumentar el tamao de la
muestra.
2. Aumentar el nivel de confianza obliga a aumentar el tamao
de la muestra.
3. Si aumenta el tamao de mi muestra, puedo reducir el
margen de error o incrementar el nivel de confianza.
Pero, qu frmulas gobiernan la relacin entre los parmetros
anteriores? El conjunto de teoremas que se conocen como LEY
DE LOS GRANDES NMEROS viene a nuestro rescate. Estos
teoremas son los que dan soporte matemtico a la idea de
que el promedio de una muestra al azar de una poblacin de
gran tamao tender a estar cerca de la media de la poblacin
completa.
En
concreto,
el teorema
del
lmite
central demuestra que, en condiciones muy generales, la suma
de muchas variables aleatorias independientes (en el ejemplo,
los habitantes de Brasil que tienen piso de propiedad) se
aproxima
bien
a
una
distribucin
normal (tambin

llamada campana

de

Gauss).

Gracias al teorema del lmite central, cuando calculamos una


media (p.e. hijos por persona) o una proporcin (p.e. % de
personas con piso de propiedad) sobre una muestra, podemos
saber cul es la probabilidad de que el universo tenga ese
mismo valor o un valor parecido. El valor que calculemos en la
muestra ser el ms probable para nuestro universo y a medida
que nos alejamos de este valor (por arriba o por abajo) cada vez
sern valores menos probables. En mi ejemplo, si el 45% de mi
muestra de brasileos tiene piso de propiedad, puedo afirmar
que 45% es el valor ms probable del universo estudiado. Un
porcentaje de 44% ser algo menos probable, 43% an menos,
etc Lo mismo sucede para valores superiores: 46% es menos
probable que 45%.
La forma en que disminuye la probabilidad a medida que me
alejo de la media corresponde a una distribucin gaussiana.
Podemos fijar un intervalo alrededor del valor ms probable, de
manera que englobemos el 95% de la probabilidad (nivel de
confianza). La distancia a la que me tengo que alejar del valor
ms probable para englobar este 95% determina el margen de
error.

Segn el grfico anterior, para una distribucin normalizada


(media 0, desviacin 1) si queremos englobar los valores que
cubren el 95% de los casos, tengo que definir un margen de
error entre -1,96 y +1,96 de la media. Si quiero cubrir el 99% de
los casos, el margen debe alejarse hasta +-2,58.
Y entonces, qu est haciendo la calculadora?
Conociendo la propiedad anterior, es muy fcil adaptar las
frmulas de la distribucin gaussiana a cualquier caso (sea cul
sea la media y desviacin). Vamos a ver con detalle el caso de la
estimacin de una proporcin. Para ello usamos la siguiente
frmula:

Donde:
n = El tamao de la muestra que queremos calcular
N = Tamao de la poblacin (p.e. 136 millones de brasileos
entre 15 y 65 aos)
Z = Es la desviacin del valor medio que aceptamos para lograr
el nivel de confianza deseado. En funcin del nivel de confianza
que busquemos, usaremos un valor determinado que viene dado
por la forma que tiene la distribucin de Gauss. Los valores ms
frecuentes son:
Nivel de confianza 90% -> Z=1,645

Nivel de confianza 95% -> Z=1,96


Nivel de confianza 99% -> Z=2,575
e = Es el margen de error mximo que admito (p.e. 5%)
p = Es la proporcin que esperamos encontrar. Este parmetro
suele confundir bastante a primera vista: cmo voy a saber qu
proporcin espero, si justamente estamos haciendo una
encuesta para conocer esta proporcin?
La razn de que esta p aparezca en la frmula es que cuando
una poblacin es muy uniforme, la convergencia a una poblacin
normal es ms precisa, lo que permite reducir el tamao de
muestra. Si en mi ejemplo, yo espero que como mximo el % de
personas que tengan un piso de propiedad sea un 5%, podra
usar este valor como p y el tamao de mi muestra se reducira.
Si por el contrario, desconozco completamente qu puedo
esperar, la opcin ms prudente sera usar el peor caso: la
poblacin se distribuye a partes iguales entre propietarios y no
propietarios, por lo que p=50%.
Como regla general, usaremos p=50% si no tengo ninguna
informacin sobre el valor que espero encontrar. Si tengo alguna
informacin, usar el valor aproximado que espero (ajustando
hacia el 50% ante la duda).

La frmula anterior podemos simplificarla cuando trabajamos


con universos de tamao muy grande (se considera muy grande
a partir de 100.000 individuos), resultando lo siguiente:

Ejemplo: si la poblacin est compuesta por todo los 10,000 focos producidos por
una industria en un da determinado, una muestra se debe determinar por medio
de la frmulas estadsticas, tal como:

Caracterstica: Son las propiedades, atributos, caractersticas de la unidad


estadstica.
De los ejemplos anteriores: sexo, edad, tiempo de servicio etc de los trabajadores.
Material, voltaje de los enchufe, vida til de los focos.
Variable :Es una caracterstica que puede tomar diferentes valores. La variable
adquiere un valor determinado en cada unidad estadstica. La variable es la
representacin simblica de la caracterstica en estudio tal como X, Y, Z....
Ejemplo: X: Sexo Y: Edad, Z= material del enchufe, W: vida til.
Dato: Es el valor o resultado de observar la caracterstica en estudio de una
unidad estadstica. Es la materia prima de la estadstica.
Ejemplo: X=Sexo ejemplo: X1=masculino, X2=femenino, Y=Edad ejemplo Y 1
=28
Y2=35..... Z=material del Enchufe ejemplo= Z 1 =plstico, Z2 =metal
W=Vida til del foco ejemplo: W1=2500 horas, W2= 2450 horas etc.

LO S D A TO S PU ED EN SER
DATO
C U A L IT A T IV O :
C u a n d o e l r e su lta d o
d e o b se r v a r la c a r a te r stic a
e s u n a tr ib u to . N o e s u n n m e r o .

C U A N T IT A T IV O
C u a n d o e l r e su lta d o d e
d e o b se r v a r la c a r a c te r stic a
e s u n v a lo r n u m r ic o

D IS C R E T O
C u a n d o e l v a lo r n u m r ic o r e su lta
d e la o p e r a c i n d e c o n ta r , e sta r e p r e s e n ta d o
p o r lo s n m e r o s n a r u r a le s e n te r o s

C O N T IN U O
C u a n d o e l v a lo r n u m r c io r e su lta
d e la o p e r a c i n d e m e d ir o c o m p a r a r c o n u n a
m e d id a o p a tr n . R e p r e sn e ta d o p o r lo s N o s. R e a le s

LASIFICACIN DE VARIABLE
1.Segn la naturaleza de la variable:
Variable cualitativa: cuando sta adopta un dato cualitativo. Por ejemplo: Estado
Civil del trabajador, Razn Social de la empresa. Tipo de Productos elaborados,
etc.
Variable cuantitativa: cuando sta adopta un dato cuantitativo. Por ejemplo:
Edad del trabajador, Nmero de productos vendidos semanalmente, capital social
de la empresa. etc.
*Variable discreta: cuando sta adopta un dato cuantitativo discreto. Por
ejemplo: Nmero de de enchufes vendidos, Clientes atendidos en un da
determinado, Nmero de Empleados de una Empresa. Nmero de vehculo
automotor de la empresa, Nmero de enchufes producidos.

*Variable Continua: cuando sta adopta un dato cuantitativo contnuo. Por


ejemplo: Dimetros de los tubos de luz, Peso, talla del trabajador, Area total
construida del local de la empresa. tiempo de Servicio de un trabajador de la
empresa, sueldo mensual del trabajador, gastos mensuales del trabajador,
ingresos semanales por ventas de productos etc.

2. Segn la escala de medicin


Medicin: es el proceso de asignar un valor numrico a una variable
Las escalas de medicin sirven para ofrecernos informacin sobre las
clasificaciones que podemos hacer con respecto a las variables (discretas o
continuas).
Cuando se mide una variable el resultado puede aparecer en uno de cuatro
diversos tipos de escalas de medicin; nominal, ordinal, intervalo y razn.
Conocer la escala a la que pertenece una medicin es importante para determinar
el mtodo adecuado para describir y analizar esos datos.
Escala nominal:
Es aquella escala que no presenta un orden o dimensin particular, son
observaciones que pueden clasificarse o contarse.

En esta escala cada persona u objeto debe pertenecer a una y solamente una de
las categoras que tienen y el conjunto de estas categoras debe ser exhaustivo;
es decir, tiene que contener a todos los casos posibles.
Ejemplo: la variable carrera de la URP tiene las siguientes categoras
Arquitectura
Biologa
Medicina Humana
.
.
..
Ingeniera Mecatrnica
Por lo tanto la variable carrera ser una variable Nominal
Escala ordinal:
Se establece una gradacin u orden natural para las categoras, cada uno de los
datos puede localizarse dentro de alguna de las categoras disponibles
Ejemplo: orden de mritos de los estudiantes en un semestre
Primer puesto
Segundo Puesto
Tercer puesto

Escala de intervalo:
La unidad de medicin es arbitraria, el cero es convencional y pueden existir
cantidades negativas; la medicin de la temperatura y del coeficiente intelectual
son ejemplos de este tipo de escala.
Ejemplo: temperatura del laboratorio de cmputo.

Escala de razn:
Similar a la escala de intervalo, pero tiene un cero absoluto y por ello los mltiplos
de los valores de la escala sern significativos; el nivel de votos en una eleccin
sera un buen ejemplo de una escala de medicin de razn.
El Candidato A = no ha recibido ningn voto a favor
El Candidato B = 20%
El Candidato C= 10%
Parmetro: son medidas de reduccin provenientes de los datos de una
poblacin. Los principales parmetros son:
N
a)

Media o promedio Poblacional

(): Xi
i=1
N
N

b)

Varianza poblacional

(2): (Xi - )2
i=1
N

c)

Proporcin poblacional

(P): n(A)/N
N

d)

Total Poblacional

(X): Xi
i=1

Estadgrafos: son medidas de reduccin provenientes de los datos de una


muestra. Los principales estadgrafos son:
n
e)

Media o promedio muestral,

(X): Xi
i=1
n
n

f)

Varianza Muestral

(S ): (Xi - X)2
2

i=1

g)

Proporcin Muestral

(p): n(A)/n
n

h)

(X): Xi

Total Muestral

i=1
LA INVESTIGACION ESTADISTICA
Qu es INVESTIGACION?
Es un proceso formal, sistemtico, racional e intencionado en el que se lleva a
cabo el mtodo cientfico de anlisis, como un procedimiento reflexivo, controlado
y crtico que permite descubrir nuevos hechos o datos, relacionados a leyes, en
cualquier campo del conocimiento, en un momento histrico (Ander Egg 1971).
Toda INVESTIGACION requiere de datos con el propsito de obtener algunas
medidas o indicadores que expresan la dimensin o niveles de las variables
estudiadas, por lo tanto la estadstica se convierte como ciencia auxiliar de la
INVESTIGACION, que por su naturaleza estructura mtodos, en este proceso, el
anlisis estadstico tambin cumple con los diversos pasos de toda
INVESTIGACION.

FASES DE UNA INVESTIGACION ESTADISTICA


La INVESTIGACION estadstica es un proceso donde se distingue cinco etapas :
PROBLEMA

PLANEAMIENTO

RECOLECCION

-Definicin del Problema a estudiar.


Justificacin
-Determinacin de objetivos
-Determinacin de las variables
-Determinacin de la fuente de informacin
-Estudios de antecedentes
-Determinacin del mbito, geogrfico, poblacin, periodo de anlisis.
-Preparacin del plan de ejecucin:

Fijacin de la Poblacin

Determinacin de los mtodos, tcnicas, instrumentos de


recoleccin y anlisis de datos.

Elaboracin de cuestionarios e instrumentos de recoleccin de


datos.

Preparacin del Plan tabulacin

Formacin y capacitacin del equipo de trabajo

Elaboracin de cronograma de actividades

Formulacin del presupuesto

Diseo y ejecucin de una prueba piloto o experimental

PROCESAMIENTO

ANLISIS

CONCLUSIONES

TOMA DE
DECISION

EJEMPLO DE UNA INVESTIGACIN ESTADSTICA


. Problema en Estudio: Determinacin del nmero de productos defectuosos
elaborados por una empresa.
II.Justificacin: Existe un conocimiento superficial del problema. La
competitividad actual, la globalizacin, hace necesario
realizar un estudio concienzudo a fin de determinar los
factores que ocasionan que los productos salgan con
defectos, de tal manera que se determine los lmites de
tolerancia que se pueda aceptar en una produccin y que
los lotes de estos productos sean de aceptacin en el
mercado.
III. Objetivos:
1. Conocer los tipos de defectos.
2. Conocer las causas o factores que ocasionan los defectos(origen )
y efectos.
3.Conocer los tipos de tratamientos(medidas correctivas utililizadas)
4. Conocer el resultado del tratamiento.
IV. Variables en estudio:
-Lotes de productos fabricados, horario-da- semana-mes-ao ,
-Nombre de los operarios, Sexo,Edad, Peso, Talla, grado de
instruccin, capacitacin.
-Tipo de defecto
- Causas y efectos
-Sistema de control de calidad
-Personal responsable
-Medidas correctivas utilizadas
-Mquinas utilizadas, edad, horas utilizadas, fechas de mantenimiento
VI. Estudio de antecedentes: no existe estudio alguno similar.

VII. mbito de estudio: La produccin del mes de Noviembre del ao 2000


VIII. Poblacin : Todos los lotes producidos de cierto productos elaborados en el
mes de noviembre del ao 2,000
IX. Plan de Ejecucin:
-Relacin de los lotes por da, hora, mquina, operario(s), Marco Muestral.
-Toma directa de la informacin de los registros del jefe de produccin.

Departamento de Estadstica
ENCUESTA
DETERMINACIN DEL NMERO DE PRODUCTOS DEFECTUOSOS POR
LOTES.

1.RESPONSABLE

3.LOTE No
PRODUCTO

PERIODO DE ELABORACIN
DEFECTO

CAUSA

DIA

FIRMA DEL RESPONSABLE

FIRMA DE L ENCUESTADOR

Fecha: .............................
Plan de tabulacin :
1. Nmero de productos defectuosos por tipo segn Periodo de elaboracin.
2. Nmero de productos defectuosos por Da segn Periodo de elaboracin.
3. Nmero de productos defectuosos por tipo segn responsable.
4. Nmero de productos defectuosos por tipo segn Mquina y Periodo de
elaboracin
VII Medidas de Resumen para el anlisis:
Nmero de productos defectuosos promedio por lote
Nmero de productos defectuosos promedio por periodo de elaboracin.
Nmero de productos defectuosos promedio elaborados por da
Total de productos defectuosos por semana, mes
Total de productos defectuosos por semana, segn responsable
Porcentaje de defectuosos y no defectuoso por lote, da , semana
Cronograma de actividades para la prueba piloto
Actividad
SETIEMBRE
Capacitacin para la
recoleccin
Prueba experimental
Recoleccin
Procesamiento
Resultados
Informe

OCTUBRE

NOVIEMBRE

DICEIMBRE

ORGANIZACIN Y REDUCCION DE DATOS


La organizacin de datos de una variable, consiste en realizar dos operaciones:
clasificar y contar, presentndolos luego en tablas denominada tablas de
distribucin de frecuencias.

Clasificar los datos: es la operacin que consiste en determinar cuantos valores


distintos existen en el conjunto de datos originales o datos en bruto. Si estos
valores distintos son numricos ordenarlos en forma ascendente o descendente.
Si estos datos fueran cualitativos( no numrico) estos se ordenaran en forma
alfabtica.
Tabulacin: es la operacin que consiste en contar cuantas veces se repiten los
valores distintos de la variable
Tablas de distribucin de frecuencias: son matrices de filas por columnas
ejemplo

La primera columna es para la variable y sus respectivos valores distintos o


categoras
Ejemplo
Supongamos que se ha recolectado los datos de la investigacin planteada(datos
originales) y se sac una muestra aleatoria de 30 lotes y se observ el tipo de
producto y el nmero de productos defectuosos:
X A A B B C C C C A B C C C C B A A C C B
Y 5 2 3 2 1 0 2 3 4 4 1 2 2 O O 1 2 3 3 2
A A B B
C C C C B C
5 2 3 2
1 0 4 3 1 2
Primero caracterizamos el estudio terminando los siguientes
Poblacin en estudio(N): Todos los lotes de productos elaborados por la empresa
Unidad estadstica (U.E): Un lote de producto
Muestra en estudio (n ) : Muestra en estudio
Variables
X: tipo de Producto
Y: Nmero de productos defectuosos productos
Tipo de variable X: cualitativa nominal
Y: cuantitativa discreta
Tabla de distribucin de frecuencias para la variable cualitativa
a) Clasificacin de los datos es decir los valores distintos de la variable
cualitativa las cuales son 3: A, B y C entonces :
Tipo de
Conteo
fi
hi
Porcentaje
producto (Xi)
A
//// //
7
0.2333
23.33%
B
//// ///
8
0.2667
26.67%
C
//// //// ////
15
0.5000
50.00%

n=

30

1.0000

100.00%

b) La operacin de contar cuantas A , B, y C existen en los datos originales


esta operacin da origen al elemento f i denominado frecuencia absoluta
simple el cual tiene las siguiente propiedades:
Las fi son valores enteros no negativos y menores e igual que la
i)
muestra
0fin
ii) La suma de las frecuencias absolutas simples fi es igual al tamao de la
muestra:
m
fi=f1+f2++fm =n donde m=es el nmero de valores distintos
i=1
de la variable
c) El otro elemento que tiene esta tabla de distribucin de frecuencias es hi
llamada frecuencia relativa simple. Estas hi se calculan dividiendo cada fi entre
n Sus propiedades son:
i) Los hi son valores fraccionarios no negativos y menores e igual que la
unidad
0hi1
ii) La suma de las frecuencias relativas simples hi es igual a la unidad:
m

hi=h1+h2++hm =1

donde m=es el nmero de valores distintos


de la variable
Nota las hi se pueden expresar en trminos porcentuales multiplicando cada hi
*100
I=1

.
Para facilitar la construccin de esta tabla utilizaremos Excel de la siguiente
manera
.:
1ro En la celda B1 escribimos Xi= que representa a la caracterstica o variable
tipo de producto; en la celda C1 escribimos Yi= que representa la caracterstica
nmero de productos defectuosos en cada lote de productos.
.
2do Luego desde la celda B2 hasta la celda B31 ingresamos los datos de la
muestra anterior, .de igual manera desde la celda C2 hasta la celda C31 los datos
correspondiente.

3ro Luego seleccionamos desde la celda B1 hasta C31 (sombreamos)

4to Seccionamos del men principal del Excel el comando insertar, seleccionamos
la opcin tabla dinmica y aparecer una venta y luego presionar el botn
aceptar

Aparecer esta nueva ventana que en la parte derecha aparecer la lista de


campos o variables

Si queremos obtener la tabla de la variable tipo de producto(Xi) arrastraremos Xi


hasta el recuadro etiqueta de fila, luego otra vez arrastramos la variable Xi pero al
recuadro valores y aparecer cuenta de Xi.

En la parte izquierda aparecer el resultado

Luego seleccionamos del resultado desde el valor A hasta el valor 15 y lo copiamos


en otro sector de la tabla o en otra hoja nueva y calculamos los otros elementos de
la tabla de la siguiente manera

Encima del valor A escribimos el nombre de la variable Tipo de Producto, luego


arriba del valor 7 escribimos fi , en la siguiente columna escribimos hi luego
calculamos para cada valor de la variable el hi dividiendo la celda donde se
encuentra el 7 (E14) entre( / ) la celda donde se encuentra el 30 (E17) que es el
denominador este se selecciona y se presiona F4 a fin de ser constante esta celda
y la frmula sirva para todos los otros hi arrastrndolas. Los hi se deben calcularse
con cuatro decimales. Luego completar los otros elementos

Para el caso de la variable Nmero de defectos (Yi) que es una variable discreta se
sigue el siguiente procedimiento
1.Determinar los distintos valores de la variable obteniendo el valor mximo y el
valor mnimo en el ejemplo tenemos que el Valor X mnimo=0 y el Valor Xmximo=5
entonces entre 0 y 5 existe 6 valores distintos incluyendo ellos, que adopta la
variable y
2 Luego se contabiliza cuantas veces se repiten c/u de estos distintos valores
y se construye la siguiente tabla:
TABLA N 1
NUMERO DE LOTES SEGN NMERO DE
PRODUCTOS DEFECTUOSOS
22/03/2016
Yi
0
1
2
3
4
5

contero
////
/////
///// /////
///// /
///
//
n=

fi
4
5
10
6
3
2
30

hi
0.1333
0.1667
0.3333
0.2000
0.1000
0.0667
1.0000

Fi
4
9
19
25
28
30

Hi
0.1333
0.3000
0.6333
0.8333
0.9333
1.0000

Fi*
30
26
21
11
5
2

Hi*
1.0000
0.8667
0.7000
0.3667
0.1667
0.0667

Esta tabla se puede construir aplicando Tablas dinmicas ingresando al men


Datos de Excel y eligiendo la opcin asistente de Tablas dinmicas, inicialmente
los valores de Xi deben ingresarse en una columna de la hoja de clculo. En la
hoja de clculo pueden haber ms de una variable y realizar cruces entre ellas
segn el plan de tabulacin y objetivos de la investigacin.
Resultado de la aplicacin del asistente de tabla dinmica

Cont ar
X

Total

de

0
1
2
3
4
5
6
7
general

Total
2
2
4
5
3
7
3
4
30

En general, para construir una tabla de frecuencia, se requiere realizar dos


operaciones:
1) Clasificacin: consiste en determinar las categoras, los distintos valores que
toman las variables o los intervalos de clase.
2) Tabulacin: consiste en contabilizar cuantas veces se repite cada valor distinto
o categora de la variable. En el caso de intervalos de clase se distribuye los
elementos de la muestra o de la poblacin en la respectiva categora o intervalo
ELEMENTOS DE UNA TABLA DE DISTRIBUCION DE FRECUENCIAS
1. Valor de la Variable o Intervalo de Clase: Son los distintos valores, categoras
o intervalos de la variable. Se representa por X i
o [Xi -1 - Xi )
2. Frecuencia Absoluta Simple: es el nmero de veces que se repite un
determinado valor de la variable, en el caso de intervalos es el nmero de
observaciones comprendido en dicho intervalo y se simboliza por ( f i ) donde i
toma valores entre 1 y m donde m representa el nmero de valores distinto que
adopta la variable.
Propiedades:
1) Las
fi son nmeros enteros no negativos y no mayores que n
0 <= fi <= n
2) La suma de todas las fi es igual al tamao de la muestra
m
f1 + f2 + f3.+ fm = fi = n
i=1
3. Frecuencia Relativa Simple: es el cociente fi /n , que se simboliza por h i donde
i toma valores entre 1 y m. Esta frecuencia se puede expresar en trminos
porcentuales.
hi = (fi /n)* 100
Propiedades:
1) Las fi son nmeros fraccionarios no negativos y no mayores que 1
0 <= hi <= 1
2) La suma de todas las hi es igual a la unidad

h1 + h2 + h3.+ hm

m
= hi = 1
i=1

4) Frecuencias absolutas Acumuladas es la suma acumulativa de las


frecuencias absolutas simple. Se simboliza por F i donde i =1 a m. Se determina de
la siguiente manera :
F1 = f1
F2 = F1 + f2
F3 = F2 + f3
:
:
Fm = Fm-1 + fm
Propiedades:
1) Las
Fi son nmeros enteros no negativos y no mayores que n
0<= Fi <= n
2) La ltima frecuencia absoluta acumulada ( F m )es igual al tamao de la muestra
Fm = n
5) Frecuencias Relativa Acumulada: es la suma acumulativa de las frecuencias
relativas simples. Se simboliza por Hi donde i =1 a m. Se determina de la siguiente
manera :
H1 = h1
H2 = H1 + h 2
H3 = H2 + h 3
:
:
Hm = Hm-1 + hm
Propiedades:
1) Las Hi son nmeros fraccionarios no negativos y no mayores que 1
0<= Hi <= 1
2) La ltima frecuencia relativa acumulada ( Hm ) es igual al tamao a la unidad
Hm = 1
TABLAS CON INTERVALOS DE CLASE:
Definicin de Intervalos: pequeos segmentos resultado de dividir el gran
segmento llamado Rango o Recorrido, el cul est constituido por el valor mnimo
y el valor mximo de un conjunto de datos
I1
Xmin

I2

I3

I4
Xmax

longitud

amplitud( C )
Extremo inferior

Extremo Superior
I2 :intervalo No. 2

Los intervalos se construyen de la siguiente manera:


1 Determinar el Rango o Recorrido (R) =X valor mximo X valor mnimo del
conjunto original de datos recolectados
.
2 Calcular el Nmero de Intervalos de clase (m) o sea en cuantas partes se va ha
dividir el Rango. Utilizando la regla de Sturges a fin de uniformizar criterios
utilizaremos la siguiente ecuacin:
m = 1 + 3.322*log (n ) redondeado a entero
3. Clculo de la longitud o anchura del intervalo llamado Amplitud (C): mediante la
siguiente ecuacin:
R
C=
m
Caracterstica de la Amplitud: sta debe ser exacta con el menor nmero de
decimales, (el mismo nmero de decimales que los datos originales)
4. Calculo de la diferencia o exceso D= m*C - R
4.1 Si D = 0, Entonces los valores: mnimo, mximo, m, y C son los valores
adecuados para construir la tabla de distribucin de frecuencias
para la variable en estudio.
4.2 Si D>0, Entonces la diferencia se debe repartir en lo posible
equitativamente entre el valor mnimo y mximo, (restando al
mnimo y sumando al mximo) m, y C quedan como estn y sern
los valores adecuados para construir la tabla de distribucin de
frecuencias para la variable en estudio. En caso que la diferencia
sea un nmero impar se desdoblar y el menor se le restar al
valor mnimo de los datos y mayor se le sumar al valor mximo.
4.3 Si D <0, Entonces se realiza dos pasos:
i) (m+1)*C - R = D
ii) (C + 1)*m R =D cabe aclarar que se le suma una unidad de
medida de acuerdo si los valores originales, si son entero ser 1, si
los datos estn en dcimos, centsimos o milsimos se le
aumentar a C.
Luego se comparar D vs D el D menor se repartir segn 4.2 y se tomar el
m o C incrementado en la unidad segn sea el caso .y se construye la tabla
de distribucin con intervalos de clase
datos originales
Xi

Xi

82
58
95
60
92
62
62
64
85
68
92
70
82
74
95
75
70
76
85
76
84
80
95
82
91
82
82
82
94
84
76
85
88
85
91
85
87
87
80
88
68
88
58
91
76
91
85
92
110
92
60
94
75
95
88
95
64
95
74
110
n=
. =CONTAR(C91:C120) 30
Xmin
=MIN(C91:C120)
58
Xmax
=MAX(C91:C120)
110
R=
52
m=
=1+3.322*LOG(n) 5.9070
6 redondeado a entero
C=
R/m
8.67
9 redondeado al nmero de decimales
que tienen los datos originales
D=m*C-R
6*9-52=54-52=
2
Como D>0
entonces D=2 se reparte equitativamente entre el Xmin y
Xmx de la siguiente manera D/2=2/2=1
Xmin =58-1=57
nuevo valor mnimo
Xmax =110 + 1=111 nuevo valor mximo
y Luego se construye tabla de distribucin de frecuencia con intervalo de clase donde m= 6 , C= 9
y X mn=57 y Xmx=111

[X'i-1

X'i )

Xi

fi

hi

Fi

Hi

F*i

H*i

57

66

61,5

0.1333

0.1333

30

1.0000

66

75

70,5

0.1000

0.2333

26

0.8667

75

84

79,5

0.2333

14

0.4667

23

0.7667

84

93

88,5

11

0.3667

25

0.8333

16

0.5333

93

102

97,5

0.1333

29

0.9667

0.1667

[102

111)

106,5

0.0333

30

1.0000

0.0333

30

1.0000

n=

El Primer Intervalo Clase tiene como extremo inferior(57) el valor mnimo


segn el caso, del punto 4 y como extremo superior el resultado de sumarle al
extremo inferior la amplitud.(57+9=66)
El Segundo Intervalo de clase tiene como extremo inferior al extremo superior
del anterior intervalo(66) y como extremo superior tendr el resultado de sumarle
al extremo inferior la amplitud(66+9=75). De esta manera se construye los otros
intervalos de clase.
5. Antes de dar inicio a la operacin de conteo de cuantas observaciones caen en
cada intervalo se debe definir si son cerrado [ por la izquierda y abierto por la
derecha o vice versa]
Como norma tcnica los intervalos de clase se construirn cerrados por la
izquierda y abierto por la derecha
[Xi -1 - Xi ) se lee
57 se toma este valor

y los valores menor que 66

Otro elemento en esta tabla con intervalos de clase, es la Marca de clase o punto
medio Xi que es la semisuma de los extremos de los intervalos:
Xi-1+Xi
Xi =
2
Principales Grficos
Grfico de Barras y circular se utiliza para variables cualitativas. Del ejemplo de la
investigacin tenemos:

No. DE
PRO DUCTO S

NUMERO DE PRO DUCTO S SEGN TIPO DE


DEFECTO
8
6
4
2
0

7
5
3

TIPO DE DEFECTO

Para variables cuantitativas discretas:

sd

Grfico de barras

Escalera

Para Variables con intervalos de clase


Histograma de frecuencias (fi o hi )

Polgonos de frecuencias (fi o hi y Xi) este grfico nos da la forma de la distribucin de


datos

Ojivas ascendentes y descendentes

MEDIDA DE RESUMEN O ESTADSTICOS


Son valores resumidos de una muestra de valores de una variable. Estos
estadsticos son los siguientes: Estadsticos de Posicin Central, Estadstico
Variacin o dispersin, Estadstico de Asimetra o Deformacin, Estadstico de
apuntamiento o Kurtosis
MEDIDAS DE POSICIN CENTRAL O ESTADGRAFOS DE POSICIN
CENTRAL
Estadgrafo de Posicin Central de un conjunto de datos: es un valor que se
calcula para este conjunto, se dice que es el ms representativo y que tiende a
posicionarse en el centro del conjunto de datos ordenados. Los principales son:
Media Aritmtica o Promedio: se define como la divisin de la suma de todos los
valores entre el nmero de valores. Se representa

X = X1 +X2 +X3 ................. Xn =


n

Xi
n

Ejemplo: Calcular la venta promedio de 10 vendedores del enunciado siguiente:


En el mes de diciembre del ao 2,015, 10 vendedores de artculos
electrodomsticos de un total de 150 vendedores, vendieron el siguiente nmero
de aparatos, 10,11, 5, 14, 10, 8, 11, 16, 11, 8.
Caracterizacin del problema:
Poblacin: 150 vendedores de la empresa en el mes de diciembre.
Unidad Estadstica:1 vendedor
Muestra: 10 vendedores
Caracterstica o variable: Nmero de aparatos vendidos, representado por X i
donde el sub_ndice vara de 1 a 10, es decir, cuando i toma el valor de 1 entonces
X1 significa, el nmero de aparatos vendidos por el primer vendedor.
Tipo de dato que adopta la variable: discreto, porque resulta de la operacin de
contar.
Entonces: utilizando la frmula del promedio tenemos:
X = X1 +X2 +X3 ................. X10 =
n

Xi
n

X = 10+11+ 5+ 14 + 10 + 8 + 11 +16 +11 + 8 =104 = 10.4 10


10
10
Interpretacin de este resultado es: que los 10 vendedores en promedio vendieron
10 artculos cada uno.
Este procedimiento manual de clculo, puede ser sustituido utilizando la hoja de
clculo de Excel de la siguiente manera:
1ro Ingresar a una hoja de clculo
2do En una de las columnas ingresar el nombre o smbolo de la variable en
estudio.
3ro Debajo del nombre de variable ingresar los valores de la variable.
4to Una vez terminado de ingresar el ltimo valor de la variable, en la siguiente
celda escribir la funcin =PROMEDIO(B2:B11) y obtendr el valor promedio.
Funcin en excel
VENTAS(Xi)
1ER VENDEDOR
10
2DOVENDEDOR
11
3ER VENDEDOR
5
4TOVENDEDOR
14
5TOVENDEDOR
10
6TO1ER VENDEDOR
8
7MOVENDEDOR
11

8AVOVENDEDOR
9NOVENDEDOR
10MOVENDEDOR
PROMEDIO

=promedio(b2:b11)

16
11
8
10.4

Media Ponderada: promedio ponderado es una media aritmtica, en la cual se


considera a cada uno de los valores de acuerdo con su importancia en el grupo
X = Xi Pi
Pi

En trmino de operacin, cada uno de los valores de grupo X i se multiplica por el


factor de ponderacin apropiado (P) y despus se suman estos productos y la
suma se divide entre los pesos (o ponderaciones)
Ejemplo: en una CIA se maneja 4 productos, los mrgenes de utilidad
promedio ser:
En principio caracterizaremos el problema:
Poblacin: Productos ofrecidos por la empresa
Unidad Estadstica:1 producto
Muestra: 4 productos A, B, C, D
Caracterstica o variable: margen de utilidad, representado por X i donde el
sub_ndice vara de 1 a 4, es decir, cuando i toma el valor de 1 entonces X 1
significa, el margen de utilidad del producto A, X 2 el margen de utilidad del
producto B, X3 el margen de utilidad del producto C, X 4 el margen de utilidad del
producto D.
Tipo de dato que adopta la variable: Continuo no dato entero est dado en un
intervalo de valores.
Si calculamos el margen de utilidad promedio de estos 4 productos utilizando el
promedio simple tenemos:
X= 4*2%+5*5%+7*4%+10*1% = 6.8%, sin embargo
4
este promedio es incorrecto, porque se vendieron cantidades distintas de los 4
productos.
Por lo tanto se debe calcular el promedio ponderado que describe en forma
correcta el promedio global de la forma siguiente:

MARGEN DE UTILIDAD Y VOLUMEN DE VENTAS


DE LOS 4 PRODUCTOS
PRODUCTO
A
B
C
D

MARGEN
UTILIDAD(Xi)
4.2%
5.5%
7.4%
10.1%
TOTAL

_
X =XP/P=

VENTAS(Pi)
30,000,000
20,000,000
5,000,000
3,000,000
58,000,000

(Xi)(Pi).
1,260,000
1,100,000
370,000
303,000
3,033,000

3,033,000/58,000,000 =5.2%

LA MEDIA ARITMTICA PARA DATOS AGRUPADOS


Cuando los datos se presentan en una tabla de distribucin de frecuencias, se
utiliza el punto medio de cada clase como aproximacin de todos los valores
contenidos en ella. Y la media se calcula de la siguiente manera:
X = X1f1 + X2f2 + X3f3 ................ Xmfm. =
n

Xifi
n

El promedio se utiliza cuando los datos son homogneos es decir que estos no
varan entre ellos mucho.
Ejemplo
TABLA DE DISTRIBUCIN DE LAS VENTAS MENSUALES DE 30
VENDEDORES

[X'i-1
57
66
75
84
93
[102

__

X'i )
66
75
84
93
102
111)

Xi
61,5
70,5
79,5
88,5
97,5
106,5
n=

fi

Xi*fi
4
3
7
11
4
1
30

246
211,5
556,5
973,5
390
106,5
2484

X= Xifi/n=

2,484/30=

82.8

MEDIANA(Me)
Es la medida de posicin central que se sita en el centro de los valores
ordenados de una variable y divide en dos partes iguales

50%
50%
Me
Mediana para datos sin tabular:
De un grupo de datos ordenados en forma ascendente o descendente, la Me es el
valor que se sita en el centro, si el total de datos es un nmero impar.
5, 8, 8, 11, 11, 14, 16
Me=11
y si es un nmero par, la mediana es el promedio de los valores centrales.
.
Ejemplo: Si 8 vendedores de artefactos electrodomsticos vendieron el siguiente
nmero de aparatos ordenados ascendentemente:
5, 8, 8, 10, 11,13, 14, 16
en este caso el nmero total de datos es un nmero par 8 entonces la mediana
(Me)=(10+11)/2=10,5=11
Interpretacin: El 50 % de los vendedores o sea 4 vendieron menos de 11
artefactos electrodomstico, mientras que el otro 50% vendieron igual o ms de 11
artefactos.
La mediana se puede calcular en una hoja de clculo de Excel utilizando el mismo
procedimiento para el clculo del promedio excepto que la funcin es la siguiente:
=MEDIANA(B2:B10)
Mediana para datos tabulados
Procedimiento:
1ro. Calcular n/2, valor hasta donde est acumulado el 50% de los valores de la
variable donde n= es el tamao de la muestra.
2do Comparar n/2 con los valores de la Frecuencia absoluta acumulada F i

3ro Suceder que Fi-1 <n/2< Fi


Donde Fi es la frecuencia absoluta acumulada inmediata superior a n/2 llamada
frecuencia mediana y Fi-1 es la frecuencia inmediata inferior a n/2.
4to. Luego de determinar el Intervalo Mediano(IMe) el cul corresponde a F i
5to. El lmite inferior X i-1 y la amplitud Ci del IMe se utilizar en la siguiente
formula de la mediana
Me = X i-1 + Ci

n/2 - Fi-1
Fi - Fi-1

Ejemplo: Los salarios semanales de 100 trabajadores no calificados se presenta


en la siguiente tabla:
SALARIO
Xi
fi
Xi*fi
Fi
Xi-1 Xi-1
2400 2599 2499.5
7 17,496.5
7
2600 2799 2699.5
20 53,990.0
27
2800 2999 2899.5
33 95,683.5
60
3000 3199 3099.5
25 77,487.5
85
3200 3399 3299.5
11 36,294.5
96
3400 3599 3499.5
4 13,998.0
100
TOTAL
100 294,950.0
PROMEDIO = 294,950.0/100=
MEDIANA
n/2
= 50

2949.5

n/2 vs Fi

27<n/2<60

Fi
Fi-1

=
=

60
27

IMe

[2800-2999) Intervalo mediano

X'i-1

2800 extremo inferior del intervalo mediano

Ci

2999-2800 =

Reemplazando en la frmula
Me
= 2800+199*( 50-27)
(60-27)

199 amplitud
=2938.69697=2938.70=2939

La mediana es el valor que no est influenciado por lo valores extremos, por lo


que es la mejor medida posicin central. En caso de sueldos, salarios esta es
aplicable mejor que la media aritmtica o promedio
Se utiliza la mediana en el caso de tablas con intervalos abiertos tanto en el
extremo inferior en el primer intervalo o en el extremo superior del ltimo intervalo
Ejemplo:
SALARIO
Xi-1 Xi-1
Menor que 2599
2600 2799
2800 2999
3000 3199
3200 3399
3400 3599

fi

SALARIO
Xi-1 Xi-1
2400 2599
2600 2799
2800 2999
3000 3199
3200 3399
Mayor que 3399

fi

7
20
33
25
11
4
100

7
20
33
25
11
4
100

Fi
7
27
60
85
96
100

Fi
7
27
60
85
96
100

MODA(Mo)
Es otra medida de posicin central de un grupo de datos ordenados en forma
ascendente o descendente, es el valor que ms se repite en el grupo. Esta puede
o no existir, si existe puede ver ms de una Moda. Se simboliza por Mo.
Ejemplo: Si 8 vendedores de artefactos electrodomsticos vendieron el siguiente
nmero de aparatos ordenados ascendentemente:
5, 8, 8, 11, 11, 11, 14, 16 en este caso la Mo es el valor 11, puesto que es el
valor que se repite ms veces (3).
Si tuviramos las siguientes ventas: 5, 8, 8, 8, 11, 11, 11, 14, 16, entonces
existe dos modas Mo=8 y Mo=11, a esta distribucin se le conoce como
Distribucin Bimodal y si tuviramos las siguientes ventas: 5, 7, 8,, 10, 11, 13,
14, 16, entonces no existe modas, puesto que ningn valor se repite ms de una
vez.
Al igual que la Media y la Mediana, la Moda se puede calcular en una hoja de
clculo de Excel utilizando el mismo procedimiento descrito para el Promedio
excepto que la funcin es la siguiente: =MODA(B2:B10).

La Moda para datos Tabulados:


Procedimiento:
1ro. Se determina la Frecuencia Modal (f i), la cul es la mayor de todas.
2do Se determina la Frecuencia inmediata inferior a fi llamada f i-1 y la frecuencia
inmediata superior a fi llamada fi + 1
3ro Se calcula 1= fi - fi-1 2= fi - fi + 1
4to. Luego de determinar el Intervalo Modal (IMo) el cul corresponde a f i
5to. El lmite inferior X i-1 y la amplitud Ci del IMo se utilizar en la siguiente
formula de la mediana
1
1 - 2
Ejemplo: Los salarios semanales de 100 trabajadores no calificados se presenta
en la siguiente tabla:
Mo = X i-1 + Ci

SALARIO
2400
2600
2800
3000
3200
3400

2599
2799
2999
3199
3399
3599

Xi
2499.5
2699.5
2899.5
3099.5
3299.5
3499.5
TOTAL

fi

Xi*fi
7 17,496.5
20 53,990.0
33 95,683.5
25 77,487.5
11 36,294.5
4 13,998.0
100 294,950.0

MODA
fi

33

1
=
IMo
=
X' i-1 =
Ci
=

30-20 10
2800 2999
2800
2999-2800 =

Mo

2800+199(10/10+5)

fi-1 =20

Medida de Posicin No centrales


Cuartiles

7
27
60
85
96
100

fi+1 =25
2 = 30-25 5
199

Relacin entre la Media, Mediana y Moda


Se puede observar en el ejemplo anterior que :
Me < X < Mo

Fi

3994

Son tres puntos que dividen al conjunto de valores ordenados de una variable en
cuatro partes iguales entre cuartil y cuartil existe solo un 25 % de total de valores
de la variable
25%
25%
25%
25%
Q1
Q2
Q3
Q1 cuartil 1 o primer cuartil es el valor que deja atrs el 25 % del total de valores
menores que l y es superado por el 25 % del total de valores mayores que l.
Q2 cuartil 2 o segundo cuartil es el valor mediano
Q3 cuartil 3 o tercer cuartil es el valor que deja atrs el 75 % del total de valores
menores que l y es superado por el 25 % del total de valores mayores que l
Ejemplo para datos sin tabular
Caso1 cuando el numero de valores es un nmero par
Los siguientes datos corresponden a los tiempos (en minutos) que lograron 20
atletas en una prueba de 200 metros planos
2,0
1,3
1,7
1,8
1,9
2,6
2,8
1,2
2,8
2,3
1,7
1,9
2,4
2,5
2,2
2,6
1,5
2,0
1,6
2,3
Clculo de los cuartiles (Q1) (Q2) y (Q3)
1ro Ordenar de menor a mayor los datos
2do dividimos en dos partes (lnea roja)
3ro Se calcula la mediana de los 10 primeros datos =Q 1
4to la mediana de todos los datos Q2
5to se calcula la mediana del segundo grupo es decir =Q 3

1
2
3
4
5
6
7
8
9
10
11
12
13
14

xi
1,2
1,3
1,5
1,6

La mediana de los primeros 10 valores


1,7
1,7
Q1=(1,7+1,7)/2 =1,7
1,7
1,8
1,9
1,9
La mediana de los 20 valores
2,0
Q2=(2,0+2,0)/2= 2,0
2,0
2,0
2,2
2,3
2,3
la mediana de los 10 ltimos valores

15
16
17
18
19
20

2,4
2,5
2,6
2,6
2,8
2,8

Q3 =(2,4+2,5)/2 =

2,45

Caso2 cuando el nmero de valores es un nmero impar


xi
1,2
1,3
1,4
1,5
1,6
1,7
1,7
1,8
1,9
1,9
2,0
2,0
2,2
2,3
2,3
2,4
2,5
2,6
2,6
2,8
2,8

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

la mediana de los once primeros valores


Q1=1,7
la mediana de los 20 valores
Q2=2,0

la mediana de los once primeros valores


Q3=2,4

Para datos tabulados de la forma 1


Xi
2
3
4
5
6

fi
50
150
210
60
30
500

Fi
50
200
410
470
500

Primer cuartil
1ro se calcula n =500/4 =125
2do se compara de n con la Fi
Y se observa que:
50 <1/4n< 200
Fi-1

Fi

hi
10%
30%
42%
12%
6%

Hi
10%
40%
82%
94%
100%

3er paso el Q1 es igual al valor de la variable que pertenece F i para el ejemplo e


igual a 3 es decir Q1=3
Segundo cuartil
1ro se calcula 2/4de n =2*500/4 =250
2do se compara de n con la Fi
Y se observa que:
200 <2/4 de n< 410
Fi-1

Fi

3er paso el Q2 es igual al valor de la variable que pertenece F i para el ejemplo es


igual a 3 es decir Q2=4
Tercer cuartil
1ro se calcula 3/4de n =3*500/4 =375
2do se compara de n con la Fi
Y se observa que:
200 <3/4 de n< 410
Fi-1

Fi

3er paso el Q2 es igual al valor de la variable que pertenece F i para el ejemplo es


igual a 3 es decir Q3=4
Para datos tabulados de la forma 2
TABLA DE DISTRIBUCIN DE LAS VENTAS MENSUALES DE 30
VENDEDORES

[X'i-1
57
66
75
84
93
[102

X'i )
66
75
84
93
102
111)

Xi
61,5
70,5
79,5
88,5
97,5
106,5
n=

Primer cuartil
1ro se calcula n =1*30/4 =7,5
2do se compara de n con las Fi
Y se observa que:

fi

Fi
4
3
7
11
4
1
30

4
7
14
25
29
30

7 <1/4n< 14
Fi-1

Fi

Y se utilizar la siguiente frmula:


Q1=Xi-1 + Ci* [(1/4n-Fi-1)/(Fi -Fi-1)]
Donde: Xi-1 es el extremo inferior del intervalo que pertenece a Fi [X i-1 Xi)
Ci = es la amplitud del intervalo que pertenece a Fi
Reemplazando los valores en la frmula tenemos:
Q1=75 + 9*[(7.5-7)/(14-7)] =75,64

Segundo cuartil
1ro se calcula 2/4 de n =2*30/4 =15
2do se compara 2/4 de n con las Fi
Y se observa que:
14<2/4 de n< 25
Fi-1

Fi

Q2=84 + 9*[(15-14)/(25-14)] =84,82

Tercer cuartil
1ro se calcula 3/4de n =3*30/4 =22,5
2do se compara3/4 de n con las Fi
Y se observa que:
14 <1/4n< 25
Fi-1

Fi

Q3=84 + 9*[(22,5-14)/(25-14)] =90,95

Deciles

percentiles
Medidas de Dispersin o Estadstico de Variacin o de dispersin de un
conjunto de datos: es un valor que mide el grado de variabilidad de las
observaciones al rededor de un valor central o de posicin. Los principales son:
rango, desviacin media, varianza, desviacin estndar y coeficiente de variacin.
Existen distribuciones que siendo diferentes, tienen valores iguales para algunos
de sus estadgrafos de posicin , por ejemplo:
A) 3, 7, 4 6, 67, 81
X =40.8 Me=46
B)15, 38, 46, 52, 53
X =40.8 Me=46
Los dos conjuntos de valores tienen igual media y mediana; estos resultados
pueden conducir a conclusiones equivocadas cuando se est comparando grupos
o poblaciones.Para superar estas limitaciones se construyen otros estadgrafos
que analizan la variabilidad de los datos respecto a un valor central.
El Rango o recorrido: se define como la diferenvcia entre el valor mayor y el
mnor de un conjunto de datos.Se simboliza por R
R = Xmx - Xmn
Del ejemplo anterior tenemos que:
Para el grupo A) R= 81-3=78 y B) R=53-15=38
Significa la diferencia entre el mayor y menor valor.
El rango es muy limitado, pues solo considera los valores extremos y no dice nada
como varan los valores intermedios.
.
Desviacin Media (DM):o desviacin promedio de un conjunto de valores X 1, X2 ,
...... Xn se define por :
DM=|Xi - X|
n
Para datos tabulados DM = |Xi - X |* fi
n
Ejemplo:Distribucin de los salarios semanal de 100 trabajadores calificados
SALARIO
Xi
Fi
Xi*fi
|(Xi - X )|*fi
2400 2599
2500
7 17,496.5
3150
2600 2799
2700
20 53,990.0
5000
2800 2999
2900
33 95,683.5
1650
3000 3199
3100
25 77,487.5
3750
3200 3399
3300
11 36,294.5
3850
3400 3599
3500
4 13,998.0
2200
TOTAL
100 294,950.0
19,600.0
PROMEDIO = 294,950.0/100=
_
DM = |(Xi - X )|=19,600/100=
n

2949.5
196

Interpretacin: Expresa que el promedio de las desviaciones de los salario


semanales respecto al salario semanal es 196 soles.
La utilizacin del valor absoluto en la frmula asegura que las desviaciones
siempre sean no negativa, pero dificulta la operacin.
La Varianza: es el ms importante y se define como el promedio del cuadrado de
las desviaciones respecto a su media. Se simboliza por S2 o por V(X).
Frmula de clculo:
S2 = V(X) = (Xi - X )2
n-1

para muestra pequeas


o sea n 30

S2 = V(X) = (Xi - X )2
n

para muestra grandes


o sea n > 30

{( X1 - X)2 + (X2 - X)2 + (X3 - X)2...... + (Xn - X)2}/7


{(5-11) 2 + (8-11)2 + (8-11) 2 + (11-11) 2 + (11-11) 2 + (11-11) 2 + (14-11) 2 + (16-11) 2
}/7
{36 + 9+ 9+0+0+0+9+25|}/7=88/7=12.6 nmero de artefactos vendidos al
cuadrado. La varianza al igual que el promedio se puede calcular en excel
mediante la funcin =VAR(B2:B10)
Para datos tabulados
S2 = V(X) = (Xi - X )2 *fi
n
SALARIO
__ 2
Xi-1 Xi-1 Xi
Fi
Xi*fi
|(Xi - X )*fi
2400 2599 2499.5
7 17,496.5
1417500
2600 2799 2699.5
20 53,990.0
1250000
2800 2999 2899.5
33 95,683.5
82500
3000 3199 3099.5
25 77,487.5
562500
3200 3399 3299.5
11 36,294.5
1347500
3400 3599 3499.5
4 13,998.0
1210000
TOTA
100 294,950.0
5,870,000.0
L
PROMEDIO = 294,950.0/100=

2949.5

V(X) = (Xi - X )2 *fi =5,870,000/100=


n

58,700

Desviacin Estndar
Es la raz cuadrada de la Varianza. Simboliza por S

S = S2 esta desviacin estndar se puede calcular en la hoja de Excel,


utilizando la funcin =DESVEST(B2:B10).
Este estadgrafo es de mayor uso: para comparar grupos.
Una de las aplicaciones importante es analizar la dispersin a partir de una
distribucin terica llamada curva normal. Cuando n es grande(n>30), la
distribucin de los n valores es aproximadamente simtrico o tiene la forma de una
curva normal, en estas condiciones se sostiene que:
1. El 68% del total de valores estarn
comprendido dentro del intervalo (X-S , X+S)
2. El 95.5% del total de valores estarn
comprendido dentro del intervalo (X-2S , X+2S)
3. El 99.7% del total de valores estarn
comprendido dentro del intervalo (X-3S , X+3S

REGRESIN Y CORRELACIN
Estadsticamente interesa analizar la relacin entre dos o ms variables , siempre que
tenga un indicio que ella existe o por lo menos el grado de dependencia supuesta es
lgica.
En este tema se trata de predecir o explicar el comportamiento o el resultado de una
variable, as como investigar si ellas estn asociadas entre s y tiene el propsito
fundamental en proporcionar los procedimientos y las tcnicas para expresar y medir la
relacin o afinidad entre dos variables X e Y para n observaciones.
Intuitivamente
debemos determinar claramente que variable explica mejor el
comportamiento de la otra o en otras palabras, que variable depende de la otra. Con el
siguiente ejemplo ilustraremos esta premisa.
Por ejemplo: El Administrador de una Empresa con domicilio en Lima Metropolitana
remite, a 10 Departamentos importantes del pas un lote de producto por medio de un
camin, y a partir que el embarque estuvo listo para su transportacin, registra la distancia
en kilmetros y el tiempo de entrega: Tenemos que:
Distancia (En Km).
: 825 215 1070 550 480 920 1350 325 670 1215
El tiempo de entrega (En das ) : 3.5 1.0
4.0 2.0 1.0 3.0 4.5 1.5 3.0
5.0

Solucin
En principio tenemos dos variables es estudio :
La variable distancia (En Km.) lo simbolizaremos por X
El tiempo de entrega (En das ) se simboliza por Y
Analizamos : a mayor distancia del departamento de origen al departamento de destino le
corresponde mayor tiempo en la entrega del lote de producto. Por lo tanto el tiempo de
entrega estar dependiendo de la distancia entre el punto de origen y destino. Entonces
Tenemos que:

Y depende de X y lo expresamos Y= f(X) donde X se denomina variable independiente e


Y la variable dependiente.
Luego debemos realizar lo siguiente:

A) El conjunto de datos debe ser representado en el sistema cartesiano y habr tantos


puntos como pareja de observaciones se tenga (en el ejemplo: 10 puntos).Este grfico se
llama NUBES DE PUNTO, DISPERSIN O ESPARCIMIENTO el que puede tomar
diversas formas. Este grfico constituye el primer paso para investigar la relacin
existente entre 2 variables, nos da la tendencia de los datos y facilita la relacin de la
correspondiente funcin matemtica. Utilizando la hoja de clculo de Excel mediante el
siguiente procedimiento obtendremos el grfico de dispersin:
1.- Ingresar a Excel
2.- En la hoja de Clculo en la celda A1 escribir X y a partir de la celda A2 hacia
abajo ingresar los datos correspondiente a esta variable. En la Celda B1 escribir
Y a partir de la celda B2 hacia abajo ingresar los datos de esta variable.

3.- Seguidamente seleccionar(sombrear) a partir de la celda A2 hasta B11.

4.- Seguidamente presionar el cono insertar grfico y seleccionar de la seccin tipo de


grfico : grfico de dispersin y en la seccin sub tipo de grfico elegir la primera
opcin.

5.- Presionar el botn SIGUIENTE


6.- Aparecer el grfico de dispersin, y luego presionar el botn SIGUIENTE.

7.Aparecer una ventana de dilogo para ingresar principalmente el Ttulo del


Grfico( Observaciones Muestrales de Distancia de transporte y Tiempo de Entrega para 10
embarques elegidos al azar), el ttulo del eje X (Distancia en Km.) y el ttulo en el eje Y (Tiempo
de entrega en das).Existiendo en esta ventana otros botones para personalizar el grfico.

Luego presionar el botn SIGUIENTE.

8.- Aparecer una ventana de dilogo en la que sugiere si el grfico aparezca en la


misma hoja o en otra hoja de clculo. Presionar que aparezca en la misma hoja y el
botn TERMINAR.

9.- Mejorar la presentacin del grfico disminuir el tamao de las letras de los ttulos,
hacer clic en el rea de ttulo y presionar el botn derecho del mouse y saldr una
ventana donde se selecciona la opcin del Formato del Ttulo.

10-. Elegir fuente, tipo de letra Time New Roman, negrita, tamao 8 aceptar, para los
ejes de igual manera, hasta que el grfico se visualice bien.

B) Se elige el modelo o funcin matemtica que mejor represente o se ajuste a la nube


de puntos.
Por lo que recurrimos al estadgrafo llamado :
REGRESIN: el que investiga y define la relacin funcional entre 2 o ms variables y
la ecuacin de la funcin matemtica utilizada constituye la funcin o modelo de
regresin.
Dado (X,Y) se puede expresar como:
Y= f(X)
o
X=G(Y) o Y =f(X1 X 2 ... Xn)
Lo que significa que la relacin funcional permitir, explicar o predecir,
proyectar, pronosticar, estimar, el valor de una variable conociendo el valor de
la(s) otra(s) variable(s).
El hecho de tener una buena estimacin o prediccin con el modelo de regresin
depender del grado de asociacin entre las variables y que la funcin elegida se
ajuste lo mejor a la nube de puntos. Este grado de asociacin debe ser medido o
calculado utilizando el estadgrafo llamado CORRELACIN .
Cuando se relaciona dos variables, hablaremos de Regresin Simple y Correlacin
Simple. Si la funcin de regresin corresponde a una recta se llamar regresin lineal
y si es una curva (parbola, exponencial, etc.) se llamar Regresin no lineal.

REGRESION SIMPLE
El propsito de este tema es estimar la relacin que existe entre dos variables X e
Y que se expresa como :
Y= f(X)
donde Y depende de X, esto expresa que Y es un valor estimado a partir de
valores reales de X.
Y = llamada variable dependiente, predictando o explicada
X= llamada variable independiente, predictor o explifcativa
Tambin se puede expresar como X=G(X)
C) Para determinar o construir modelos o funciones de regresin es indispensable
disponer
de informacin acerca de los valores que ha alcanzado cada una de las
variables en distintos mementos o lugar
La funcin de regresin como modelo estadstico se construye a partir de una muestra
representativa de valores (Xi, Yj).
AJUSTE DE UN MODELO REGRESIN
Ajustar una funcin de regresin consiste en buscar y definir la funcin matemtica que
exprese con mayor precisin la relacin entre variables. Esta funcin permite obtener
valores estimados Y* = f(X) a partir de los valores de X , entonces la diferencia (e i)
entre los valores reales de Yi y los estimados Y* sea mnimo, entonces para cada valor
se tendra: Y-Y* = ei
Este problema de minimizacin, es resuelto utilizando el mtodo de Mnimos
Cuadrados.
Del ejemplo de Distancia en Km. y Tiempo de entrega en das de 10 embarques, la
variable dependiente Y Tiempo de entrega en das y la variable Independiente X
Distancia en Km. Porque a mayor distancia se utiliza mayor tiempo, entonces toda

relacin tiene un sentido o direccin , es decir . Que una variable siempre resultar
mejor explicada por la otra.
En el ajuste de funciones de regresin simple, se pueden utilizar diversas funciones
matemticas conocidas tales como:
a) La Lnea Recta Y* = a+b*X
b) La Parbola
Y* = a + b X + cX2
c) La Curva Potencial Y* = bXa
d) La curva Exponencial : Y* = a.bX
e) etc.
El problema de ajuste de una funcin de regresin a un conjunto de n valores (Xi,Yj),
comprende 3 pasos:
1 Graficar la nube de puntos (Xi,Yj) .Realizado en el punto A
2 Definir la forma de la funcin de regresin (recta, parbola,
exponencial.
3 Determinar el valor numrico de los parmetros de la funcin
elegida. Los parmetros de la funcin de regresin se deben obtener
a partir de las ecuaciones normales obtenida por mtodo de mnimos
cuadrados.

El Mtodo de Mnimos Cuadrados

Significa minimizar la suma de las desviaciones al cuadrado entre los valores


observados o reales Yi con los valores calculados o estimados Yi* de una funcin de
regresin.
Simblicamente significa minimizar la expresin
D=(Yi Yi*)2 =mnimo
Regresin Lineal Simple:
Lnea Recta de Regresin: Y* = a + bX
donde a y b son los parmetros y estos se calcula mediante las ecuaciones normales
resultado de aplicar el mtodo de mnimos cuadrados
D=(Yi - Y*i) 2 =mnimo
reemplazando Y* tenemos que D=(Yi - a + bX) 2 minimizar significa derivar
parcialmente D. Obtenindose las dos ecuaciones Parciales:
_
_
a= Y - b*X
b= Cov(X,Y) / V(X)
En la grfica de nube de puntos del ejemplo inicial se puede observar que la tendencia de
los puntos es lineal y creciente, es decir, que a mayor distancia le corresponde mayor
tiempo en la entrega, por lo que se puede aseverar que el tiempo de entrega depende de
la distancia, que Y= f(X) y la nube de punto nos visualiza que se puede ajustar una lnea
recta. Utilizando Excel, ajustamos al grfico la lnea recta, mediante el siguiente
procedimiento:

1. Apuntando con el puntero del mouse sobre los puntos del grfico de dispersin
presionar el botn izquierdo del mouse, y los puntos se encendern.

2. Luego apuntando los punto encendido presionar el botn derecho del mouse y
aparecer una ventana y seleccionar la opcin Agregar Lnea de Tendencia.

3. Aparecer otra ventana de dilogo, presionar el botn TIPO y seleccionar tipo


de tendencia (lineal), l.

4.- Luego presionar el botn OPCIONES aparecer otra ventana de dilogo,


presionar el crculo correspondiente a Presentar la Ecuacin en el grfico y el
crculo correspondiente a Presentar el valor de R cuadrado en el grfico..

5.- Presionar el botn aceptar.

La ecuacin Y* = 0.1181+ 0.0036X es la funcin de regresin, la cul sirve para


estimar o predecir los valores de Y* conociendo los valores de X as por ejemplo :
para X=450 Km. tenemos que Y tiempo de demora es igual a 0.1181+
0.0036*450= 1.7381=1.7das..

CORRELACION LINEAL

Expresa el grado de asociacin o afinidad, entre las variables en estudio, tambin


explica el grado de la bondad del ajuste de las lneas de regresin. Y es calculado
mediante el Coeficiente de correlacin rectilnea de Pearson que se simboliza
por r y su frmula es la siguiente:
r

= Cov(X,Y) / SxSy

_ _
donde : Cov(X,Y) es la covarianza = (XY/n) - (X)(Y)
Sx es la desviacin estandar de X y Sy la desviacin estandar de Y.
Otra frmula: r = ( nXY - ( X) ( Y)) / ( n X2 - ( X2) ( n Y2 - ( Y) 2)
Propiedades de r:
-1 <= r <=1
entonces si:
r>0 existe correlacin directa positiva
r<0 existe correlacin inversa o negativa
r=1 existe una correlacin perfecta positiva
r=-1 existe una correlacin perfecta inversa o negativa
r>=+-0.6 existe una correlacin consistente
r=0 no existe correlacin
con los datos del ejemplo inicial calculamos el coeficiente de correlacin en EXCEL
utilizando el siguiente procedimiento con el ejemplo anterior tenemos:
1.- Situarse en la celda A14 escribir la letra r.

2.- En la celda B14 escribir la funcin = COEF.DE CORREL(A2:A11;B2:B11)


Luego presionar ENTER(INTRO) y saldr el resultado.

Donde se observa que r =0.95 existe una alta correlacin entre la variable X e Y , es decir
que la Ecuacin de Regresin Y* = 0.1181+ 0.0036X nos va ha dar, estimaciones muy
cercana a la realidad.

PROBABILIDAD
Introduccin
En la vida diaria, utilizamos muchas veces la palabra probabilidad, o posibilidad,
para referirnos por ejemplo si llegaremos a tiempo a auxiliar a un accidentado en
un choque automovilstico.O la posibilidad de que un nuevo tratamiento sea ms
efectivo en un tipo de enfermedad.O la posibilidad de que gane la Tinka si compr
10 nmeros. Estas situaciones implican incertidumbre, cuyos resultados no se
pueden determinar anticipadamente, sin embargo si es posible definir, medir,
estimar o predecir el posible resultado estadsticamente con la ayuda de la
Probabilidad.
En gentica es cierto saber si un descendiente ser macho o hembra, pero en un
plazo largo se conoce aproximadamente el porcentaje de descendiente que sern
machos y el de aquellos que ser hembras. Una CIA de seguros de vida no puede
predecir qu personas de un pas morirn a la edad de cincuenta aos, pero si
puede predecir bastante satisfactoriamente cuantas personas de ese pas morirn
a esta edad.
Definicin de Probabilidad Se puede definir como el estudio de lo experimentos
o fenmenos aleatorios o libres de determinacin.
Es una herramienta fundamental para medir la posible ocurrencia de un
experimento aleatorio .
Est constituido por un conjunto de mtodos y tcnicas utilizadas en la medicin y
prediccin de experimentos aleatorios.
Experimento():Consiste en cualquier operacin llevada a cabo sobre alguna
unidad de observacin que produce sucesos o resultados. Los experimentos
pueden ser Determinstico o No Determinstico
Experimento Determinstico:que por sus condiciones, se puede conocer con
antelacin un resultado particular del experimento. Ejemplo: a) La suma de dos
nmeros pares, b) Se tira una pelota al aire c) Se saca de una urna una ficha
donde todas son de color rojo.
Experimento No Determinstico o Aletorio: Son aquellos experimentos que no
se pueden conocer con antelacin un resultado particular del experimento. Pero se
puede definir el conjunto de posibles resultados. A estos experimentos estudia la
probabilidad Ejemplo:

Experimento
a) Seleccionar una familia de un distrito,
b) Administrar una droga a cuatro animales
c) Lanzar una Moneda.

Observac/medida
Contar el nmero
de hijos dependientes.
Registrar el de laboratorio
tiempo que toma la droga para
hacer efecto sobre cada animal.
Registrar lo predominante, ya

Espacio Muestral:Es el conjunto de todos los posibles resultados de un


experimento aleatorio. Se simboliza por . De los ejemplos anteriores tenemos
que:
a) ={0,1,2,3,4,5,.....} posibles resultados(dependientes).
b) ={1,2,3,4,5,6,...., minutos}
c) = {C,S}
2 posibles resultados.
Cada resultado del experimento se llama punto muestral o suceso elemental.
EVENTOS: Son sub conjuntos del espacio muestral asociado a un experimento
aleatorio.
Se simboliza por la letras A,B,C, etc.
Ejemplo. Se lanzar un dado sobre la mesa obtener un nmero par.
: el experimento aleatorio consiste en lanzar el dado.
S: {1, 2, 3, 4, 5, 6} es el espacio muestral.
A: {que aparezca un nmero par}
Se observa en S que existe 3 punto que tienen este atributo}
Eventos Especiales
a) Evento elemental: tienen un solo resultado.
b) Evento imposible: es el evento que nunca ocurre conocido como (vaco).
c) Evento seguro: evento que siempre ocurre y es S.
Operaciones con Eventos:
a) Unin de Eventos: sea A y B dos eventos definidos en un mismo S. El evento
A unido con B denotado por AB ocurrir si A ocurrre B ocurre ambos ocurren
Ejemplo. Se lanzar un dado sobre la mesa obtener un nmero par o un nmero
mayor que 3.
: el experimento aleatorio consiste en lanzar el dado.
: {1, 2, 3, 4, 5, 6} es el espacio muestral.
A: {que aparezca un nmero par}
Se observa en que existe 3 punto que tienen este atributo}
A: {2, 4, 6} entonces n(A) = 3 posibles resultados
B: {que aparezca un nmero>3}
Se observa en que existe 3 punto que tienen este atributo}
B: { 4, 6} entonces n(B) = 2 posibles resultados por lo tanto
AB={que aparezca un nmero par un nmero mayor que 3}
AB={2,4,6}
b) Interseccin de Eventos: sea A y B dos eventos definidos en un mismo . El
evento A Interseccin con B denotado por A B ocurrir si A ocurrre y B ocurre
ambos ocurren. Es decir cuando tienen elementos comunes.
Ejemplo. Se lanzar un dado sobre la mesa obtener un nmero par y un nmero
mayor que 3.
: el experimento aleatorio consiste en lanzar el dado.
: {1, 2, 3, 4, 5, 6} es el espacio muestral.
A: {que aparezca un nmero par}
Se observa en que existe 3 punto que tienen este atributo}

A: {2, 4, 6} entonces n(A) = 3 posibles resultados


B: {que aparezca un nmero>3}
Se observa en que existe 3 punto que tienen este atributo}
B: { 4, 6} entonces n(B) = 2 posibles resultados por lo tanto
A B={que aparezca un nmero par y un nmero mayor que 3}
A B={4, 6}
c) Eventos Mutuamente Excluyente o disjunto : sea A y B dos eventos
definidos en un mismo . Se dice que A y B son mutuamente excluyente cuando
no pueden ocurrir junto, entonces A B= (vaco).
Ejemplo. Si en la poblacin mayor de 15 aos de edad se define los eventos: A.
{Poblacin analfabeta} y B: {Mdicos].
A B=
TCNICAS DE CONTEO
Son reglas matemticas que tienen por objeto determinar el nmero de maneras
en que puede ocurrir un experimento aleatorio o un suceso, sin necesidad de
enumerar sus resultados posibles.
1) Principio de Multiplicacin: si una operacin A se puede presentar M
maneras diferentes y una operacin B se presenta de N maneras
diferentes, entonces los dos A y B se pueden presentar de M*N maneras
diferentes. (una operacin despus de la otra)
Ejemplo:
Un edificio tiene cuatro puestas de acceso
a) De cuantas maneras puede una persona entrar y salir del edificio
b) De cuantas maneras puede entrar y salir si no utiliza la misma puerta dos
veces.
Desarrollo:
a)
b)

4*4 =16
4*3 =12

Si las operaciones E1 , E2 , E3 , E4........., Ek se pueden ejecutar de n1, n1 ,


n1........,nk maneras diferentes, entonces todos ellos, uno despus de otro. Se
realizaron de n1* n2,*. n3........*nk maneras diferentes.
Ejemplo:
Se van a repartir 5 premios de diferente valor entre igual nmero de personas
(A, B, C, D, E)
a) De cuantas maneras se puede hacer la distribucin de los premios.
5*4*3*2*1 = 120
b) En cuantos casos se tendr que B recibe el 1 er premio y E el 5to premio.
3*2*1= 6

Ejemplo:
Se ha entrevistado a 10 personas sobre su aceptacin o no por un producto de
consumo masivo. cuntas respuestas diferentes pueden darse?
2*2*.......2 = 210
10 veces
Ejemplo:
4 artculos A, B, C, D van a ser colocadas en 4 espacios E 1, E2, E3, E4 con la
posibilidad de colocar ms de un artculo en un espacio.
a) De cuantas formas diferentes se pueden hacer la distribucin de los
artculos.
4*4*4*4 =44
b) En cuantos casos se habr colocado un artculo en cada espacio.
4*3*2*1 = 24
b) En cuantos casos se tendr el espacio E1 vaco
34 =81
c) En cuantos casos se tendr 2 espacios vacos.
6*24 =96
Ejemplo:
En un saln de clase hay 12 alumnos (7 hombres, 5 mujeres) los cuales deben
exponer un tema uno tras otro.
a) Cuntas formas diferentes de exposicin se pueden dar?.
12*11*10*..........*1 =12! = 479001,600
b) Cuantas formas diferentes de exposicin si debe empezar un hombre y
terminar una mujer.
H

M
7!

10!

5!
=(7!)(10!)(5!) =2,1947E+12
c) Cuantas formas diferentes de exposicin habr si empiezan las mujeres y
despus los hombres.
(5!)*(7!) = 604800
2) Principio de Adicin
Si las operaciones E1,E2,........EK se pueden realizar de n1,n2,...........nk manera
respectivamente, entonces la operacin E1 E2............ EK se realizar de n1 +
n2 +.......+nk = ni maneras diferentes.
Ejemplo:

Una persona desea comprar una Pentiun IV la cul es ofertado en 3 tiendas de


la zona A, 5 en B y 2 en C. De cuantas maneras puede ser la compra.
(3+ 5+2) =10
3) Permutaciones
Son arreglos de los elementos de un conjunto tomando en cuenta el orden.
a)
Permutaciones de los n elementos de un conjunto tomados todos a
la vez
Pnn = n(n-1)(n-2)........1 =n!
Ejemplo:
Se van a colocar 10 fichas de distinta numeracin en igual numero de casillero
(1 ficha en cada casillero).
a) De cuantas maneras se puede hacer la distribucin.
P1010 = 10! =3628,800
Nota: utilizando Excel el factorial de un nmero se calcula utilizando la funcin
=FACT(n) y enter.
b) En cuantos casos la ficha 1 se ubicar en la casilla 4 y la ficha 5 en la
casilla 10.
P88 = 8! = 403,020
Ejemplo:
Con los 10 primeros digitos (0, 1, 2,...........9) se desean formar nmeros de 10
cifras sin repeticin de los mismos.
a) Cuntos nmeros se tendrn
9 p99 = 9*9! = 3265,920
c) Cuntos de los nmeros formados sern impares.
8 8! 5

d) Cuantos nmero empezarn con 357.


7!
b)
Permutaciones de n elementos de un conjunto tomados k de
ellos sin repeticin
Pnk = n(n-1)(n-2)........(n-k+1)
n!
P

=
(n k)!

Ejemplo:
A una competencia se han presentado 8 candidatos y se van a repartir solo 3
premios.
De cuantas maneras se har la premiacin?
8!
P8 3=

= 336
(8 3)!

c)
Permutaciones con Repeticin
Si un experimento aleatorio puede ocurrir de n maneras diferentes y se repite
r veces bajo las mismas condiciones entonces el nmero de maneras en que
se puedan dar en las r repeticiones.
Pn r = n r
Ejemplo:
Una variable X toma 5 valores diferentes. Se desea extraer muestras de 3
elementos c/u con repeticin cuntas muestras diferentes se podrn extraer?
P5 3 = 53 =125
Ejemplo:
De cuantas formas diferentes puede un alumno responder un examen de 10
preguntas que tiene 4 alternativas c/u de ellas.
P4
d)

10

= 410

Permutaciones por Grupo

Si los n elementos de un conjunto han sido clasificados en K grupos con


n1, n2,.......nk elementos respectivamente, entonces el nmero de formas que
se pueda hacer la clasificacin completa es.
n!
n
P n1,n2,....nk =
n1! n1! ...... nk
Ejemplos:
Los artculos producidos en una fabrica pueden ser clasificados como:
excelentes, buenos y defectuosos; suponga que se analiza la calidad de 12
artculos.
a) Cuntas formas de clasificacin existir.
P3

12

= 312

b) En cuntos casos resultar igual nmero de artculos de cada calidad.


12!
P12 4,4,4 =
4! 4! 4!
c) En cuantos casos se tendr 2 excelentes y 3 defectuosos.
12!
P12

2,7,3 =

2! 7! 3!
4) Combinaciones
Son arreglos de los elementos de un conjunto sin tomar en cuenta el orden.
a)
Combinaciones de los n elementos de un conjunto tomados K de
ellos sin repeticin
n!
Cn k = (

k) =

K!(n k)!
La combinacin tambin se puede calcular por medio de Excel utilizando la
funcin : =combinat(n;K) donde n es el total de elementos
Propiedades:
a) (

) =n

c)

n
0

) =1

b) (

) =1

Ejemplo:
Se tiene en una caja de 12 Diskettes de los cuales 4 son de marca Maxel, 5 de
National, 3 de 3M. Se eligen al azar y sin reposicin 3 diskettes despus de
haber desprendido sus etiquetas.
a) De cuantas maneras se podr hacer la eleccin.
12
12
( 3) =
= 220
3! 9!
b) En cuantos casos los 3 diskettes elegidos sern de la misma marca.
( 43) * ( 80) + ( 53) * ( 70) + ( 33) *( 90) =
c) En cuantos casos tendremos ms diskettes de Maxel que de las otras
marcas.
( 52) * ( 71) + ( 53) * ( 70)

d) En cuantos casos se habr elegido a lo ms un diskette de marca 3M.


( 30) * ( 93) + ( 31) * ( 92)

Ejemplo:
Se van a colocar 5 artculos diferentes en 5 lugares distintos (puede ubicarse
ms de un artculo en un espacio)
a) Cuntas formas de ubicacin existen.
n() = 55
b) En cuantos casos los 2 primeros espacios quedarn vacos.
///// /////
///// /////
///// /////
///// /////
///// /////
/ ////
n(A) = 35
c) En cuantos casos se habrn utilizado 2 espacios.

( 52) * ( 52) *2 + ( 51) * 2

d) En cuantos casos quedar a lo mas un espacio.


5! + 5*4( 52) *3! =
Definicin clsica de probabilidad:
Un experimento estadstico consiste en hacer rodar un dado el cul generar un
espacio muestral con 6 casos posibles, :{1, 2,3, 4, 5, 6}, la posibilidad que tiene
cada cara de salir es 1/6. Si se define el siguiente evento A: " obtener un nmero
par" entonces hay 3 maneras que cumplan con la condicin n(A)= {2, 4, 6} =3, por
lo tanto
n(A)
3
p(A) =
=
= 0.5
n()
6
Por lo que se concluye que:
Nmero de casos favorable
p(A) =

=
Nmero de casos Posibles

Ejemplo: en una caja hay 9 diskettes, de los cuales 3 son de marca Maxell, 4
de marca 3M y 2 de marca Imation. Cul es la probabilidad de extraer un
diskette de marca Imatin?

: el experimento aleatorio consiste en extraer un diskette


: {existen 9 posibilidades de extraer un diskette} es el espacio muestral.
A: {que el diskette extraido sea de la marca Imation}
Entonces n(:)= 9 posibilidades
n(A) : {existen 2 casos con el atributo que sean de marca imation }
por lo tanto :
n(A)
2
p(A) =
=
=0.22
N(:)
9

Variables aleatorias.
Es una funcin matemtica que asocia a cada uno de los elementos del
espacio muestral un nmero, si estos nmero es un conjunto contable (finito
o numerable )) se dice que la variable aleatoria X es discreta ; x el valor de la
v.a discreta puede tomar valores como X=0,1,2,3, 4.......,. Si el rango de X es
continuo se dice que la variable aleatoria X es contnua , donde x puede
tomarcualquier valor de cierto intervalo o coleccin de intervalos sobre la
recta real.
Ejemplo:
Si el experimento aleatorio consiste en lanzar dos moneda sobre una mesa ,
este generaq un espacio muestral siguientes:
S:{cc, cs, sc, ss} y se define la v.a X como el nmero de caras obtenida al
lanzar las dos monedas.
Por definicin de variable aleatoria X asocia a cada uno de los elemento del
S un nmero de la siguiente manera:
W1=(CC)
W2 =(CS)
W3=(SC)
W4=(SS)

X(W1)=2
X(W2)=1
X(W3)=1
X(W4)=0

Graficamente se observa
R
W1=(CC)
W2 =(CS)
W3=(SC)
W4=(SS)

2
1
1
0

Funcin de Probabilidad:
Es un cuadro estadstico que muestra los valores de la variable y sus
respectiva probabilidad de ocurrencia o es una funcin matemtica
Xi
X1 P(
X1)
X2 P(
X2)
X3 P(
X3)
X4 P(
X4)

P(Xi)

.. ..

P(Xi) =e- x
X!
1
e-1/2(X-U/)2

f(x) =
2

Este cuadro o estas funciones matemtica, para que sean funciones de


probabilidad deben cumplir 2 axiomas:
para el caso de variables aleatorias discreta
P(xi)0 para todo valor perteneciente al rango de X
j)
ii) P(Xi )=1
para el caso de variables aleatorias contnua
i) f(xi)0 para todo valor perteneciente al rango de X
ii) f(Xi )=1
La funcin de probabilidad para una v.a. discreta se le llama funcin de
cuanta. Del ejemplo anterior tenemos
Xi P(
Xi)
X1 P(
= 0 X1)
=
1/4
X2 P(
=1 X2)
=
2/4
X3 P(
= 2 X3)
=
1/4
1

Todas las probabilidades son mayores que 0 cumple el primer axioma y la


suma de todas las probabilidades es igual a 1, por lo tanto este cuadro es
una funcin de cuanta dado de que la variable es una v.a discreta.

Ejemplo sea f una funcin con regla de correspondencia :


X , 0 X 1/2
f(x)

1 , 1/2 X 11/8
0 ,

en otro lugar

varificar que f(x) es una funcin de densidad y graficarla


i) f(x)0
X Rx
f(Xi )=1= -0odx + 01/2 xdx+ 1/211/8 1dx+ 11/80dx
k)
=

X2
2

1/2

+X

11/8
1/2

=1/8+11/8-1/2= 1

Por lo tanto f(x) es una funcin de densidad


Distribuciones o Funcin de probabilidad Acumulativa
Definicin sea x una v.a discreta o continua. Una funcin real valorada F
definida por
F(t) =P(xt) , para todo t perteneciente a R
Del ejemplo anterior
Xi P( F(
Xi) Xi)
=P
(X
X
i)
X1 P( P(
= 0 X1) X
= X1)
1/4 =
1/4

X2 P( P(
=1 X2) X
= X2)
2/4 =3/
4
X3 P( P(
= 2 X3) X
= X3)
1/4 =1
1

X ; 0 X 1/2
f(x)

1 ; 1/2 X <11/8
0 ;

en otro lugar

Determinar F(X)

Solucin:
i) P(X0) = -0f(x)dx = -00dx =0
P(Xt) = -tf(x)dx == -00dx =0 + 0t xdx=X2
2

t
=t2/2
0

0 t 1/2
1/2
t
t
0
1/2
t
t
2
P(Xt) = - f(x)dx == - 0dx 0 + 0 xdx+ 1/2 1dx=0 + 0 xdx=X /2
+ X =t- 3/8
0
1/2
1/2 t 11/8
1/2
P(Xt) = -tf(x)dx == -00dx 0 + 01/2 xdx+ 1/211/8 1dx=0 + 0t xdx=X2 /2 + X

11/8
=1

1/2

t 11/8

F(x)

0 ;x<0
X2 ; 0 X 1/2
2
X-3/8 ; 1/2 X <11/8
1

; X 11/8

ejemplo: P(X<1.2) =F(1.2)=1.2-3/8=0.825


P( X2) =1- P(X<2)= 1-F(2)=1 - 1 =0
P( 1/4< X<1 ) =F(1)-F(1/4)=(1-3/8)-(0.25)2/2=19/32
Valor esperado o esperanza matemtica E(X):
Es el valor que se espera obtener o valor promedio que se espera alcanzar en un
experimento aleatorio. Se simboliza por E(X):
E(X)= XiP(Xi)
Varianza y desviacin estndar
Es la desviacin promedio al cuadrado de los valores de la v.a respecto a su
valor esperado.
V(X)= E(X2)- [E(X)]2
E(X2)= Xi 2 P(Xi)

DISTRIBUCIN BINOMIAL
Es un experimento aleatorio que se caracteriza:
a) En efectuar n pruebas independientes y repetitivas de Bernoull.
b) La probabilidad de xito p se mantiene constante a travs de las n
pruebas .
c) Por ser un experimento aleatorio que consiste en seleccionar una
muestra aleatoria de tamao n una a una con reposicin , de una
poblacin finita o infinita particionada en dos clases arbitrariamente
llamadas las clases de los xitos y la clase de los fracasos .
d) La probabilidad de xito p presenta la probabilidad de seleccionar un
elemento de la clase de los xitos.
E
F
N

Con reposicin

x:valor de la v.a x
E : clase de los xitos
F : clase de los fracasos
N: tamao de la muestra

Ejemplo: lanzar 10 veces una moneda, para observar el nmero de cara que aparecen.
calcular la probabilidad: a) que aparezcan exactamente 2 caras b Por lo menos que
aparezca una cara.
Solucin:
1. Son pruebas simples, donde cada moneda es una prueba que tienen dos posibles
resultados de acuerdo a la variable aleatoria X: el nmero de caras que aparecen:
Ser xito: si al lanzar la moneda y aparece cara
Ser fracaso: si al lanzar la moneda y aparece sello
2. La probabilidad de xito es contante en cada prueba 1/2=0.5 =p.
3 Las n=10 pruebas son independiente es decir el lanzamiento de la moneda es
independiente, porque su estado de naturaleza es la misma tiene cara y sello.
Por lo tanto X la v.a. se distribuye Binomialmente y tiene como funcin de probabilidad o
de cuanta:
Donde Rx={0,1,2,3..........}

P(x) = Cnx px qn-x es la fucnin de probabilidad o de cuanta


Q=1-p= probabilidad de fracaso=0.5
La esperanza o valor esperado y La varianza de una v.a X que se distribuye
Binomialmente.
E(x)= np
V(X)= npq

Resolviendo el problema tenemos que :


a) p(x=2) = C102 (0.5 )2 (0.5)10-2 = 0.0439
Utilizando Excel : ingresar al cono de funcin fx, a la categora funcin, al nombre
de la funcin Distribucin Binomial

Luego presionar el botn aceptar y dar el resultado de p(x=2), se puede observar que el espacio
para acumulado est con falso y ser verdadero cuando se piden p(xxi), puesto que las
probabilidades que da esta distribucin son probabilidades acumulada de x hasta un cierto valor Xi

Para la pregunta b) b Por lo menos que aparezca una cara.


P(x 1) = 1 - P(x<1)
= 1 - C100 (0.5 )0 (0.5)10-0 = 0.999023440.

DISTRIBUCIN POISSON
Es un experimento aleatorio que se caracteriza:
a) Por ser un fenmeno que se presenta aleatoriamente o independientemente en el
tiempo o espacio en el que slo interesa la ocurrencia del fenmeno un nmero
contable de veces y no interesa la ocurrencia del fenmeno.
b) Por ser un tipo de un experimento binmico en el que la probabilidad de xito es
bastante pequea (p
0), en tanto que el tamao de la muestra es grande
(n
), tal que =np >0
Ejemplos:
1) La cantidad de llamadas telefnicas en un periodo de una hora en cierta oficina
2) El nmero de accidentes de aviacin u otras calamidades que aparecen aleatoriamente
independientemente en un tiempo continuo
c) La variable aleatoria X toma valores como X=0, 1, 2, 3..... donde x es la frecuencia
que se presenta el fenmeno en un intervalo de tiempo.
d) La probabilidad de conseguir exactamente X xitos , cuando el fenmeno aleatorio es
de Poisson , est dada por :

e- x
p(x) =

x=0,1,2.........

X!
p(x) : Es la funcin de probabilidad o de cuanta

E(X)=

V(X)=

Ejemplo : una compaa contra accidentes de trnsito sabe que el 0.005% de la poblacin
fallece cada ao por accidente de trnsito. Cul es la probabilidad que la compaa
tenga que pagar a ms de 3 de los 10,000 asegurados que tiene en este ao?
X se distribuye binomialmente (X; 10,000 , 0.00005)
=np =10,000*0.00005=0.5
3
p(x>3) = 1 - p(x3)= 1 - e- x/x! =1- [e-0.5 (0.5)0/0! + e-0.5 (0.5)1/1!+ e-0.5 (0.5)2/2!+ e-0.5
(0.5)3/3!)=1-0.998=0.002

Distribucin Normal:
Se dice que una variable aleatoria X se distribuye normalmente con
parmetros y 2 si tiene como funcin de densidad o de probabilidad:
1
f(x)=
e-(x-/ )2
2
- X

Propiedades :
1. El grfico de f(x) tienen la forma de una campana llamada campana de Gauss

f(x)

2. Es simtrica respecto a es decir que divide al rea bajo la curva en dos


partes iguales 50 % de valores menores que 50 % de valores mayores que .
Adems la mediana, la moda y la media aritmtica son iguales coinciden.

Importancia :
Es la distribucin de variable aleatoria continua ms importante :
a) Muchas de las tcnicas utilizadas en la estadstica aplicada se basan
distribucin normal.
b) Las variables aleatorias que se definen a partir de las observaciones
prcticas , trabajo de investigacin o experimentos se distribuyen
normalmente
c) Otras variables se distribuyen o aproximan normalmente.
d) An en el caso algunas variables aleatorias que no estn distribuidas
normalmente no aproximadamente normal se pueden convertir en
distribucin normal mediante transformacin matemticas.
e) Tienden a la normal la distribucin Binomial, Poisson, T-Student etc.
Varianza de X V(X)= 2

E(X) =
1
f(x)=
2

e-(x-/ )2
- X

DISTRIBUCIN NORMAL ESTNDAR :


O estandarizacin de una v.a X. que se distribuye normalmente con
parmetros y esta estandarizacin consiste en Transformar la v.a X
En otra variable Z que se distribuye normalmente con parmetros =0 y =1
Mediante la siguiente relacin

Z 0.0 0.0 0.0 0.0 ..... .... ..... ..... ..... 0.0
0 1 2 3 ....
.. .. .. 9

x-
Z=

Cuya funcin de densidad es :

1
e-z2/2

f(Z)=
2

- Z

Las caractersticas de f(z) son las mismas de f(x)


La distribucin norma Estndar
t
t
1
F(Z) = f(z)dz = =
e-t2/2
-
- 2
Esta integral no se puede calcular por mtodos elementales , pero por mtodos numricos
se han construidos tablas -.
Z
Zi

0.0 0.5 0.5 0.5 0.5


00 04 08 12
0 0 0 0

0.5
35
9

0.1 0.5 0.5 0.5 0.5


39 83 47 51
8 2 8 7

0.5
75
3

0.2 0.5 0.6 0.6 0.5


79 21 25 81
3 7 5 0

0.6
14
1

.
.
1.0
1.1

.
3.4 0.9 0.9 0.9 0.9
99 99 99 99
7 7 7 7

0.9
99
8

Propiedades
P(z>a)= 1 - P(za) complemento
P(a Z b )= P(zb) - P(za)= F(b)-F(a)
P(z-a )= 1 - P(za)
Ejemplo : El precio de la PC Pentiun en el distrito de Miraflores son
normales , con un promedio de $2000 y una desviacin tpica de 200$ .
Encontrar la probabilidad de que al preguntar por una PC -Pentiun al azar en
esta ciudad su precio sea: a) mayor o igual que $2550 b) entre $1900 y $
2100 c) menos de 1850$
Solucin;
Sea la variable aleatoria continua X =precio de la PC Pentiun
Se sabe que los precios se distribuyen normalmente con parmetros
=$2000 y =200$ , por lo tanto X tiene una distribucin de densidad:
1
f(x)=

e-(x-/ )2

- X

Nos piden calcular :


a) Probabilidad que al preguntar por una PC -Pentiun al azar en esta ciudad su
precio sea mayor o igual que 2550$= P(X2550)=1 - P(X<2550)
Estandarizando la variable X tenemos:
=1 - P(X - < 2550- 2000)= 1-P(z<2.75) = 1- 0.9970= 0.003

200
b) P( $1900 X $ 2100 )entonces estandarizando X tenemos estandarizando
P( $1900- X $ 2100- ) =P( $1900-2000 X - $ 2100- 2000) =

200

200

P(-0.5 z 0.5) =F(0.5)- F(-0.5)= F(0.5)- [1-F(0.5)]=2P(z 0.5)- 1=2*0.6915-1=0.383

c) P(X<1850$) entonces estandarizando P(X- <1850$- )= P(Z<1850$-2000)=

200
P(Z<-0.75)=1- P(Z 0.75)= 1- 0.7734=0.2266
Utilizando el Excel para solucin de este problema
a) Probabilidad que al preguntar por una PC -Pentiun al azar en esta ciudad su
precio sea mayor o igual que 2550$= P(X2550)=1 - P(X<2550) = 1- DIS
TR.NORM(2550,2000, 200, verdadero).
En el caso c como la variable est estandarizada tenemos :
c) (Z<-0.75)=1- P(Z0.75)= 1-Distr.norm.estand(0.75)= 0.2266

Aproximacin de la Binomial a la Normal


Si X se distribuye binomialmente con parmetros n, p y q , cuando n aumenta sin
restriccin y p es moderado (n>30 y 01<p<0.9) tal que np sea constante ,
entonces la Binomial se aproximaa una distribucin normal con media = np y
varianza 2=np(1-p)
P(X1<X>X2)
(X1-1/2)-np
Z1=
np(1-p)
(X2-1/2)-np
Z2=
np(1-p)
Ejemplo:
Cul es la probabilidad de conseguir de 210 a 220 caras en 400 lanzamientos de
una moneda no sesgada?
= np =400*1/2=200
2=np(1-p)
=200*1/2*1/2 =100
210-1/2
P(210<=X<=220)= P

-200

220-1/2
<=X-<=

- 200

10

10

P(0.95<=Z<=2.05)= F(2.05)-F(0.95)= 0.9798-0.8289=0.1509

DISTRIBUCIONES MUESTRALES Y ESTIMACIONES


Estadstica Inferencial
Relacionada con el proceso de utilizar datos para tomar decisiones en el caso ms general del que
forma parte estos datos. El proceso de tomar decisiones en situaciones generales, sobre la base de
una informacin incompleta contenida en datos muestrales , es ariesgado y no puede realizarse con
certeza; la probabilidad es una medida de esta incertidumbre . Hay dos tipos de incertidumbre con
los que tenemos que enfrentarnos ; 1) la incertidumbre debida a la aleatoriedad y 2) la
incertidumbre debida a nuestra ignorancia del verdadero estado del sistema.
Generalmente no se conoce la las funciones de probabilidad o de densidad p(x) o f(x), ni los
parmetros, entonces se toman muestras aleatorias de la poblacin; a partir de stas se estiman los
parmetros poblacionales, y se formulan hiptesis acerca de P(x) o f(x) o de sus parmetros que
constituyen las dos ramas de la Estadstica Inferencial: Estimacin y Prueba de Hiptesis.
Muestra: Como regla general, los estudios de investigacin utilizan una pequea parte de
la poblacin estudiada, a la que denomina muestra, cuya ventaja principal radica en que
resulta ms prctico y menos costoso, que obtener datos de toda la poblacin(Censo)
Pero esta muestra debe ser representativa de la poblacin, para tal efecto el investigador
dispone de diversos mtodos estadsticos para obtener una muestra, donde interviene,
costo, esfuerzo y nivel de capacitacin. Y se utilizan frmulas adecuadas
2.Determinacin del Tamao de la Muestra(n)
A)En el Muestreo Aleatorio simple, cuando la variable es continua, y el tamao de la
poblacin (N) es grande, la frmula es la siguientes:
Z22
n =
E2
Donde :Z es el valor de la abcisa, a un nivel de confianza deseado por el investigador por
ejemplo: para un nivel de confianza asumido de 99 % Z en la tabla de probabilidades
normales estandarizadas Z=2.58
95 % Z en la tabla de probabilidades normales Z=1.96
2 varianza de la poblacin, esta no se obtiene directamente, en la prctica se le estima
tomando la varianza de una investigacin semejante, ya efectuada. Si no hay este
antecedente, se toma de la poblacin una muestra piloto, de tamao arbitrario de 80 o de
100 elementos.Con estos datos de la pre-nuestra, se calcula
el promedio x y su varianza S2 y hacemos:

2 = S2
= S desviacin estndar
Es decir que la desviacin estndar poblacional es igual a la desviacin estndar de la pre
muestra.
E: lo fija el especialista, puesto que l es la persona ms indicada para estimar el mximo
error que se puede admitir al calcular el valor medio poblacional de la variable en estudio,
en la prctica lo ms aconsejable es 3 % de x o 5 % de x
B) Cuando el tamao de la poblacin(N) no es muy grande
1. Se calcula el tamao de la muestra no como si la poblacin fuese grande, por medio de
la frmula :
Z22
no =
E2
2. El valor de no se corrige por la frmula siguiente:
no
n =
1 + no/N
C) Tamao de muestra en el muestreo aleatorio simple, cuando la variable es cualitativa
(proporciones) en escala nominal u ordinal.
Por ejemplo , con la variable sexo se tiene dos categoras: hombre y mujer, supongamos
que hay 20 personas de la s cuales 8 son hombres y 12 son mujeres, las frecuencias en
las categoras son:
Cat fi hi Po
eg Ab rel rce
or sol ati ntu
a uta va al
o
proporcin
Ho 8 P=8 40
mb/20=0.4 %
res

Muq=12/20
12
60
jer
%

Tot 20 p+ 10
al
q= 0%
1

En donde:
n de hombres en el grupo
p= proporcin de hombres =
n total de personas

En donde:
q= proporcin de mujeres =

n de mujeres en el grupo

n total de personas
Entonces:
c1) Cuando la poblacin es grande :

Para muestreo de proporciones se utiliza las frmula siguientes:


Z2 p*q
n0 =
utilizando la propiedad 2=p*q
E2
c2) Cuando la poblacin es pequea
n0
n=
1 + n0/N

Elaboracin del Marco muestral: Para seleccionar los elementos constitutivos de una
muestra debemos contar con un marco muestral bien elaborado, este marco es una
relacin detallada de nuestra poblacin en estudio , en la cual asociamos a cada elemento
de la poblacin, un nmero natural.
Muestreo : Son las tcnicas que se utilizan para seleccionar los elementos constitutivos
de la muestra Los muestreos probabilsticos, en los cuales se utilizan procedimientos
aleatorios para la seleccin de los elementos constitutivos de una muestra, en cuyo caso
todos los elementos de la poblacin tienen la misma probabilidad de ser incluido en la
muestra.
Mtodo de muestreo, estos pueden ser:
1.1 Muestreo Aleatorio Simple(MAS)
Es el tipo de muestreo ms conocido tiene las siguientes caractersticas:
a)Todos los elementos tienen igual probabilidad de ser elegido para formar parte
de la muestra. Puede ser con reposicin o sin reposicin. Utiliza la tabla de
nmeros aleatorios para elegir los elementos.
b)Todas las muestras posibles tienen la misma probabilidad de ser recolectada
1.2 Muestreo Sistemtico: es mejor que el MAS recorre la poblacin en toda su
extensin mediante un intervalo o periodo de seleccin evitando que la muestra
pueda quedar concentrada en cierta zona que si puede ocurrir en el MAS.
1.3 Muestreo Estratificado: a la poblacin se le divide en estrato, o clase o categoras,
bajo criterios bien establecidos. El objetivo de esta divisin es minimizar la
varianza. El tamao de la muestra determinada n debe ser asignada o afijada
proporcionalmente al tamao de cada estrato.Y la eleccin de los elementos
constitutivo utilizar la tcnica de MAS o MSITEMATICO.
1.4 Muestreo por Conglomerados: la unidades de anlisis pueden ser municipios,
ciudades manzanas, paquetes etc.), contienen nmero diferentes de elementos o
sub unidades.
1.5 Entre otros.

Distribucin de Muestreo

Supongamos que se extraen K muestras aleatorias de tamao n de la misma poblacin


con parmetro entonces:
n1 =X1,
n2 =X1,
n3 =X1,
.
.
.
.
nk =X1,

X2 , X3 ................ Xn
X2 , X3 ................ Xn
X2 , X3 ................ Xn

donde: X1, X2 , X3 ................ Xn son valores


de una variable aleatoria Xi

X2 , X3 ................ Xn

Estadgrafo: cualquier nmero i obtenido a partir de los datos muestrales con el


propsito de estimar los parmetros poblacionales

1 =f(X1, X2 , X3, ................ ,Xn ) = Xi = X


n

media muestral o promedio

2 =f(X1, X2 , X3, ................ ,Xn ) = Xi 2


n

( X )2 = S2 varianza muestral

ESTADSTICA: Si extraemos K muestras aleatorias de tamao n de la misma

poblacin obtendremos K valores para i tambin aleatorias; as i es a su vez una


variable aleatoria llamada Estadstico o Estadstica

La Estadstica i como todas las variables aleatorias, tiene su correspondiente


distribucin Esta distribucin se llama Distribucin de muestreo de la Estadstica

=X la distribucin de muestreo del estadstico X se llama distribucin de muestreo


de la media o distribucin de la media muestral.

=S2 la distribucin de muestreo del estadstico S2 se llama distribucin de muestreo


de la varianza o distribucin de la varianza muestral.

Distribucin de la media muestral


Supongamos que una m.a. de tamao n se extrae de una poblacin y se determina su
media , llamamos X1 ,si tomamos una segunda m.a. de tamao n de la misma poblacin y
determinamos nuevamente la media no esperamos obtener el mismo nmero para media ,
designamos este nmero por X2 , si seguimos tomando varias m.a. del mismo tamao y de
la misma poblacin los valores de la media no siempre sern iguales o tal vez todos resulten
diferentes ; esto dignifica que estos nmeros (estadgrafos)son valores de una variable
aleatoria X; esto es la media aleatoria X es una estadstica y como tal tiene su
correspondiente distribucin y se denomina distribucin de muestreo de la media o
distribucin e la media muestral
Teorema: Si K muestras aleatorias de tamao n se extraen de una poblacin finita o infinita
con media y varianza 2 entonces Xi son los valores de una variable aleatoria X cuya
distribucin tiene una media igual a la media poblacional y su varinaza es igual a 2/n si la
poblacin es infinita, e igual a 2/n(N-n)/(N-1) si la poblacin es finita.
Teorema del Lmite Central
Sea X1, X2 , X3....... una sucesin de v.a independientes , distribuidas identicamente, cada
una con media y varianza 2. Definamos la sucesin de v.a Z1, Z2 , Z3.... mediante
X -
Zn =
si la poblacin es finita
/n
X -
Zn =

si la poblacin es finita
( /n)(N-n)/(N-1)

Zn es el valor de una v.a Z cuya distribucin se aproxima a la normal estndar , cuan do n


es grande tiende al infinito.
Si la polacin es Normal , la muestra es pequea y varianza poblacional desconocida.
Si X es la media de una m.a de tamao n, con n pequea(n 30), exctrida de una
poblacin normal con media y varianza poblacional desconocida entonces :
X -

t n-1=gl =

S /n
Es el valor de una v.a. que tiene una distribucin t- student con gl=n-1 grados de libertad
donde :

(Xi-X)2

S =

n-1

es la varianza insesgada de Cochran.


Las caractersticas de la distribucin t- student
La grfica de la distribucin de probabilidad de t -stundent tiene la forma acampanada, y
simtrica similar a la distribucin normal.Y se utiliza la siguiente tabla:
P(t ti)
gl t1-
t0.99 t0.99 ......T0.5
......5
5
....

63.66 31.82

0.158

9.92

6.96

0.142

15

2.95

2.60

......... 0.128
...

..

.............

.......
......

-t0

t0

Nota: Si la muestra es grande (n >30 ) y la varianza poblacional desconocida entonces la


varianza 2 se estima a partir de la varianza muestral S2(2=S2) y en vez de t se utiliza Z ;
esto es vlido an cuando la poblacin no es normal.
Ejemplos:
1) Los costos de fabricacin de un producto estn normalmente distribuidos con un
promedio de 175$ y una varianza de 36 $. Encontrar la probabilidad de que al
seleccionar 25 productos cuesten : a) Entre 168 y 180$ ambos inclusive b) Cueste ms
de 185$.
Solucin: La variable aleatoria X = los costos de fabricacin se distribuyen normalmente
Con =175$ y 2=36, n=25 productos
a)
5.83)

P( 168< X<180)= P( 168-< X-<180-) = P( 168-175< Zn<180-175) = P( -8.4< Zn<6)


/n /n /n
6/25
6/25
= P( -5.83< Zn<4.17) = P( Zn4.17) - P( Zn -5.83)= P( Zn4.17) - [1-P( Zn
=P( Zn4.17) - 1 +P( Zn 5.83)=0.9998-1+ 0.9998=0.9996

c) P(X>185) =1-P(X185)= 1- P(Zn185-175) = 1- P(Zn8.3)= 1-0.9998=0.0002


6/5
2)Al someter a prueba 5 pilas de calculadora se obtienen las siguientes duraciones en horas : 28
15, 19, 30, 23 . Se sabe que los tiempos de duracin de las pilas se distribuyen normalmente.
Cul es la probabilidad que nuestra estimacin de la media poblacional a partir de la media
muestral se desve en ms de 3 puntos?
Solucin:
Como no se conoce la varianza poblacional y la muestra es pequea (n=5) usaremos la t -Student
con gl=n-1=4

X (Xi
X)2

15 64

19 16

23 0

28 25

30 49
115
pro 23
me
dio
varianza
Desviacin Estndar
|X-|
3
3
No piden calcular
P( |X - |>3 )=P(

>
) =P(| t
|>
)= P(| t |
>1.08)
S/n
6.2/5

S/n

=1 - P(| t | 1.08)= 10.9000=0.1


( utilizando la tabla
con 4 grados de
Libertad un t
aproximado a 1.08 es
0.941 le corresponde
una probabilidad de
0.9000)
3). El promedio de los
alquileres de ciertas
tiendas comerciales
en el distrito de Surco
es $900 con una
desviacin tpica de
300 $. Si los montos
de alquileres en ese
lugar estn
normalmente
distribuidos, encontrar
la probabilidad de que
al seleccionar 10
tiendas al azar de esa
ciudad , su alquiler
sea: a) mayor o igual
a 900$ b) entre $840
y $950.

Solucin:
Sea X la v.a Monto de alquiler, se dice que esta v.a. se distribuye normalmente con parmetros
=900$ y =300$
El experimento estadstico consiste en seleccionar 10 tiendas al azar de este distrito , encontrar la
probabilidad que el alquiler sea mayor o igual de 950$ .
Simbolicamente esto es P(X 950$)= P(X -

/ n

950$ - )= P(Zn 0.53)=1- P(Zn 0.53)


// n

=1- P(Zn 0.53)= 1-0.7019=0.2981

Distribucin muestral de Proporciones

Si p es la proporcin de xitos en una m.a. de tamao n tomada de una poblacin binomial con
una proporcin de xitos entonces

p-p
P se distribuye como Z =
es el valor de una v.a. cuya distribucin se
p (1- p)

aproxima a la Normal Estndar, cuando n es grande o tiende a infinito

La forma estandarizada de la v.a p es :

p-p
Z=
p (1- p)

n
X

X el valor de la v.a. X representa el nmero de elementos perteneciente a la clase de loxitos y X


se distribuye binomial (x, n,p) entonces :

X
p =
= es la proporcin de xitos en la muestra.
n

p ) = 1/n*np =p

V( p ) = 1/n*np(1-p) = p(1-p)
E(

Si la poblacin binomial es finita de tamao N se tiene:

p-p

Z=
p (1- p)(N-n)

(N-1)

Adems como se pasa de una v.a. discreta (binomial) a una v.a. continua (normal) se debe
introducir el factor de correccin de continuidad + - 1/2(1/n), sumando este factor al lmite superior
o restndolo al inferior. Si n es suficientemente grande se puede omitir el factor de correccin de
continuidad.

ESTIMACIN:
Se ocupa del estudio de la estimacin de parmetros y consiste en encontrar o determinar

una estadstica (llamado estimador) que estime el verdadero valor del parmetro .

PARMETROS O VALORES VERDADEROS

N
= Media Poblacional
2 = Varianza Poblacional
P = Porporcin Poblacional
X = Total Poblacional

Los parmetros como medida de resumen de la poblacin, casi nunca se


conocen, puesto que tiene que enumerarse toda la poblacin, por lo que muchas
veces se deben estimar(aproximar) estos valores verdaderos. La estimacin consiste en
tomar una muestra de "n" observaciones de una

variable y calcular el estadgrafo adecuado para la estimacin del parmetro.


Existen 2 tipos de estimacin: Estimacin Puntual y Estimacin intervlica

Estimacin Puntual:
Consiste en estimar un parmetro a partir de un valor de la muestra. Este valor es
considerado como el estimador del parmetro desconocido.
Por ejemplo: Se dice que la media aritmtica
estima a la media poblacional .
Estimacin intervlica:

X de una muestra de tamao n

Consiste en construir un intervalo [L1 L2] llamado intervalo de confianza que debe
contener el parmetro con una probabilidad dada: 1- llamada nivel de

confianza, en base a una muestra aleatoria y la correspondiente estadstica .


P(L1 L2)= 1-
/2
/2
1-

El intervalo [L1 L2] es un intervalo aleatorio ya que sus extremos L 1 , L2 llamados lmites
de confianza son variables aleatorias , que varan de una a otra muestra . As, su
interpretacin se tiene confianza del 100(1-) % de que el intervalo contiene el valor
desconocido de ; o de que 100 intervalos aleatorios que se toman 95 de las veces
contendr el parmetro y slo 5 veces no lo contendr, si 1- = 95 %

ESTIMACIN INTERVLICA DE LA MEDIA POBLACIONAL


1. Caso 1: muestra grande , varianza conocida y poblacin normal o no:
P(X Zo* X Zo*)= 1-
n
n
f(z)
/2
1-

/2

-Zo
Zo
2. Caso 2: muestra grande , varianza desconocida y poblacin normal o no con 2( la
varianza poblacional se considera aproximadamente igual a la varianza
muestral) :
P(X Zo* X Zo*)= 1-
n
n
3. Caso 3: muestra pequea, varianza conocida y poblacin normal
P(X Zo* X Zo*)= 1-
n
n
4. Caso 4: muestra pequea, varianza desconocida y poblacin normal

P(X to*S X to*S)= 1-


n
n
f(t)
/2
/2

1-
-to

to

Error de estimacin :
Zo*
E =
n
Tamao de la muestra
Zo2*2
N=
E2
NI
VE
L
DE
CO
NF
IA
NZ
A
1- 99. 99 98 96 95. 95 90 80 68.
73 % % % 45 % % % 27
%
%
%

zO 3.0 2.5 2.3 2.5 2 1.9 1.6 1.2 1


75 27 4
6 45 8

Ejemplo:
Las alturas de 3000 estudiantes de Administracin se distribuye normalmente, si se ha
obtenido una muestra de100 estudiantes al azar con un promedio de 1.67mtsy una
desviacin tpica de 10 cm. Estime los lmites de confianza del 95% para la altura
promedio de los 3000 estudiantes de ingeniera?
Solucin:
X: alturas de los estudiantes, esta variable se distribuye normalmente
Se saca una muestra n= de 100 estudiantes, con X =1.67mts y una S=10cm=0.10.
P(

X - ZoS/ n < < X+ ZoS/ n )=1-0.95=0.05

/2

/2
0.95
0.025

- Zo

0.025

Zo

Entonces para calcular el valor de Zo o valor crtico se efecta los siguiente:


P((Z Zo) =0.975 en la tabla es Zo = 1.96

P(

X - ZoS/ n < < X+ ZoS/ n )=

P( 1.67 -1.96*0.10/ 100 < <1.67 + 1.96*0.10/ 100 )=


Entonces el lmite de confianza del 95 % para la altura promedio de los 3000
estudiantes de Administracin es:
1.65 1.98
2. Los ingresos mensuales en miles de dlares de 9 empresas dedicadas al ensamblaje
de computadoras de una ciudad fueron: 16,18,11,17,13,10,15,16. Estime los lmites de
confianza de 98% para la media de los ingresos de todas la empresas dedicadas a
ensamblaje de computadoras.
Solucin:

X: los ingresos en miles de dlares.


la muestra n= es de 9 empresas sus ingresos:

ingresos

varianza

varianza

16 (1615.3333)2

0.44444

18 (18-15.3333)2

7.11111

11 (1115.3333)2

18.7778

17(17-15.3333)2

2.77778
13 (13-15.3333)2
10 (10-15.3333)2

5.44444
28.4444

22 (22-15.3333)2

44.4444

15 (1515.3333)2

0.11111

16(16-15.3333)2

0.44444

pro 15.333
me
3333
dio

108

vari
anz
a

P(

X - toS/ n < < X+ toS/ n )=0.98

/2

/2
0.98
0.01

0.01

- to

to

Entonces para calcular el valor de to o valor crtico se efecta los siguiente:


P((t to) =0.99 en la tabla es to = 2.90

P(

X - toS/ n < < X+ toS/ n )=

P( 15.33 -2.90*3.67/ 9 < <15.33 -2.90*3.67/ 9)=


Entonces el lmite de confianza del 98 % para la altura promedio de los 3000
estudiantes de Administracin es:
11.78 18.88

ESTIMACIN INTERVLICA DE LA VARIANZA POBLACIONAL 2


Caso 1: Poblacin Normal y muestra pequea . Se usa la Chi Cuadrada
P( L1 < 2 < L2 )=1-
F(2, V)
/2

/2

1-
2
2/2
(n-1) S2

DONDE: L1 =

21-/2(v=n-1)
(n-1) S2

L2 =
2/2 (v=n-1)

21-/2

Caso 1: Poblacin Normal y muestra grande Se usa la Z distribucin normal


estandarizada
P(

L1 < < L2 )=1-


F(2, V)

/2

/2

1-
2
L1=- Zo

L2= Zo

S
DONDE: L1 =
1+ Zo/n
S
DONDE: L2 =
1- Zo/n
Ejemplo1
Los Ingresos mensuales en miles de dlares , de 9 empresas dedicadas al
ensamblaje de computadoras de una ciudad fueron: 16,18,11,17,13,10,15,16. estime
los lmites de confianza del 98 % para la desviacin estndar de los ingresos de
todas las empresa dedicadas al ensamblaje de computadoras de esa ciudad.
Solucin :
Como la muestra es pequea , la varianza muestral se distribuye como Chi
cuadrada
P(

L1 < < L2 )=1-


F(2, V)

0.01=

/2

1- =0.98

2/2

21-/2

0.01
2

/2

P(2 2/2) =0.01 con n-1=8 grados de libertad entonces en tabla Chi cuadrado
obtenemos 2/2 =1.65
P(2 21-/2)= 0.99 con n-1=8 grados de libertad entonces en tabla Chi cuadrado
obtenemos entonces 21-/2= 13.4
(n-1) S2
DONDE: L1 =

1-/2(v=n-1)

8*13.5
=

8*13.5
=

2/2 (v=n-1)

la desviacin : 2.8

13.4

(n-1) S2
L2 =

=8.06

= 65.45 la desviacin : 8.09


1.65

X: los ingresos en miles de dlares.


la muestra n= es de 9 empresas sus ingresos:

ingr vari vari


eso anz anz
s a a

16(16- 0.4
15. 444
333 4
3)2

18(18- 7.1
15. 111
333 1
3)2

11 (11-15.3333)2

18.7778

17 (1715.333
3)2

2.77778

13 (13-15.3333)2

5.44

10 (10-15.3333)2

28.4444

22 (2215.3333)2

44.4444

15 (15-15.3333)2
16(16-15.3333)

0.44444

0.1

Promedio

15.3333333

108

Varianza

13.5

Des
viac
in

3.67423

P(

2. 8 < < 8.9 )=0.98

Pruebas de Hiptesis o Dcimas de hiptesis:


En la investigacin experimental se pretende a veces simplemente estimar un parmetro,
as por ejemplo supongamos que la vida media de las lmparas por medio de un proceso
conocido es de 1400h. Se desea docimar un nuevo procedimiento, para la fabricacin de
lmparas. En este caso, el modelo estadstico es el siguiente : se trata de dos poblaciones
de lmparas , la constituida por las fabricadas utilizando el proceso conocido y la
constituida por las correspondiente al proceso que se propone .
Se sabe que por investigaciones anteriores que la vida media de la primera poblacin es
de 1400 h. Se desea saber si la media de la segunda poblacin es superior o inferior a
1400 h. Tradicionalmente, para resolver este problema se establece la hiptesis de que
una media es mayor que la otra. Bassndose en una muestra de las poblaciones se
aceptar o se rechazar la hipesis.

Hiptesis estadstica:
Es un supuesto o alguna afirmacin de la poblacin (modelo matemtico) o de sus
parmetros. Del Ejemplo anterior
De investigaciones pasadas se sabe la Vida media de la primera poblacin es 1400h.
Prueba de Hiptesis o Dcimas:
Es la verificacin de una hiptesis estadstica y es un procedimiento para decidir si se
acepta o se rechaza una hiptesis estadstica.

Hiptesis Nula: Denotada por Ho, es la hiptesis que se desea verificar , es la primera
afirmacin y la que se va a someter a prueba

Hiptesis Alternante: denotada por Ha : es aquella que se acepta cuando la


hiptesis nula se rechaza . En el ejemplo anterior:

Ho: =1400
Ha: >1400

Ho: =1400
Ha: <1400

Ho: =1400
Ha: 1400

Errores: tipo I y Tipo II


Para rechazar o aceptar una afirmacin acerca de los parmetros debemos efectuar una
particin adecuada del dominio de la distribucin muestral en dos regiones . La regin
rechazo R y la regin de aceptacin A y el punto C llamado crtco.

El razonamiento indica que al tomar una decisin se puede cometer dos clases de
errores; puede rechazarse la hiptesis cuando es cierta o puede aceptarse cuando es
falsa.

Decisin
Ci Fal
ert sa
a
Ac De Err
ep cis or
tar intip
Ho es o I
co I
rre
cta

Ho

Rechazr Ho

Error tipo I

Decisin es correcta

El error tipo I: llamado tambin nivel de significancia, denotada por , es la probabilidad


que el punto muestral (estadstica) caiga en la regin de rechazo bajo Ho
El error tipo II:denotada por , es la probabilidad que el punto muestral (estadstica) caiga
en la regin de aceptacin bajo H1
Tipos de pruebas :
a) Prueba de cola izquierda si la regin de rechazo est a la izquierda punto crtico C.

B Prueba de cola Derecha: si la regin crtica est a la derecha de C

C) Prueba de dos colas si la regin de aceptacin es un intervalo abierto entre los puntos
crtico C1 y C2

/2
/2
R

C1

C2

PRUEBA DE HIPTESIS CONCERNIENTE A LA MEDIA POBLACIONAL


Re
gla

de
de
cis
in
pa
ra
do
ci
ma
r:
Ho
:
=
o

TI HI SE
PO P RE
DE TE CH
PR SI AZ
UE S A
BA AL HO
S TE si
NA
NT
E
Co Ha: Z < t <
la : Zc -t1( V)
iza <

qui o
er
t>
da
t1-(
V)

t<
-t1

Co Ha: Z <
la : Zc
de >
re o
ch
a
Do Ha: |Z|
s : <
col Zc
as o
Xo X o
Z=
/ t=
n

Zc
: S/
bu n
sc

( V)

ar v=
en nta 1
bla

En la comprobacin de pruebas de hiptesis se sigue la siguientes metodologa:


1. Determinacin de la Ho y Ha.
2. Determinacin del nivel de significancia (error tipo I ) con que se va ha
docimar, los mas recomendables son:0.10, 0.05, 0.01, 0.002, 0.005.
3. Determinar un tamao de muestra n y calcular los estadgrafos de acuerdo a
las hiptesis planteadas.
4. Determinar el estadstico de comprobacin : de acuerdo al tamao de muestra y
a los datos de la poblacin.
Xo X o
Z=
/ t=
n

Zc
: S/
bu n
sc
ar v=
en nta 1
bla

5.Determinar la distribucin del estadstico y establecer la regin de rechazo y de


aceptacin y establecer el tipo de prueba, de acuerdo con las hiptesis
planteadas principalmente la hiptesis alternante.

Z
R

6.Determinar la Decisin de rechazar o aceptar la hiptesis nula H o


Si Z >C entonces cae en la regin de rechazo , por lo tanto de rechaza H o
Al nivel de significancia utilizado
Ejemplos:
1. Un comprador de computadoras cree que los precios de las computadoras Pentiun esta
disminuyendo. De experiencias anteriores, el precio promedio es de 1500 dlares con una
desviacin estndar de 500 dlares. Una muestra de 20 computadoras da un promedio de
1200 dlares y una desviacin estndar de 100 dlares. Probar la hiptesis de que el
promedio no ha cambiado, contra la alternativa de que ha disminuido. Emplee un nivel de
confianza del 5%.
Solucin:
X: va. Precios de computadoras pentiun.
Se sabe que X se distribuye normalmente = 1500$ =500$
Una muestra de n=20 computadoras dio como precio promedio 1200 dlares y una
desviacin estndar de 100 $.
Siguiendo la metodologa de pruebas de hiptesis, tenemos
1. Ho: =1500 de que el precio promedio no ha cambiado
Ha: <1500 de que el precio promedio ha disminuido
2. Comprobar esta hiptesis con un nivel de significancia de =0.05.
3. Se ha tomado una muestra de n=20 computadoras y dio como precio promedio

1200 dlares y una desviacin estndar de 100 $.


4. Como la muestra es pequea pero la variable aleatoria precios se conocen sus
parmetros y se distribuye normalmente el estadstico a utilizar es:
X - o
Z

1200-1500
=

-30020
=

/n

100/20

=-13.41
100

5. Por la hiptesis alternante es una prueba de una sola cola y de cola izquierda

=0.05
0.95
Z
R

Donde c= Zc, como no se puede calcular probabilidades en el rea negativa , por simetra
tenemos:

=0.05
0.95
A

C=Zc=1.64

Clculo de C =Zc:
P(Z Zc) = 0.95 por lo tanto podemos observar en la tabla Zc=1.64.
=0.05

=0.05
0.95
Z
R

C =Zc=-1.64

6.Decisin se rechaza la hiptesis nula Ho


Si Z <Zc=-1.64, como en el paso 4) Z=-13.41entonces cae en la regin de
rechazo , por lo tanto de rechaza H o Al nivel de significancia 0.05 y se acepta Ha,
que los precios de las PC Pentiun estan bajando.
Ejemplo 2:
Una fbrica que produce pernos cuya longitud promedio es de 1 pulgada. despues de
efectuar algunas modificaciones en los dispositivos de las mquinas de dicha fbrica y
con respecto a la produccin de pernos durante los ltimos meses se ha recibido
continuos reclamos de los compradores quienes han manifestado que los pernos
presentan un incremento en ms de 0.2 pulgadas, en lo que perjudica a los usuarios. Para
verificar lo manifestado por los compradores, el fabricante toma una muestra aleatoria de
6 pernos cuyas longitudes resultaron:1.02, 1.11, 1.02 1.07, 1.09, 1.01. Usando un nivel de
significacin de 0.06, podr el fabricante aceptar lo manifestado por los compradores?
Solucin

El problema es una prueba de hiptesis


1.
Ho: =1pulgada de longitud promedio tienen los pernos asegura el fabricante
2.
Ha: > 1 los pernos presentan un incremento de 0.2 pulgadas en su longitud
3.
Comprobar esta hiptesis con un nivel de significancia de =0.06.
4
Se ha tomado una muestra de n=6 pernos cuyas longitudes omputadoras y

longitud
1.0(1. 0.0
202- 01
1.0 11
5)2
1.1(1. 0.0
111- 03
1.0 21
5)2
1.0(1. 0.0
202- 01
1.0 11
5)2
1.0(1. 0.0
707- 00
1.0 28
5)2
1.0(1. 0.0
909- 01
1.0 34
5)2
1.0(1. 0.0
101- 01
1.0 88
5)2
Pr 1.0
om 5
edi
o

0.0
08
93

Var
ian
za

0.0
02

De
svi
aci
n

0.0
42
26
89
8

varianza

varianza

5.Como la muestra es pequea y la variable no se sabe si es normal o no la


media muestra se distribuye como una t *studen:

X - o
=
s/n

1.05-1.00

0.056

=
0.042/6

=2.92
0.042

6. Por la hiptesis alternante es una prueba de una sola cola y de cola izquierda

=0.06
0.94
t
R

C=tc

Clculo de C =tc:
P(t tc) = 0.94 aproximadamente a 0.95 por lo tanto podemos observar en la tabla Con
n-1=5 grados de libertad tenemos que tc=2.02.
.

=0.05
0.95
Z
A

C =2.02 R

6.Decisin se rechaza la hiptesis nula Ho Si t >tc=2.02


Como en el paso 4) t=2.92 entonces cae en la regin de rechazo, por lo tanto se
rechaza Ho Al nivel de significancia 0.06 y se acepta Ha, que los pernos presentan
un incremento de 0.2 pulgadas..
Ejemplo 3:
Supongamos que en cierto proceso para producir alambres , la resistencia a la ruptura del
alambre es una variable aleatoria normal con un promedio de 98 Kg/cm2 . Para reducir los
costos de produccin, se prueba otro proceso , Una muestra de 9 valores obtenidos bajo

el nuevo proceso dio una media de 86 Kg/ cm2 y una desviacin tpica de 3 K Kg/ cm2 El
nuevo proceso tiene efecto negativo sobre el alambre en cuanto a su resistencia . Emplee
un nivel de significacia de 8%
El problema es una prueba de hiptesis
1.
Ho: =98 Kg/cm2 resistencia
promedio a la ruptura.
2.
Ha: 98 Kg/cm2 resistencia
promedio a la ruptura
3.
Comprobar esta hiptesis con un nivel de significancia de =0.08.
Se ha tomado una muestra de n=9 valores obtenidos bajo el nuevo proceso dio una media
de 86 Kg/ cm2 y una desviacin tpica de 3 K Kg/ cm2

5. Como la muestra es pequea y la variable se sabe que es normal la media


muestra se distribuye como una t *studen:

X - o
=
s/n

86- 98
=
3/9

-129
=
3

=|-12|

6. Por la hiptesis alternante es una prueba de dos colas

/2=0.08/2=0.04

0.92
R

C1=tc =-1.86

/2=0.08/2=0.04
t
A C2=tc=1.86

Clculo de C =tc:
P(t tc1) = 0.96 aproximadamente a 0.95 por lo tanto podemos observar en la tabla Con
n-1=8 grados de libertad tenemos que tc1=1.86

6.Decisin se rechaza la hiptesis nula Ho Si t >tc2=1.86 o Si t <tc1=-1.86


Como en el paso 4) t=|-12| entonces cae en la regin de rechazo, por lo tanto se
rechaza Ho Al nivel de significancia 0.08 y se acepta Ha, que el nuevo proceso
tiene un efecto sobre el alambre en cuanto a su resistencia

AB={2,4,6}
A

B
AB

A B

Complemento de un Evento A o AC es el evento que ocurre si A no ocurre del


ejemplo tenemos AC ={1,3,5}

S
Eventos mutuamente excluyentes
S

A B=

Otros Ejemplos
3 personas esperan en un paradero la llegada de un microbus. Se sabe que por
esa ruta circulan 3 Empresa diferentes de microbuses.a) defina el espacio
muestral del experimento. b) defina los elementos de los siguientes eventos: E1:
{los tres toman la misma empresa} E2:{los tres van en empresas diferentes. E3:
{ninguno toma la empresa 3}
Solucin :Sean: A, B, y C las tres personas. 1, 2, y 3 las tres empresas.
S:{A1B1C1, A1B1C2, A1B1C3, A1B2C1, A1B2C2, A1B2C3, A1B3C1, A1B3C2,
A1B3C3, A2B1C1, A2B1C2, A2B1C3, A2B2C1, A2B2C2, A2B2C3, A2B3C1,
A2B3C2, A2B3C3, A3B1C1, A3B1C2, A3B1C3, A3B2C1, A3B2C2, A3B2C3,
A3B3C1, A3B3C2, A3B3C3}
.

Вам также может понравиться