Академический Документы
Профессиональный Документы
Культура Документы
FACULTAD DE INGENIERA
SEPARATA
ESTADSTICA y PROBABILIDADES
ELABORADO POR EL PROFESOR:
PREFACIO
Introduccin
ORIGEN ETIMOLOGICO DE LA PALABRA ESTADISTICA
No est bien determinado existen distinta opiniones:
Otros sostienen que deriva del latn STATUS que significa situacin.
Algunos sostienen que procede del Alemn STAAT que significa estado, es
por el hecho que una de las funciones tradicionales del gobierno central y del
estado es llevar registros sobre la situacin de la poblacin, nacimientos,
defunciones, produccin, impuestos y otros hechos contables o de control.
Breve Resea Histrica
Las estadsticas son tan antiguas como la humanidad misma. El hombre
siempre se preocup en evaluar cuantitativamente los hechos y acontecimiento
de su realidad as fue:
*En Egipto , recopilaban regularmente datos de la administracin
estatal.
*Los Hebreos realizaron censos, Moiss levanto a instancia de Yav
*En China en el ao 2258 A.C. el emperador Yao dispuso un censo.
*En Roma en el tiempo de Octavio Augusto se realiz un censo.
Llevaban registros numricos para fines tributarios.
*En el ao 0, ao del nacimiento de Jesucristo, est relacionado con
un empadronamiento.
*Los Arabes realizaron un censo casi completo en el ao 727 en la
pennsula Ibrica.
*En la Edad Media ya se encuentran estadsticas sistematizadas. El
Clero se dedic a la recopilacin, ordenamiento y estudio de los
datos de tipo demogrfico.
*En Espaa siglo XV durante el gobierno de los reyes Catlicos, en el
siglo XVI reinado de Felipe II y siguientes se levantaron censos
relativamente completos resaltando el censo del Marqus de la
Ensenada en 1748.
DEFINICION DE ESTADISTICA
La Estadstica es la ciencia que tiene por objeto planificar, recolectar, procesar y
analizar un conjunto de datos con la finalidad de obtener conclusiones valederas
para realizar una buena toma de decisin frente a una incertidumbre.
*Alexander M. Mood y Franklin A. Graybill describen a la estadstica como la
tecnologa del Mtodo cientfico. La estadstica proporciona instrumentos para la
toma de decisiones cuando prevalecen condiciones de incertidumbre. Estos
instrumentos pueden ser de aplicacin y utilidad completamente general en
cualquier campo de la ciencia: Mdica, Biolgica, Ingeniera, Fsica, Social, etc.
Son aplicables no solo en el mundo cientfico, sino tambin en el de la empresa y
en el de los asuntos cotidianos. Por otra parte, ciertos instrumentos pueden estar
especialmente diseados para campos especiales de la INVESTIGACION.
La estadstica puede dividirse en dos amplias ramas:
1. Estadstica Descriptiva: que est relacionada con el resumen y la descripcin
de datos numricos. La estadstica descriptiva nos da normas, mtodos, reglas
para recolectar, procesar, analizar un conjunto de datos Estos mtodos pueden
ser: encuestas, elaborar tablas, grficos o pueden incluir anlisis mediante
clculos de valores resumidos porcentajes, promedios, mediana, moda, varianza
desviacin estndar etc.
Ejemplo: Puede describirse y darle significado al volumen mensual de ventas de
un producto, durante el ao pasado elaborando un grfico de barras o una grfica
lineal
MONTOS EN MILES DE DLARES DE LOS CRDITOS OTORGADOS POR LA
BANCA MLTIPLE A EMPRESAS Y PARTICULARES DURANTE LOS MESES
DE MARZO - AGOSTO DEL 2015
MES
CREDITOS
PORCENTAJE
MARZO
ABRIL
MAYO
JUNIO
JULIO
AGOSTO
TOTAL
22,860
25,057
28,377
34,774
35,730
37,602
184,400
12.4
13.6
15.4
18.9
19.4
20.4
100.0
40.000
30.000
20.000
10.000
0
22.860
25.057
28.377
34.774
MES
35.730
37.602
Poblacin de Trabajadores
Poblacin de Enchufes
n=
e2
:
llamada campana
de
Gauss).
Donde:
n = El tamao de la muestra que queremos calcular
N = Tamao de la poblacin (p.e. 136 millones de brasileos
entre 15 y 65 aos)
Z = Es la desviacin del valor medio que aceptamos para lograr
el nivel de confianza deseado. En funcin del nivel de confianza
que busquemos, usaremos un valor determinado que viene dado
por la forma que tiene la distribucin de Gauss. Los valores ms
frecuentes son:
Nivel de confianza 90% -> Z=1,645
Ejemplo: si la poblacin est compuesta por todo los 10,000 focos producidos por
una industria en un da determinado, una muestra se debe determinar por medio
de la frmulas estadsticas, tal como:
LO S D A TO S PU ED EN SER
DATO
C U A L IT A T IV O :
C u a n d o e l r e su lta d o
d e o b se r v a r la c a r a te r stic a
e s u n a tr ib u to . N o e s u n n m e r o .
C U A N T IT A T IV O
C u a n d o e l r e su lta d o d e
d e o b se r v a r la c a r a c te r stic a
e s u n v a lo r n u m r ic o
D IS C R E T O
C u a n d o e l v a lo r n u m r ic o r e su lta
d e la o p e r a c i n d e c o n ta r , e sta r e p r e s e n ta d o
p o r lo s n m e r o s n a r u r a le s e n te r o s
C O N T IN U O
C u a n d o e l v a lo r n u m r c io r e su lta
d e la o p e r a c i n d e m e d ir o c o m p a r a r c o n u n a
m e d id a o p a tr n . R e p r e sn e ta d o p o r lo s N o s. R e a le s
LASIFICACIN DE VARIABLE
1.Segn la naturaleza de la variable:
Variable cualitativa: cuando sta adopta un dato cualitativo. Por ejemplo: Estado
Civil del trabajador, Razn Social de la empresa. Tipo de Productos elaborados,
etc.
Variable cuantitativa: cuando sta adopta un dato cuantitativo. Por ejemplo:
Edad del trabajador, Nmero de productos vendidos semanalmente, capital social
de la empresa. etc.
*Variable discreta: cuando sta adopta un dato cuantitativo discreto. Por
ejemplo: Nmero de de enchufes vendidos, Clientes atendidos en un da
determinado, Nmero de Empleados de una Empresa. Nmero de vehculo
automotor de la empresa, Nmero de enchufes producidos.
En esta escala cada persona u objeto debe pertenecer a una y solamente una de
las categoras que tienen y el conjunto de estas categoras debe ser exhaustivo;
es decir, tiene que contener a todos los casos posibles.
Ejemplo: la variable carrera de la URP tiene las siguientes categoras
Arquitectura
Biologa
Medicina Humana
.
.
..
Ingeniera Mecatrnica
Por lo tanto la variable carrera ser una variable Nominal
Escala ordinal:
Se establece una gradacin u orden natural para las categoras, cada uno de los
datos puede localizarse dentro de alguna de las categoras disponibles
Ejemplo: orden de mritos de los estudiantes en un semestre
Primer puesto
Segundo Puesto
Tercer puesto
Escala de intervalo:
La unidad de medicin es arbitraria, el cero es convencional y pueden existir
cantidades negativas; la medicin de la temperatura y del coeficiente intelectual
son ejemplos de este tipo de escala.
Ejemplo: temperatura del laboratorio de cmputo.
Escala de razn:
Similar a la escala de intervalo, pero tiene un cero absoluto y por ello los mltiplos
de los valores de la escala sern significativos; el nivel de votos en una eleccin
sera un buen ejemplo de una escala de medicin de razn.
El Candidato A = no ha recibido ningn voto a favor
El Candidato B = 20%
El Candidato C= 10%
Parmetro: son medidas de reduccin provenientes de los datos de una
poblacin. Los principales parmetros son:
N
a)
(): Xi
i=1
N
N
b)
Varianza poblacional
(2): (Xi - )2
i=1
N
c)
Proporcin poblacional
(P): n(A)/N
N
d)
Total Poblacional
(X): Xi
i=1
(X): Xi
i=1
n
n
f)
Varianza Muestral
(S ): (Xi - X)2
2
i=1
g)
Proporcin Muestral
(p): n(A)/n
n
h)
(X): Xi
Total Muestral
i=1
LA INVESTIGACION ESTADISTICA
Qu es INVESTIGACION?
Es un proceso formal, sistemtico, racional e intencionado en el que se lleva a
cabo el mtodo cientfico de anlisis, como un procedimiento reflexivo, controlado
y crtico que permite descubrir nuevos hechos o datos, relacionados a leyes, en
cualquier campo del conocimiento, en un momento histrico (Ander Egg 1971).
Toda INVESTIGACION requiere de datos con el propsito de obtener algunas
medidas o indicadores que expresan la dimensin o niveles de las variables
estudiadas, por lo tanto la estadstica se convierte como ciencia auxiliar de la
INVESTIGACION, que por su naturaleza estructura mtodos, en este proceso, el
anlisis estadstico tambin cumple con los diversos pasos de toda
INVESTIGACION.
PLANEAMIENTO
RECOLECCION
Fijacin de la Poblacin
PROCESAMIENTO
ANLISIS
CONCLUSIONES
TOMA DE
DECISION
Departamento de Estadstica
ENCUESTA
DETERMINACIN DEL NMERO DE PRODUCTOS DEFECTUOSOS POR
LOTES.
1.RESPONSABLE
3.LOTE No
PRODUCTO
PERIODO DE ELABORACIN
DEFECTO
CAUSA
DIA
FIRMA DE L ENCUESTADOR
Fecha: .............................
Plan de tabulacin :
1. Nmero de productos defectuosos por tipo segn Periodo de elaboracin.
2. Nmero de productos defectuosos por Da segn Periodo de elaboracin.
3. Nmero de productos defectuosos por tipo segn responsable.
4. Nmero de productos defectuosos por tipo segn Mquina y Periodo de
elaboracin
VII Medidas de Resumen para el anlisis:
Nmero de productos defectuosos promedio por lote
Nmero de productos defectuosos promedio por periodo de elaboracin.
Nmero de productos defectuosos promedio elaborados por da
Total de productos defectuosos por semana, mes
Total de productos defectuosos por semana, segn responsable
Porcentaje de defectuosos y no defectuoso por lote, da , semana
Cronograma de actividades para la prueba piloto
Actividad
SETIEMBRE
Capacitacin para la
recoleccin
Prueba experimental
Recoleccin
Procesamiento
Resultados
Informe
OCTUBRE
NOVIEMBRE
DICEIMBRE
n=
30
1.0000
100.00%
hi=h1+h2++hm =1
.
Para facilitar la construccin de esta tabla utilizaremos Excel de la siguiente
manera
.:
1ro En la celda B1 escribimos Xi= que representa a la caracterstica o variable
tipo de producto; en la celda C1 escribimos Yi= que representa la caracterstica
nmero de productos defectuosos en cada lote de productos.
.
2do Luego desde la celda B2 hasta la celda B31 ingresamos los datos de la
muestra anterior, .de igual manera desde la celda C2 hasta la celda C31 los datos
correspondiente.
4to Seccionamos del men principal del Excel el comando insertar, seleccionamos
la opcin tabla dinmica y aparecer una venta y luego presionar el botn
aceptar
Para el caso de la variable Nmero de defectos (Yi) que es una variable discreta se
sigue el siguiente procedimiento
1.Determinar los distintos valores de la variable obteniendo el valor mximo y el
valor mnimo en el ejemplo tenemos que el Valor X mnimo=0 y el Valor Xmximo=5
entonces entre 0 y 5 existe 6 valores distintos incluyendo ellos, que adopta la
variable y
2 Luego se contabiliza cuantas veces se repiten c/u de estos distintos valores
y se construye la siguiente tabla:
TABLA N 1
NUMERO DE LOTES SEGN NMERO DE
PRODUCTOS DEFECTUOSOS
22/03/2016
Yi
0
1
2
3
4
5
contero
////
/////
///// /////
///// /
///
//
n=
fi
4
5
10
6
3
2
30
hi
0.1333
0.1667
0.3333
0.2000
0.1000
0.0667
1.0000
Fi
4
9
19
25
28
30
Hi
0.1333
0.3000
0.6333
0.8333
0.9333
1.0000
Fi*
30
26
21
11
5
2
Hi*
1.0000
0.8667
0.7000
0.3667
0.1667
0.0667
Cont ar
X
Total
de
0
1
2
3
4
5
6
7
general
Total
2
2
4
5
3
7
3
4
30
h1 + h2 + h3.+ hm
m
= hi = 1
i=1
I2
I3
I4
Xmax
longitud
amplitud( C )
Extremo inferior
Extremo Superior
I2 :intervalo No. 2
Xi
82
58
95
60
92
62
62
64
85
68
92
70
82
74
95
75
70
76
85
76
84
80
95
82
91
82
82
82
94
84
76
85
88
85
91
85
87
87
80
88
68
88
58
91
76
91
85
92
110
92
60
94
75
95
88
95
64
95
74
110
n=
. =CONTAR(C91:C120) 30
Xmin
=MIN(C91:C120)
58
Xmax
=MAX(C91:C120)
110
R=
52
m=
=1+3.322*LOG(n) 5.9070
6 redondeado a entero
C=
R/m
8.67
9 redondeado al nmero de decimales
que tienen los datos originales
D=m*C-R
6*9-52=54-52=
2
Como D>0
entonces D=2 se reparte equitativamente entre el Xmin y
Xmx de la siguiente manera D/2=2/2=1
Xmin =58-1=57
nuevo valor mnimo
Xmax =110 + 1=111 nuevo valor mximo
y Luego se construye tabla de distribucin de frecuencia con intervalo de clase donde m= 6 , C= 9
y X mn=57 y Xmx=111
[X'i-1
X'i )
Xi
fi
hi
Fi
Hi
F*i
H*i
57
66
61,5
0.1333
0.1333
30
1.0000
66
75
70,5
0.1000
0.2333
26
0.8667
75
84
79,5
0.2333
14
0.4667
23
0.7667
84
93
88,5
11
0.3667
25
0.8333
16
0.5333
93
102
97,5
0.1333
29
0.9667
0.1667
[102
111)
106,5
0.0333
30
1.0000
0.0333
30
1.0000
n=
Otro elemento en esta tabla con intervalos de clase, es la Marca de clase o punto
medio Xi que es la semisuma de los extremos de los intervalos:
Xi-1+Xi
Xi =
2
Principales Grficos
Grfico de Barras y circular se utiliza para variables cualitativas. Del ejemplo de la
investigacin tenemos:
No. DE
PRO DUCTO S
7
5
3
TIPO DE DEFECTO
sd
Grfico de barras
Escalera
Xi
n
Xi
n
8AVOVENDEDOR
9NOVENDEDOR
10MOVENDEDOR
PROMEDIO
=promedio(b2:b11)
16
11
8
10.4
MARGEN
UTILIDAD(Xi)
4.2%
5.5%
7.4%
10.1%
TOTAL
_
X =XP/P=
VENTAS(Pi)
30,000,000
20,000,000
5,000,000
3,000,000
58,000,000
(Xi)(Pi).
1,260,000
1,100,000
370,000
303,000
3,033,000
3,033,000/58,000,000 =5.2%
Xifi
n
El promedio se utiliza cuando los datos son homogneos es decir que estos no
varan entre ellos mucho.
Ejemplo
TABLA DE DISTRIBUCIN DE LAS VENTAS MENSUALES DE 30
VENDEDORES
[X'i-1
57
66
75
84
93
[102
__
X'i )
66
75
84
93
102
111)
Xi
61,5
70,5
79,5
88,5
97,5
106,5
n=
fi
Xi*fi
4
3
7
11
4
1
30
246
211,5
556,5
973,5
390
106,5
2484
X= Xifi/n=
2,484/30=
82.8
MEDIANA(Me)
Es la medida de posicin central que se sita en el centro de los valores
ordenados de una variable y divide en dos partes iguales
50%
50%
Me
Mediana para datos sin tabular:
De un grupo de datos ordenados en forma ascendente o descendente, la Me es el
valor que se sita en el centro, si el total de datos es un nmero impar.
5, 8, 8, 11, 11, 14, 16
Me=11
y si es un nmero par, la mediana es el promedio de los valores centrales.
.
Ejemplo: Si 8 vendedores de artefactos electrodomsticos vendieron el siguiente
nmero de aparatos ordenados ascendentemente:
5, 8, 8, 10, 11,13, 14, 16
en este caso el nmero total de datos es un nmero par 8 entonces la mediana
(Me)=(10+11)/2=10,5=11
Interpretacin: El 50 % de los vendedores o sea 4 vendieron menos de 11
artefactos electrodomstico, mientras que el otro 50% vendieron igual o ms de 11
artefactos.
La mediana se puede calcular en una hoja de clculo de Excel utilizando el mismo
procedimiento para el clculo del promedio excepto que la funcin es la siguiente:
=MEDIANA(B2:B10)
Mediana para datos tabulados
Procedimiento:
1ro. Calcular n/2, valor hasta donde est acumulado el 50% de los valores de la
variable donde n= es el tamao de la muestra.
2do Comparar n/2 con los valores de la Frecuencia absoluta acumulada F i
n/2 - Fi-1
Fi - Fi-1
2949.5
n/2 vs Fi
27<n/2<60
Fi
Fi-1
=
=
60
27
IMe
X'i-1
Ci
2999-2800 =
Reemplazando en la frmula
Me
= 2800+199*( 50-27)
(60-27)
199 amplitud
=2938.69697=2938.70=2939
fi
SALARIO
Xi-1 Xi-1
2400 2599
2600 2799
2800 2999
3000 3199
3200 3399
Mayor que 3399
fi
7
20
33
25
11
4
100
7
20
33
25
11
4
100
Fi
7
27
60
85
96
100
Fi
7
27
60
85
96
100
MODA(Mo)
Es otra medida de posicin central de un grupo de datos ordenados en forma
ascendente o descendente, es el valor que ms se repite en el grupo. Esta puede
o no existir, si existe puede ver ms de una Moda. Se simboliza por Mo.
Ejemplo: Si 8 vendedores de artefactos electrodomsticos vendieron el siguiente
nmero de aparatos ordenados ascendentemente:
5, 8, 8, 11, 11, 11, 14, 16 en este caso la Mo es el valor 11, puesto que es el
valor que se repite ms veces (3).
Si tuviramos las siguientes ventas: 5, 8, 8, 8, 11, 11, 11, 14, 16, entonces
existe dos modas Mo=8 y Mo=11, a esta distribucin se le conoce como
Distribucin Bimodal y si tuviramos las siguientes ventas: 5, 7, 8,, 10, 11, 13,
14, 16, entonces no existe modas, puesto que ningn valor se repite ms de una
vez.
Al igual que la Media y la Mediana, la Moda se puede calcular en una hoja de
clculo de Excel utilizando el mismo procedimiento descrito para el Promedio
excepto que la funcin es la siguiente: =MODA(B2:B10).
SALARIO
2400
2600
2800
3000
3200
3400
2599
2799
2999
3199
3399
3599
Xi
2499.5
2699.5
2899.5
3099.5
3299.5
3499.5
TOTAL
fi
Xi*fi
7 17,496.5
20 53,990.0
33 95,683.5
25 77,487.5
11 36,294.5
4 13,998.0
100 294,950.0
MODA
fi
33
1
=
IMo
=
X' i-1 =
Ci
=
30-20 10
2800 2999
2800
2999-2800 =
Mo
2800+199(10/10+5)
fi-1 =20
7
27
60
85
96
100
fi+1 =25
2 = 30-25 5
199
Fi
3994
Son tres puntos que dividen al conjunto de valores ordenados de una variable en
cuatro partes iguales entre cuartil y cuartil existe solo un 25 % de total de valores
de la variable
25%
25%
25%
25%
Q1
Q2
Q3
Q1 cuartil 1 o primer cuartil es el valor que deja atrs el 25 % del total de valores
menores que l y es superado por el 25 % del total de valores mayores que l.
Q2 cuartil 2 o segundo cuartil es el valor mediano
Q3 cuartil 3 o tercer cuartil es el valor que deja atrs el 75 % del total de valores
menores que l y es superado por el 25 % del total de valores mayores que l
Ejemplo para datos sin tabular
Caso1 cuando el numero de valores es un nmero par
Los siguientes datos corresponden a los tiempos (en minutos) que lograron 20
atletas en una prueba de 200 metros planos
2,0
1,3
1,7
1,8
1,9
2,6
2,8
1,2
2,8
2,3
1,7
1,9
2,4
2,5
2,2
2,6
1,5
2,0
1,6
2,3
Clculo de los cuartiles (Q1) (Q2) y (Q3)
1ro Ordenar de menor a mayor los datos
2do dividimos en dos partes (lnea roja)
3ro Se calcula la mediana de los 10 primeros datos =Q 1
4to la mediana de todos los datos Q2
5to se calcula la mediana del segundo grupo es decir =Q 3
1
2
3
4
5
6
7
8
9
10
11
12
13
14
xi
1,2
1,3
1,5
1,6
15
16
17
18
19
20
2,4
2,5
2,6
2,6
2,8
2,8
Q3 =(2,4+2,5)/2 =
2,45
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
fi
50
150
210
60
30
500
Fi
50
200
410
470
500
Primer cuartil
1ro se calcula n =500/4 =125
2do se compara de n con la Fi
Y se observa que:
50 <1/4n< 200
Fi-1
Fi
hi
10%
30%
42%
12%
6%
Hi
10%
40%
82%
94%
100%
Fi
Fi
[X'i-1
57
66
75
84
93
[102
X'i )
66
75
84
93
102
111)
Xi
61,5
70,5
79,5
88,5
97,5
106,5
n=
Primer cuartil
1ro se calcula n =1*30/4 =7,5
2do se compara de n con las Fi
Y se observa que:
fi
Fi
4
3
7
11
4
1
30
4
7
14
25
29
30
7 <1/4n< 14
Fi-1
Fi
Segundo cuartil
1ro se calcula 2/4 de n =2*30/4 =15
2do se compara 2/4 de n con las Fi
Y se observa que:
14<2/4 de n< 25
Fi-1
Fi
Tercer cuartil
1ro se calcula 3/4de n =3*30/4 =22,5
2do se compara3/4 de n con las Fi
Y se observa que:
14 <1/4n< 25
Fi-1
Fi
Deciles
percentiles
Medidas de Dispersin o Estadstico de Variacin o de dispersin de un
conjunto de datos: es un valor que mide el grado de variabilidad de las
observaciones al rededor de un valor central o de posicin. Los principales son:
rango, desviacin media, varianza, desviacin estndar y coeficiente de variacin.
Existen distribuciones que siendo diferentes, tienen valores iguales para algunos
de sus estadgrafos de posicin , por ejemplo:
A) 3, 7, 4 6, 67, 81
X =40.8 Me=46
B)15, 38, 46, 52, 53
X =40.8 Me=46
Los dos conjuntos de valores tienen igual media y mediana; estos resultados
pueden conducir a conclusiones equivocadas cuando se est comparando grupos
o poblaciones.Para superar estas limitaciones se construyen otros estadgrafos
que analizan la variabilidad de los datos respecto a un valor central.
El Rango o recorrido: se define como la diferenvcia entre el valor mayor y el
mnor de un conjunto de datos.Se simboliza por R
R = Xmx - Xmn
Del ejemplo anterior tenemos que:
Para el grupo A) R= 81-3=78 y B) R=53-15=38
Significa la diferencia entre el mayor y menor valor.
El rango es muy limitado, pues solo considera los valores extremos y no dice nada
como varan los valores intermedios.
.
Desviacin Media (DM):o desviacin promedio de un conjunto de valores X 1, X2 ,
...... Xn se define por :
DM=|Xi - X|
n
Para datos tabulados DM = |Xi - X |* fi
n
Ejemplo:Distribucin de los salarios semanal de 100 trabajadores calificados
SALARIO
Xi
Fi
Xi*fi
|(Xi - X )|*fi
2400 2599
2500
7 17,496.5
3150
2600 2799
2700
20 53,990.0
5000
2800 2999
2900
33 95,683.5
1650
3000 3199
3100
25 77,487.5
3750
3200 3399
3300
11 36,294.5
3850
3400 3599
3500
4 13,998.0
2200
TOTAL
100 294,950.0
19,600.0
PROMEDIO = 294,950.0/100=
_
DM = |(Xi - X )|=19,600/100=
n
2949.5
196
S2 = V(X) = (Xi - X )2
n
2949.5
58,700
Desviacin Estndar
Es la raz cuadrada de la Varianza. Simboliza por S
REGRESIN Y CORRELACIN
Estadsticamente interesa analizar la relacin entre dos o ms variables , siempre que
tenga un indicio que ella existe o por lo menos el grado de dependencia supuesta es
lgica.
En este tema se trata de predecir o explicar el comportamiento o el resultado de una
variable, as como investigar si ellas estn asociadas entre s y tiene el propsito
fundamental en proporcionar los procedimientos y las tcnicas para expresar y medir la
relacin o afinidad entre dos variables X e Y para n observaciones.
Intuitivamente
debemos determinar claramente que variable explica mejor el
comportamiento de la otra o en otras palabras, que variable depende de la otra. Con el
siguiente ejemplo ilustraremos esta premisa.
Por ejemplo: El Administrador de una Empresa con domicilio en Lima Metropolitana
remite, a 10 Departamentos importantes del pas un lote de producto por medio de un
camin, y a partir que el embarque estuvo listo para su transportacin, registra la distancia
en kilmetros y el tiempo de entrega: Tenemos que:
Distancia (En Km).
: 825 215 1070 550 480 920 1350 325 670 1215
El tiempo de entrega (En das ) : 3.5 1.0
4.0 2.0 1.0 3.0 4.5 1.5 3.0
5.0
Solucin
En principio tenemos dos variables es estudio :
La variable distancia (En Km.) lo simbolizaremos por X
El tiempo de entrega (En das ) se simboliza por Y
Analizamos : a mayor distancia del departamento de origen al departamento de destino le
corresponde mayor tiempo en la entrega del lote de producto. Por lo tanto el tiempo de
entrega estar dependiendo de la distancia entre el punto de origen y destino. Entonces
Tenemos que:
9.- Mejorar la presentacin del grfico disminuir el tamao de las letras de los ttulos,
hacer clic en el rea de ttulo y presionar el botn derecho del mouse y saldr una
ventana donde se selecciona la opcin del Formato del Ttulo.
10-. Elegir fuente, tipo de letra Time New Roman, negrita, tamao 8 aceptar, para los
ejes de igual manera, hasta que el grfico se visualice bien.
REGRESION SIMPLE
El propsito de este tema es estimar la relacin que existe entre dos variables X e
Y que se expresa como :
Y= f(X)
donde Y depende de X, esto expresa que Y es un valor estimado a partir de
valores reales de X.
Y = llamada variable dependiente, predictando o explicada
X= llamada variable independiente, predictor o explifcativa
Tambin se puede expresar como X=G(X)
C) Para determinar o construir modelos o funciones de regresin es indispensable
disponer
de informacin acerca de los valores que ha alcanzado cada una de las
variables en distintos mementos o lugar
La funcin de regresin como modelo estadstico se construye a partir de una muestra
representativa de valores (Xi, Yj).
AJUSTE DE UN MODELO REGRESIN
Ajustar una funcin de regresin consiste en buscar y definir la funcin matemtica que
exprese con mayor precisin la relacin entre variables. Esta funcin permite obtener
valores estimados Y* = f(X) a partir de los valores de X , entonces la diferencia (e i)
entre los valores reales de Yi y los estimados Y* sea mnimo, entonces para cada valor
se tendra: Y-Y* = ei
Este problema de minimizacin, es resuelto utilizando el mtodo de Mnimos
Cuadrados.
Del ejemplo de Distancia en Km. y Tiempo de entrega en das de 10 embarques, la
variable dependiente Y Tiempo de entrega en das y la variable Independiente X
Distancia en Km. Porque a mayor distancia se utiliza mayor tiempo, entonces toda
relacin tiene un sentido o direccin , es decir . Que una variable siempre resultar
mejor explicada por la otra.
En el ajuste de funciones de regresin simple, se pueden utilizar diversas funciones
matemticas conocidas tales como:
a) La Lnea Recta Y* = a+b*X
b) La Parbola
Y* = a + b X + cX2
c) La Curva Potencial Y* = bXa
d) La curva Exponencial : Y* = a.bX
e) etc.
El problema de ajuste de una funcin de regresin a un conjunto de n valores (Xi,Yj),
comprende 3 pasos:
1 Graficar la nube de puntos (Xi,Yj) .Realizado en el punto A
2 Definir la forma de la funcin de regresin (recta, parbola,
exponencial.
3 Determinar el valor numrico de los parmetros de la funcin
elegida. Los parmetros de la funcin de regresin se deben obtener
a partir de las ecuaciones normales obtenida por mtodo de mnimos
cuadrados.
1. Apuntando con el puntero del mouse sobre los puntos del grfico de dispersin
presionar el botn izquierdo del mouse, y los puntos se encendern.
2. Luego apuntando los punto encendido presionar el botn derecho del mouse y
aparecer una ventana y seleccionar la opcin Agregar Lnea de Tendencia.
CORRELACION LINEAL
= Cov(X,Y) / SxSy
_ _
donde : Cov(X,Y) es la covarianza = (XY/n) - (X)(Y)
Sx es la desviacin estandar de X y Sy la desviacin estandar de Y.
Otra frmula: r = ( nXY - ( X) ( Y)) / ( n X2 - ( X2) ( n Y2 - ( Y) 2)
Propiedades de r:
-1 <= r <=1
entonces si:
r>0 existe correlacin directa positiva
r<0 existe correlacin inversa o negativa
r=1 existe una correlacin perfecta positiva
r=-1 existe una correlacin perfecta inversa o negativa
r>=+-0.6 existe una correlacin consistente
r=0 no existe correlacin
con los datos del ejemplo inicial calculamos el coeficiente de correlacin en EXCEL
utilizando el siguiente procedimiento con el ejemplo anterior tenemos:
1.- Situarse en la celda A14 escribir la letra r.
Donde se observa que r =0.95 existe una alta correlacin entre la variable X e Y , es decir
que la Ecuacin de Regresin Y* = 0.1181+ 0.0036X nos va ha dar, estimaciones muy
cercana a la realidad.
PROBABILIDAD
Introduccin
En la vida diaria, utilizamos muchas veces la palabra probabilidad, o posibilidad,
para referirnos por ejemplo si llegaremos a tiempo a auxiliar a un accidentado en
un choque automovilstico.O la posibilidad de que un nuevo tratamiento sea ms
efectivo en un tipo de enfermedad.O la posibilidad de que gane la Tinka si compr
10 nmeros. Estas situaciones implican incertidumbre, cuyos resultados no se
pueden determinar anticipadamente, sin embargo si es posible definir, medir,
estimar o predecir el posible resultado estadsticamente con la ayuda de la
Probabilidad.
En gentica es cierto saber si un descendiente ser macho o hembra, pero en un
plazo largo se conoce aproximadamente el porcentaje de descendiente que sern
machos y el de aquellos que ser hembras. Una CIA de seguros de vida no puede
predecir qu personas de un pas morirn a la edad de cincuenta aos, pero si
puede predecir bastante satisfactoriamente cuantas personas de ese pas morirn
a esta edad.
Definicin de Probabilidad Se puede definir como el estudio de lo experimentos
o fenmenos aleatorios o libres de determinacin.
Es una herramienta fundamental para medir la posible ocurrencia de un
experimento aleatorio .
Est constituido por un conjunto de mtodos y tcnicas utilizadas en la medicin y
prediccin de experimentos aleatorios.
Experimento():Consiste en cualquier operacin llevada a cabo sobre alguna
unidad de observacin que produce sucesos o resultados. Los experimentos
pueden ser Determinstico o No Determinstico
Experimento Determinstico:que por sus condiciones, se puede conocer con
antelacin un resultado particular del experimento. Ejemplo: a) La suma de dos
nmeros pares, b) Se tira una pelota al aire c) Se saca de una urna una ficha
donde todas son de color rojo.
Experimento No Determinstico o Aletorio: Son aquellos experimentos que no
se pueden conocer con antelacin un resultado particular del experimento. Pero se
puede definir el conjunto de posibles resultados. A estos experimentos estudia la
probabilidad Ejemplo:
Experimento
a) Seleccionar una familia de un distrito,
b) Administrar una droga a cuatro animales
c) Lanzar una Moneda.
Observac/medida
Contar el nmero
de hijos dependientes.
Registrar el de laboratorio
tiempo que toma la droga para
hacer efecto sobre cada animal.
Registrar lo predominante, ya
4*4 =16
4*3 =12
Ejemplo:
Se ha entrevistado a 10 personas sobre su aceptacin o no por un producto de
consumo masivo. cuntas respuestas diferentes pueden darse?
2*2*.......2 = 210
10 veces
Ejemplo:
4 artculos A, B, C, D van a ser colocadas en 4 espacios E 1, E2, E3, E4 con la
posibilidad de colocar ms de un artculo en un espacio.
a) De cuantas formas diferentes se pueden hacer la distribucin de los
artculos.
4*4*4*4 =44
b) En cuantos casos se habr colocado un artculo en cada espacio.
4*3*2*1 = 24
b) En cuantos casos se tendr el espacio E1 vaco
34 =81
c) En cuantos casos se tendr 2 espacios vacos.
6*24 =96
Ejemplo:
En un saln de clase hay 12 alumnos (7 hombres, 5 mujeres) los cuales deben
exponer un tema uno tras otro.
a) Cuntas formas diferentes de exposicin se pueden dar?.
12*11*10*..........*1 =12! = 479001,600
b) Cuantas formas diferentes de exposicin si debe empezar un hombre y
terminar una mujer.
H
M
7!
10!
5!
=(7!)(10!)(5!) =2,1947E+12
c) Cuantas formas diferentes de exposicin habr si empiezan las mujeres y
despus los hombres.
(5!)*(7!) = 604800
2) Principio de Adicin
Si las operaciones E1,E2,........EK se pueden realizar de n1,n2,...........nk manera
respectivamente, entonces la operacin E1 E2............ EK se realizar de n1 +
n2 +.......+nk = ni maneras diferentes.
Ejemplo:
=
(n k)!
Ejemplo:
A una competencia se han presentado 8 candidatos y se van a repartir solo 3
premios.
De cuantas maneras se har la premiacin?
8!
P8 3=
= 336
(8 3)!
c)
Permutaciones con Repeticin
Si un experimento aleatorio puede ocurrir de n maneras diferentes y se repite
r veces bajo las mismas condiciones entonces el nmero de maneras en que
se puedan dar en las r repeticiones.
Pn r = n r
Ejemplo:
Una variable X toma 5 valores diferentes. Se desea extraer muestras de 3
elementos c/u con repeticin cuntas muestras diferentes se podrn extraer?
P5 3 = 53 =125
Ejemplo:
De cuantas formas diferentes puede un alumno responder un examen de 10
preguntas que tiene 4 alternativas c/u de ellas.
P4
d)
10
= 410
12
= 312
2,7,3 =
2! 7! 3!
4) Combinaciones
Son arreglos de los elementos de un conjunto sin tomar en cuenta el orden.
a)
Combinaciones de los n elementos de un conjunto tomados K de
ellos sin repeticin
n!
Cn k = (
k) =
K!(n k)!
La combinacin tambin se puede calcular por medio de Excel utilizando la
funcin : =combinat(n;K) donde n es el total de elementos
Propiedades:
a) (
) =n
c)
n
0
) =1
b) (
) =1
Ejemplo:
Se tiene en una caja de 12 Diskettes de los cuales 4 son de marca Maxel, 5 de
National, 3 de 3M. Se eligen al azar y sin reposicin 3 diskettes despus de
haber desprendido sus etiquetas.
a) De cuantas maneras se podr hacer la eleccin.
12
12
( 3) =
= 220
3! 9!
b) En cuantos casos los 3 diskettes elegidos sern de la misma marca.
( 43) * ( 80) + ( 53) * ( 70) + ( 33) *( 90) =
c) En cuantos casos tendremos ms diskettes de Maxel que de las otras
marcas.
( 52) * ( 71) + ( 53) * ( 70)
Ejemplo:
Se van a colocar 5 artculos diferentes en 5 lugares distintos (puede ubicarse
ms de un artculo en un espacio)
a) Cuntas formas de ubicacin existen.
n() = 55
b) En cuantos casos los 2 primeros espacios quedarn vacos.
///// /////
///// /////
///// /////
///// /////
///// /////
/ ////
n(A) = 35
c) En cuantos casos se habrn utilizado 2 espacios.
=
Nmero de casos Posibles
Ejemplo: en una caja hay 9 diskettes, de los cuales 3 son de marca Maxell, 4
de marca 3M y 2 de marca Imation. Cul es la probabilidad de extraer un
diskette de marca Imatin?
Variables aleatorias.
Es una funcin matemtica que asocia a cada uno de los elementos del
espacio muestral un nmero, si estos nmero es un conjunto contable (finito
o numerable )) se dice que la variable aleatoria X es discreta ; x el valor de la
v.a discreta puede tomar valores como X=0,1,2,3, 4.......,. Si el rango de X es
continuo se dice que la variable aleatoria X es contnua , donde x puede
tomarcualquier valor de cierto intervalo o coleccin de intervalos sobre la
recta real.
Ejemplo:
Si el experimento aleatorio consiste en lanzar dos moneda sobre una mesa ,
este generaq un espacio muestral siguientes:
S:{cc, cs, sc, ss} y se define la v.a X como el nmero de caras obtenida al
lanzar las dos monedas.
Por definicin de variable aleatoria X asocia a cada uno de los elemento del
S un nmero de la siguiente manera:
W1=(CC)
W2 =(CS)
W3=(SC)
W4=(SS)
X(W1)=2
X(W2)=1
X(W3)=1
X(W4)=0
Graficamente se observa
R
W1=(CC)
W2 =(CS)
W3=(SC)
W4=(SS)
2
1
1
0
Funcin de Probabilidad:
Es un cuadro estadstico que muestra los valores de la variable y sus
respectiva probabilidad de ocurrencia o es una funcin matemtica
Xi
X1 P(
X1)
X2 P(
X2)
X3 P(
X3)
X4 P(
X4)
P(Xi)
.. ..
P(Xi) =e- x
X!
1
e-1/2(X-U/)2
f(x) =
2
1 , 1/2 X 11/8
0 ,
en otro lugar
X2
2
1/2
+X
11/8
1/2
=1/8+11/8-1/2= 1
X2 P( P(
=1 X2) X
= X2)
2/4 =3/
4
X3 P( P(
= 2 X3) X
= X3)
1/4 =1
1
X ; 0 X 1/2
f(x)
1 ; 1/2 X <11/8
0 ;
en otro lugar
Determinar F(X)
Solucin:
i) P(X0) = -0f(x)dx = -00dx =0
P(Xt) = -tf(x)dx == -00dx =0 + 0t xdx=X2
2
t
=t2/2
0
0 t 1/2
1/2
t
t
0
1/2
t
t
2
P(Xt) = - f(x)dx == - 0dx 0 + 0 xdx+ 1/2 1dx=0 + 0 xdx=X /2
+ X =t- 3/8
0
1/2
1/2 t 11/8
1/2
P(Xt) = -tf(x)dx == -00dx 0 + 01/2 xdx+ 1/211/8 1dx=0 + 0t xdx=X2 /2 + X
11/8
=1
1/2
t 11/8
F(x)
0 ;x<0
X2 ; 0 X 1/2
2
X-3/8 ; 1/2 X <11/8
1
; X 11/8
DISTRIBUCIN BINOMIAL
Es un experimento aleatorio que se caracteriza:
a) En efectuar n pruebas independientes y repetitivas de Bernoull.
b) La probabilidad de xito p se mantiene constante a travs de las n
pruebas .
c) Por ser un experimento aleatorio que consiste en seleccionar una
muestra aleatoria de tamao n una a una con reposicin , de una
poblacin finita o infinita particionada en dos clases arbitrariamente
llamadas las clases de los xitos y la clase de los fracasos .
d) La probabilidad de xito p presenta la probabilidad de seleccionar un
elemento de la clase de los xitos.
E
F
N
Con reposicin
x:valor de la v.a x
E : clase de los xitos
F : clase de los fracasos
N: tamao de la muestra
Ejemplo: lanzar 10 veces una moneda, para observar el nmero de cara que aparecen.
calcular la probabilidad: a) que aparezcan exactamente 2 caras b Por lo menos que
aparezca una cara.
Solucin:
1. Son pruebas simples, donde cada moneda es una prueba que tienen dos posibles
resultados de acuerdo a la variable aleatoria X: el nmero de caras que aparecen:
Ser xito: si al lanzar la moneda y aparece cara
Ser fracaso: si al lanzar la moneda y aparece sello
2. La probabilidad de xito es contante en cada prueba 1/2=0.5 =p.
3 Las n=10 pruebas son independiente es decir el lanzamiento de la moneda es
independiente, porque su estado de naturaleza es la misma tiene cara y sello.
Por lo tanto X la v.a. se distribuye Binomialmente y tiene como funcin de probabilidad o
de cuanta:
Donde Rx={0,1,2,3..........}
Luego presionar el botn aceptar y dar el resultado de p(x=2), se puede observar que el espacio
para acumulado est con falso y ser verdadero cuando se piden p(xxi), puesto que las
probabilidades que da esta distribucin son probabilidades acumulada de x hasta un cierto valor Xi
DISTRIBUCIN POISSON
Es un experimento aleatorio que se caracteriza:
a) Por ser un fenmeno que se presenta aleatoriamente o independientemente en el
tiempo o espacio en el que slo interesa la ocurrencia del fenmeno un nmero
contable de veces y no interesa la ocurrencia del fenmeno.
b) Por ser un tipo de un experimento binmico en el que la probabilidad de xito es
bastante pequea (p
0), en tanto que el tamao de la muestra es grande
(n
), tal que =np >0
Ejemplos:
1) La cantidad de llamadas telefnicas en un periodo de una hora en cierta oficina
2) El nmero de accidentes de aviacin u otras calamidades que aparecen aleatoriamente
independientemente en un tiempo continuo
c) La variable aleatoria X toma valores como X=0, 1, 2, 3..... donde x es la frecuencia
que se presenta el fenmeno en un intervalo de tiempo.
d) La probabilidad de conseguir exactamente X xitos , cuando el fenmeno aleatorio es
de Poisson , est dada por :
e- x
p(x) =
x=0,1,2.........
X!
p(x) : Es la funcin de probabilidad o de cuanta
E(X)=
V(X)=
Ejemplo : una compaa contra accidentes de trnsito sabe que el 0.005% de la poblacin
fallece cada ao por accidente de trnsito. Cul es la probabilidad que la compaa
tenga que pagar a ms de 3 de los 10,000 asegurados que tiene en este ao?
X se distribuye binomialmente (X; 10,000 , 0.00005)
=np =10,000*0.00005=0.5
3
p(x>3) = 1 - p(x3)= 1 - e- x/x! =1- [e-0.5 (0.5)0/0! + e-0.5 (0.5)1/1!+ e-0.5 (0.5)2/2!+ e-0.5
(0.5)3/3!)=1-0.998=0.002
Distribucin Normal:
Se dice que una variable aleatoria X se distribuye normalmente con
parmetros y 2 si tiene como funcin de densidad o de probabilidad:
1
f(x)=
e-(x-/ )2
2
- X
Propiedades :
1. El grfico de f(x) tienen la forma de una campana llamada campana de Gauss
f(x)
Importancia :
Es la distribucin de variable aleatoria continua ms importante :
a) Muchas de las tcnicas utilizadas en la estadstica aplicada se basan
distribucin normal.
b) Las variables aleatorias que se definen a partir de las observaciones
prcticas , trabajo de investigacin o experimentos se distribuyen
normalmente
c) Otras variables se distribuyen o aproximan normalmente.
d) An en el caso algunas variables aleatorias que no estn distribuidas
normalmente no aproximadamente normal se pueden convertir en
distribucin normal mediante transformacin matemticas.
e) Tienden a la normal la distribucin Binomial, Poisson, T-Student etc.
Varianza de X V(X)= 2
E(X) =
1
f(x)=
2
e-(x-/ )2
- X
Z 0.0 0.0 0.0 0.0 ..... .... ..... ..... ..... 0.0
0 1 2 3 ....
.. .. .. 9
x-
Z=
1
e-z2/2
f(Z)=
2
- Z
0.5
35
9
0.5
75
3
0.6
14
1
.
.
1.0
1.1
.
3.4 0.9 0.9 0.9 0.9
99 99 99 99
7 7 7 7
0.9
99
8
Propiedades
P(z>a)= 1 - P(za) complemento
P(a Z b )= P(zb) - P(za)= F(b)-F(a)
P(z-a )= 1 - P(za)
Ejemplo : El precio de la PC Pentiun en el distrito de Miraflores son
normales , con un promedio de $2000 y una desviacin tpica de 200$ .
Encontrar la probabilidad de que al preguntar por una PC -Pentiun al azar en
esta ciudad su precio sea: a) mayor o igual que $2550 b) entre $1900 y $
2100 c) menos de 1850$
Solucin;
Sea la variable aleatoria continua X =precio de la PC Pentiun
Se sabe que los precios se distribuyen normalmente con parmetros
=$2000 y =200$ , por lo tanto X tiene una distribucin de densidad:
1
f(x)=
e-(x-/ )2
- X
200
b) P( $1900 X $ 2100 )entonces estandarizando X tenemos estandarizando
P( $1900- X $ 2100- ) =P( $1900-2000 X - $ 2100- 2000) =
200
200
200
P(Z<-0.75)=1- P(Z 0.75)= 1- 0.7734=0.2266
Utilizando el Excel para solucin de este problema
a) Probabilidad que al preguntar por una PC -Pentiun al azar en esta ciudad su
precio sea mayor o igual que 2550$= P(X2550)=1 - P(X<2550) = 1- DIS
TR.NORM(2550,2000, 200, verdadero).
En el caso c como la variable est estandarizada tenemos :
c) (Z<-0.75)=1- P(Z0.75)= 1-Distr.norm.estand(0.75)= 0.2266
-200
220-1/2
<=X-<=
- 200
10
10
2 = S2
= S desviacin estndar
Es decir que la desviacin estndar poblacional es igual a la desviacin estndar de la pre
muestra.
E: lo fija el especialista, puesto que l es la persona ms indicada para estimar el mximo
error que se puede admitir al calcular el valor medio poblacional de la variable en estudio,
en la prctica lo ms aconsejable es 3 % de x o 5 % de x
B) Cuando el tamao de la poblacin(N) no es muy grande
1. Se calcula el tamao de la muestra no como si la poblacin fuese grande, por medio de
la frmula :
Z22
no =
E2
2. El valor de no se corrige por la frmula siguiente:
no
n =
1 + no/N
C) Tamao de muestra en el muestreo aleatorio simple, cuando la variable es cualitativa
(proporciones) en escala nominal u ordinal.
Por ejemplo , con la variable sexo se tiene dos categoras: hombre y mujer, supongamos
que hay 20 personas de la s cuales 8 son hombres y 12 son mujeres, las frecuencias en
las categoras son:
Cat fi hi Po
eg Ab rel rce
or sol ati ntu
a uta va al
o
proporcin
Ho 8 P=8 40
mb/20=0.4 %
res
Muq=12/20
12
60
jer
%
Tot 20 p+ 10
al
q= 0%
1
En donde:
n de hombres en el grupo
p= proporcin de hombres =
n total de personas
En donde:
q= proporcin de mujeres =
n de mujeres en el grupo
n total de personas
Entonces:
c1) Cuando la poblacin es grande :
Elaboracin del Marco muestral: Para seleccionar los elementos constitutivos de una
muestra debemos contar con un marco muestral bien elaborado, este marco es una
relacin detallada de nuestra poblacin en estudio , en la cual asociamos a cada elemento
de la poblacin, un nmero natural.
Muestreo : Son las tcnicas que se utilizan para seleccionar los elementos constitutivos
de la muestra Los muestreos probabilsticos, en los cuales se utilizan procedimientos
aleatorios para la seleccin de los elementos constitutivos de una muestra, en cuyo caso
todos los elementos de la poblacin tienen la misma probabilidad de ser incluido en la
muestra.
Mtodo de muestreo, estos pueden ser:
1.1 Muestreo Aleatorio Simple(MAS)
Es el tipo de muestreo ms conocido tiene las siguientes caractersticas:
a)Todos los elementos tienen igual probabilidad de ser elegido para formar parte
de la muestra. Puede ser con reposicin o sin reposicin. Utiliza la tabla de
nmeros aleatorios para elegir los elementos.
b)Todas las muestras posibles tienen la misma probabilidad de ser recolectada
1.2 Muestreo Sistemtico: es mejor que el MAS recorre la poblacin en toda su
extensin mediante un intervalo o periodo de seleccin evitando que la muestra
pueda quedar concentrada en cierta zona que si puede ocurrir en el MAS.
1.3 Muestreo Estratificado: a la poblacin se le divide en estrato, o clase o categoras,
bajo criterios bien establecidos. El objetivo de esta divisin es minimizar la
varianza. El tamao de la muestra determinada n debe ser asignada o afijada
proporcionalmente al tamao de cada estrato.Y la eleccin de los elementos
constitutivo utilizar la tcnica de MAS o MSITEMATICO.
1.4 Muestreo por Conglomerados: la unidades de anlisis pueden ser municipios,
ciudades manzanas, paquetes etc.), contienen nmero diferentes de elementos o
sub unidades.
1.5 Entre otros.
Distribucin de Muestreo
X2 , X3 ................ Xn
X2 , X3 ................ Xn
X2 , X3 ................ Xn
X2 , X3 ................ Xn
( X )2 = S2 varianza muestral
si la poblacin es finita
( /n)(N-n)/(N-1)
t n-1=gl =
S /n
Es el valor de una v.a. que tiene una distribucin t- student con gl=n-1 grados de libertad
donde :
(Xi-X)2
S =
n-1
63.66 31.82
0.158
9.92
6.96
0.142
15
2.95
2.60
......... 0.128
...
..
.............
.......
......
-t0
t0
X (Xi
X)2
15 64
19 16
23 0
28 25
30 49
115
pro 23
me
dio
varianza
Desviacin Estndar
|X-|
3
3
No piden calcular
P( |X - |>3 )=P(
>
) =P(| t
|>
)= P(| t |
>1.08)
S/n
6.2/5
S/n
Solucin:
Sea X la v.a Monto de alquiler, se dice que esta v.a. se distribuye normalmente con parmetros
=900$ y =300$
El experimento estadstico consiste en seleccionar 10 tiendas al azar de este distrito , encontrar la
probabilidad que el alquiler sea mayor o igual de 950$ .
Simbolicamente esto es P(X 950$)= P(X -
/ n
Si p es la proporcin de xitos en una m.a. de tamao n tomada de una poblacin binomial con
una proporcin de xitos entonces
p-p
P se distribuye como Z =
es el valor de una v.a. cuya distribucin se
p (1- p)
p-p
Z=
p (1- p)
n
X
X
p =
= es la proporcin de xitos en la muestra.
n
p ) = 1/n*np =p
V( p ) = 1/n*np(1-p) = p(1-p)
E(
p-p
Z=
p (1- p)(N-n)
(N-1)
Adems como se pasa de una v.a. discreta (binomial) a una v.a. continua (normal) se debe
introducir el factor de correccin de continuidad + - 1/2(1/n), sumando este factor al lmite superior
o restndolo al inferior. Si n es suficientemente grande se puede omitir el factor de correccin de
continuidad.
ESTIMACIN:
Se ocupa del estudio de la estimacin de parmetros y consiste en encontrar o determinar
una estadstica (llamado estimador) que estime el verdadero valor del parmetro .
N
= Media Poblacional
2 = Varianza Poblacional
P = Porporcin Poblacional
X = Total Poblacional
Estimacin Puntual:
Consiste en estimar un parmetro a partir de un valor de la muestra. Este valor es
considerado como el estimador del parmetro desconocido.
Por ejemplo: Se dice que la media aritmtica
estima a la media poblacional .
Estimacin intervlica:
Consiste en construir un intervalo [L1 L2] llamado intervalo de confianza que debe
contener el parmetro con una probabilidad dada: 1- llamada nivel de
El intervalo [L1 L2] es un intervalo aleatorio ya que sus extremos L 1 , L2 llamados lmites
de confianza son variables aleatorias , que varan de una a otra muestra . As, su
interpretacin se tiene confianza del 100(1-) % de que el intervalo contiene el valor
desconocido de ; o de que 100 intervalos aleatorios que se toman 95 de las veces
contendr el parmetro y slo 5 veces no lo contendr, si 1- = 95 %
/2
-Zo
Zo
2. Caso 2: muestra grande , varianza desconocida y poblacin normal o no con 2( la
varianza poblacional se considera aproximadamente igual a la varianza
muestral) :
P(X Zo* X Zo*)= 1-
n
n
3. Caso 3: muestra pequea, varianza conocida y poblacin normal
P(X Zo* X Zo*)= 1-
n
n
4. Caso 4: muestra pequea, varianza desconocida y poblacin normal
1-
-to
to
Error de estimacin :
Zo*
E =
n
Tamao de la muestra
Zo2*2
N=
E2
NI
VE
L
DE
CO
NF
IA
NZ
A
1- 99. 99 98 96 95. 95 90 80 68.
73 % % % 45 % % % 27
%
%
%
Ejemplo:
Las alturas de 3000 estudiantes de Administracin se distribuye normalmente, si se ha
obtenido una muestra de100 estudiantes al azar con un promedio de 1.67mtsy una
desviacin tpica de 10 cm. Estime los lmites de confianza del 95% para la altura
promedio de los 3000 estudiantes de ingeniera?
Solucin:
X: alturas de los estudiantes, esta variable se distribuye normalmente
Se saca una muestra n= de 100 estudiantes, con X =1.67mts y una S=10cm=0.10.
P(
/2
/2
0.95
0.025
- Zo
0.025
Zo
P(
ingresos
varianza
varianza
16 (1615.3333)2
0.44444
18 (18-15.3333)2
7.11111
11 (1115.3333)2
18.7778
17(17-15.3333)2
2.77778
13 (13-15.3333)2
10 (10-15.3333)2
5.44444
28.4444
22 (22-15.3333)2
44.4444
15 (1515.3333)2
0.11111
16(16-15.3333)2
0.44444
pro 15.333
me
3333
dio
108
vari
anz
a
P(
/2
/2
0.98
0.01
0.01
- to
to
P(
/2
1-
2
2/2
(n-1) S2
DONDE: L1 =
21-/2(v=n-1)
(n-1) S2
L2 =
2/2 (v=n-1)
21-/2
/2
/2
1-
2
L1=- Zo
L2= Zo
S
DONDE: L1 =
1+ Zo/n
S
DONDE: L2 =
1- Zo/n
Ejemplo1
Los Ingresos mensuales en miles de dlares , de 9 empresas dedicadas al
ensamblaje de computadoras de una ciudad fueron: 16,18,11,17,13,10,15,16. estime
los lmites de confianza del 98 % para la desviacin estndar de los ingresos de
todas las empresa dedicadas al ensamblaje de computadoras de esa ciudad.
Solucin :
Como la muestra es pequea , la varianza muestral se distribuye como Chi
cuadrada
P(
0.01=
/2
1- =0.98
2/2
21-/2
0.01
2
/2
P(2 2/2) =0.01 con n-1=8 grados de libertad entonces en tabla Chi cuadrado
obtenemos 2/2 =1.65
P(2 21-/2)= 0.99 con n-1=8 grados de libertad entonces en tabla Chi cuadrado
obtenemos entonces 21-/2= 13.4
(n-1) S2
DONDE: L1 =
1-/2(v=n-1)
8*13.5
=
8*13.5
=
2/2 (v=n-1)
la desviacin : 2.8
13.4
(n-1) S2
L2 =
=8.06
16(16- 0.4
15. 444
333 4
3)2
18(18- 7.1
15. 111
333 1
3)2
11 (11-15.3333)2
18.7778
17 (1715.333
3)2
2.77778
13 (13-15.3333)2
5.44
10 (10-15.3333)2
28.4444
22 (2215.3333)2
44.4444
15 (15-15.3333)2
16(16-15.3333)
0.44444
0.1
Promedio
15.3333333
108
Varianza
13.5
Des
viac
in
3.67423
P(
Hiptesis estadstica:
Es un supuesto o alguna afirmacin de la poblacin (modelo matemtico) o de sus
parmetros. Del Ejemplo anterior
De investigaciones pasadas se sabe la Vida media de la primera poblacin es 1400h.
Prueba de Hiptesis o Dcimas:
Es la verificacin de una hiptesis estadstica y es un procedimiento para decidir si se
acepta o se rechaza una hiptesis estadstica.
Hiptesis Nula: Denotada por Ho, es la hiptesis que se desea verificar , es la primera
afirmacin y la que se va a someter a prueba
Ho: =1400
Ha: >1400
Ho: =1400
Ha: <1400
Ho: =1400
Ha: 1400
El razonamiento indica que al tomar una decisin se puede cometer dos clases de
errores; puede rechazarse la hiptesis cuando es cierta o puede aceptarse cuando es
falsa.
Decisin
Ci Fal
ert sa
a
Ac De Err
ep cis or
tar intip
Ho es o I
co I
rre
cta
Ho
Rechazr Ho
Error tipo I
Decisin es correcta
C) Prueba de dos colas si la regin de aceptacin es un intervalo abierto entre los puntos
crtico C1 y C2
/2
/2
R
C1
C2
de
de
cis
in
pa
ra
do
ci
ma
r:
Ho
:
=
o
TI HI SE
PO P RE
DE TE CH
PR SI AZ
UE S A
BA AL HO
S TE si
NA
NT
E
Co Ha: Z < t <
la : Zc -t1( V)
iza <
qui o
er
t>
da
t1-(
V)
t<
-t1
Co Ha: Z <
la : Zc
de >
re o
ch
a
Do Ha: |Z|
s : <
col Zc
as o
Xo X o
Z=
/ t=
n
Zc
: S/
bu n
sc
( V)
ar v=
en nta 1
bla
Zc
: S/
bu n
sc
ar v=
en nta 1
bla
Z
R
1200-1500
=
-30020
=
/n
100/20
=-13.41
100
5. Por la hiptesis alternante es una prueba de una sola cola y de cola izquierda
=0.05
0.95
Z
R
Donde c= Zc, como no se puede calcular probabilidades en el rea negativa , por simetra
tenemos:
=0.05
0.95
A
C=Zc=1.64
Clculo de C =Zc:
P(Z Zc) = 0.95 por lo tanto podemos observar en la tabla Zc=1.64.
=0.05
=0.05
0.95
Z
R
C =Zc=-1.64
longitud
1.0(1. 0.0
202- 01
1.0 11
5)2
1.1(1. 0.0
111- 03
1.0 21
5)2
1.0(1. 0.0
202- 01
1.0 11
5)2
1.0(1. 0.0
707- 00
1.0 28
5)2
1.0(1. 0.0
909- 01
1.0 34
5)2
1.0(1. 0.0
101- 01
1.0 88
5)2
Pr 1.0
om 5
edi
o
0.0
08
93
Var
ian
za
0.0
02
De
svi
aci
n
0.0
42
26
89
8
varianza
varianza
X - o
=
s/n
1.05-1.00
0.056
=
0.042/6
=2.92
0.042
6. Por la hiptesis alternante es una prueba de una sola cola y de cola izquierda
=0.06
0.94
t
R
C=tc
Clculo de C =tc:
P(t tc) = 0.94 aproximadamente a 0.95 por lo tanto podemos observar en la tabla Con
n-1=5 grados de libertad tenemos que tc=2.02.
.
=0.05
0.95
Z
A
C =2.02 R
el nuevo proceso dio una media de 86 Kg/ cm2 y una desviacin tpica de 3 K Kg/ cm2 El
nuevo proceso tiene efecto negativo sobre el alambre en cuanto a su resistencia . Emplee
un nivel de significacia de 8%
El problema es una prueba de hiptesis
1.
Ho: =98 Kg/cm2 resistencia
promedio a la ruptura.
2.
Ha: 98 Kg/cm2 resistencia
promedio a la ruptura
3.
Comprobar esta hiptesis con un nivel de significancia de =0.08.
Se ha tomado una muestra de n=9 valores obtenidos bajo el nuevo proceso dio una media
de 86 Kg/ cm2 y una desviacin tpica de 3 K Kg/ cm2
X - o
=
s/n
86- 98
=
3/9
-129
=
3
=|-12|
/2=0.08/2=0.04
0.92
R
C1=tc =-1.86
/2=0.08/2=0.04
t
A C2=tc=1.86
Clculo de C =tc:
P(t tc1) = 0.96 aproximadamente a 0.95 por lo tanto podemos observar en la tabla Con
n-1=8 grados de libertad tenemos que tc1=1.86
AB={2,4,6}
A
B
AB
A B
S
Eventos mutuamente excluyentes
S
A B=
Otros Ejemplos
3 personas esperan en un paradero la llegada de un microbus. Se sabe que por
esa ruta circulan 3 Empresa diferentes de microbuses.a) defina el espacio
muestral del experimento. b) defina los elementos de los siguientes eventos: E1:
{los tres toman la misma empresa} E2:{los tres van en empresas diferentes. E3:
{ninguno toma la empresa 3}
Solucin :Sean: A, B, y C las tres personas. 1, 2, y 3 las tres empresas.
S:{A1B1C1, A1B1C2, A1B1C3, A1B2C1, A1B2C2, A1B2C3, A1B3C1, A1B3C2,
A1B3C3, A2B1C1, A2B1C2, A2B1C3, A2B2C1, A2B2C2, A2B2C3, A2B3C1,
A2B3C2, A2B3C3, A3B1C1, A3B1C2, A3B1C3, A3B2C1, A3B2C2, A3B2C3,
A3B3C1, A3B3C2, A3B3C3}
.