Академический Документы
Профессиональный Документы
Культура Документы
GENERAL
Introduccin 1
Regresin Lineal
Bibliografa
Anexo I
i
Introduccin
Economa y Finanzas.
Demografa
Educacin
Agricultura
Medicina
Ingeniera
Industria y comercio
ii
la variabilidad e incertidumbre sea una causa intrnseca de los mismos);
as como de realizar inferencias a partir de ellos, con la finalidad de ayudar
en la toma de decisiones y en su momento formular predicciones.
La estadstica descriptica
La estadstica inferencial
iv
Captulo I
Distribuciones de Frecuencia.
Distribucin de frecuencias.
Tabla 1
1 35 14 7 17
23 21 13 39 20
25 4 13 9 2
27 5 32 36 18
12 31 11 8 15
Nota. Los datos presentados en la forma como en la tabla anterior se
denominan: datos no agrupados.
1
Tabla 2. Distribucin de frecuencias
2
Frecuencia Acumulada de clase. Esta se obtiene sumando a la
frecuencia de una cierta clase las frecuencias de las clases anteriores.
3
Histograma de frecuencia. Este es un diagrama de barras, donde las
barras consecutivas estn en contacto.
4
La siguiente es la ojiva de la anterior tabla de distribucin frecuencia
Ojiva
40
35
Frecuencia Acumulada
30
25
20
15
10
5
0
0 50 100 150 200 250 300 350 400 450
Extremo Superior
Prctica.
4 8 4 6 8 6 7 7 7 8 10 9 7 6 10 8 8
5 9 6 3 7 6 4 7 6 9 7 4 7 6 8 8 9
11 8 7 10 8 5 7 7 6 5 10 8 9 7 5 6 5
5
Trabajadores No Trabajadores
14-19 2 1 2 3
19-24 10 4 8 7
24-29 32 10 11 9
29-34 47 12 13 34
34-39 38 8 10 25
39-44 22 7 7 18
1 10 __ 0.05 25 __
11 20 __ 0.25 __ __
21 30 150 __ 300 __
31 40 __ 0.10 __ __
41 50 __ __ 500 __
6
Medidas de Posicin
Estas medidas se usan para indicar el lugar que ocupa un dato especfico
dentro del conjunto de datos cuando este est ordenado. Los Cuantiles los
denotaremos donde P es un porcentaje. El Cuantil es un valor tal
que, un porcentaje P de los datos caen debajo de dicho valor. Por ejemplo
debajo de 25% cae un 25% de los datos.
Cuartiles
Deciles
Percentiles
7
50( + 1) +1
= =
100 2
Donde n es el nmero de datos.
11 15 11 17 12
13 18 13 11
11 15 10 17 12
13 18 14 11 15
Cuartiles
Estos son tres valores que dividen el conjunto de datos ordenado en cuatro
subconjuntos de igual tamao. Estos se denotan: 25% , 50% , 75% .
8
Mtodo de la Posicin. Segn este mtodo aplicamos la formula dada
anteriormente para determinar primero la posicin del cuartil y luego su
correspondiente valor
10 25 39 37
15 10 30
10 25 39 37
15 10 30 41
9
Cuartil Posicin Valor
% (25)(8 + 1)
=
100
% (50)(8 + 1)
=
100
% (75)(8 + 1)
=
100
= 75% 25%
Percentiles
11
Captulo II
La moda
La mediana
La media o promedio: Aritmtica, Ponderada, Cuadrtica, Armnica,
Geomtrica
Moda.
11 15 11 17 12
13 18 13 11 15
11 15 10 17 12
13 18 13 11 15
Ventajas de la moda
Es estable a los valores extremos.
Es recomendable para el tratamiento de variables cualitativas.
Desventajas de la moda
Pueda que no se presente en un conjunto de datos.
Puede existir ms de una moda.
En distribuciones muy asimtricas suele ser un dato muy poco
representativo.
12
Carece de rigor matemtico.
Prctica.
1. Para los datos dados siguientes determine la moda
4 8 4 6 8 6 7 7 7 8 10 9 7 6 10 8 8
5 9 6 3 7 6 4 7 6 9 7 4 7 6 8 8 9
11 8 7 10 8 5 7 7 6 5 10 8 9 7 5 6 5
Significado Smbolos
Media Aritmtica o Promedio
=
Suma de todos los datos
Nmero de datos n
13
Significado Smbolo
Media Ponderada
=
Suma de multiplicacin de datos
por su peso
Suma de los pesos
Ejemplo. Las siguientes son las notas obtenidas por cierto estudiante en la
materia informtica y la ponderacin asignada. Determine la nota definitiva
14
Ejemplo. La siguiente tabla presenta las calificaciones obtenidas por unos
estudiantes en el curso de matemtica. Determine el promedio de notas
Significado Smbolo
Media Ponderada
= 0 +
Punto medio al cual se le asigno 0
el cdigo 0
Ancho de las clases
15
Ejemplo. La siguiente tabla presenta las calificaciones obtenidas por unos
estudiantes en el curso de matemtica. Determine el promedio de notas
16
2. En la tabla siguiente de indica el registro de las personas que acuden
a un cierto centro de atencin de salud en cierta semana. Determine
el promedio del nmero de personas que por categora acuden a
dicho centro de salud.
Trabajadores No Trabajadores
14-19 2 1 2 3
19-24 10 4 8 7
24-29 32 10 11 9
29-34 47 12 13 34
34-39 38 8 10 25
39-44 22 7 7 18
17
Materia Nota Crdito Materia Nota Crdito
Matemtica 10 6 Estadstica 11 4
I
Matemtica 12 6 Administracin 16 4
II
Informtica 14 3 Ingles 17 2
1 10 60 __ 60 __
11 20 __ 0.4 __ __
21 30 30 __ 170 __
31 40 __ 0.1 __ __
41 50 __ __ 200 __
18
Otras Medidas de Tendencia Central.
x 2 9 6 5 1 7 2
2
19
Media Geomtrica. Cuando se trabaja con cantidades que varan con el
tiempo, podramos estar interesados en la tasa promedio de variacin de
dicha cantidad. En este caso la media geomtrica resulta adecuada para
determinar dicha tasa promedio de variacin de dicha cantidad.
Media Armnica.
x 7 9 4 3 5 1 7 2
1
20
Ejemplo. Para la tabla de las calificaciones obtenidas por unos estudiantes
en el curso de matemtica. Determine la media armnica
1 10 __ 0.25 50 __
11 20 __ 0.40 __ __
21 30 30 __ __ __
31 40 __ 0.10 __ __
41 50 __ __ 200 __
21
Captulo III
Medidas de Dispersin
Ejemplo. En el deporte Tiro con Arco, el blanco est conformado por cinco
crculos concntricos. Clavar una flecha en el crculo ms externo da un
22
punto; clavarla en el crculo mas interno da cinco puntos. Las siguientes
tablas dan la puntuacin obtenida por dos arqueros. Represntelos
grficamente. Cul de estos dos conjuntos de disparos est ms
concentrado alrededor de su correspondiente promedio?
Arquero A Arquero B
1 1 2 3
4 5 3 4
5 1 3 2
2 5 2 3
1 4 2 3
1 1 3 2
2 2 2 2
4 3
23
Media de la Desviacin Absoluta respecto al Promedio.
La Varianza.
24
Datos no agrupados Datos Agrupados
Tabla de distribucin de
Frecuencias
)
( 2
( )2
= =
1
)
(
7
4
3
6
25
Datos No Agrupados Datos Agrupados
Tabla de distribucin de
frecuencias
( ) ( )2
2
=
=
1
Arquero A Arquero B
2
x x 2
1 2
4 3
5 3
2 2
1 2
1 3
2 2
4 3
1 3
5 4
1 2
5 3
4 3
1 2
2 2
26
Intervalo de Notas Nmero de Punto Medio xf
Matemtica Estudiantes (x)
(f)
15 8
69 11
10 13 9
14 16 7
17 20 1
Suma = = 2 =
12
10
0
1 2 3 4 5 6 7 8 9 10
Promedio = 5
s=0
27
Grfico A
Punto Frecuencia xf 2
(x) (f)
= 2 =
4.5
3.5
2.5
1.5
0.5
0
1 2 3 4 5 6 7 8 9 10
Promedio = 5
s = 1.155
Grfico B
Punto Frecuencia xf 2
(x) (f)
= 2 =
28
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
1 2 3 4 5 6 7 8 9 10
Promedio = 5
s= 2.981
Grfico C
Punto Frecuencia xf 2
(x) (f)
= 2 =
29
Coeficiente de Variacin.
30
c) Se mide la circunferencia con una cuerda y una regla
31
centro de atencin de salud en cierta semana. Determine el
coeficiente de variacin.
Trabajadores No Trabajadores
14-19 2 1 2 3
19-24 10 4 8 7
24-29 32 10 11 9
29-34 47 12 13 34
34-39 38 8 10 25
39-44 22 7 7 18
80
60
40
20
0
24 25 26 27 28 29 30 31 32 33 34
Datos
100
90
80
70
Frecuencia
60
50
40
30
20
10
0
24 25 26 27 28 29 30 31 32 33 34
Datos
33
140
120
100
Frecuencia
80
60
40
20
0
24 25 26 27 28 29 30 31 32 33 34
Datos
34
Captulo IV
Casos.
Pronostico de Ventas
Pronsticos Causales.
36
costumbre expresar los datos en forma de un par ordenado (x,y), donde x
es la variable de entrada (o independiente), y es la variable de salida (o
dependiente)
Diagramas de Dispersin.
Diagrama de Dispersin
Flexiones vs Abdominales
60
50
Abdominales
40
30
20
10
0
0 10 20 30 40 50 60
y = 0.6579x + 14.908
Flexiones
R = 0.7047
37
Anlisis de Correlacin.
Este anlisis tiene por objetivo medir hasta que punto hay algn tipo de
asociacin lineal entre dos variables.
Diagrama de Dispersin
38
Horas Ejercicio vs Nota
4.5
4
3.5
3
2.5
Nota
2
1.5
1
0.5
0
0 5 10 15 20 25
y = -0.0148x + 3.1484
Horas Ejercicio
R = 0.0155
Este da una medida de hasta qu punto hay una relacin lineal entre dos
variables. Este coeficiente refleja la consistencia del efecto de un cambio
en una variable produce en otra variable. El coeficiente de correlacin se
denota r, y adquiere valores tales que:
1 1
Valor de r igual a -1, indica una correlacin lineal perfecta negativa (esto se
refiere a que todos los datos Bivariados caen exactamente sobre una lnea
recta de pendiente negativa)
39
Donde SS significa suma de cuadrados. El numerador y denominador de la
expresin anterior lo calcularemos mediante:
(, ) =
( )2
() = 2
( )2
2
() =
Donde n es el nmero de pares de datos.
40
En el caso del modelo lineal, se trata de escoger la ecuacin de la lnea
recta que mejor ajusta los datos la cual est determinada por el intercepto
u ordenada al origen 0 y por la pendiente 1 .
= ( ( ))2
=0
( ) = 0 + 1
= 0 + 1
= ( (0 + 1 ))2
=0
41
0 0 + 1 1 = 0
=0 =0 =0
0 1 + 1 2 = 1
=0 =0 =0
La relacin entre dos variables podra ser una expresin como las
siguientes:
42
Exponencial =
Potencial =
Logartmica =
Polinmicas = 0 + 1 + 2 2 + +
ln() = ln() +
ln()
0 ln()
43
(, ln())
=
()(ln())
ln() = ln() + ()
ln()
ln()
0 ln()
La suma de los cuadrados del error cometido en el ajuste de los datos con
un polinomio de mnimos cuadrados se determina mediante:
45
= ( ( ))2
=0
0 0 + 1 1 + 2 2 + + = 0
=0 =0 =0 =0 =0
0 1 + 1 2 + 2 3 + + +1 = 1
=0 =0 =0 =0 =0
0 + 1 +1 + 2 +2 + + 2 =
=0 =0 =0 =0 =0
K 0 1 2 3 4
0 0.25 0.50 0.75 1.00
1.0000 1.2840 1.6487 2.1170 2.7183
0 0 + 1 1 + 2 2 = 0
=0 =0 =0 =0
4 4 4 4
0 1 + 1 2 + 2 3 = 1
=0 =0 =0 =0
46
4 4 4 4
0 2 + 1 3 + 2 4 = 2
=0 =0 =0 =0
= 0 + 1 +
(, )2
=0( )2 () ()
= =
2 2
47
1 ( /)2
0 = +
()
Prctica.
48
c) Determine la ecuacin lineal que mejor ajusta a los datos (de victorias en funcin
de PCA).
3. Puede la estatura de una mujer ser predicha por la estatura de una madre? La
siguiente tabla da las estaturas de algunas mujeres y la correspondencia de su
hija:
a) Construya el diagrama de dispersin.
b) Determine el ndice de correlacin lineal.
c) Determine la ecuacin lineal que mejor ajusta a los datos.
d) Para una estatura de la madre de 70, Cul estatura predecira Ub para la hija?
49
a) Construya el diagrama de dispersin.
b) Determine el ndice de correlacin lineal.
c) Determine la ecuacin lineal que mejor ajusta a los datos.
50
Capitulo V
Teora de Probabilidad
Cara: C Sello: S
Resultado Codificacin
Cara-Cara CC
Cara-Sello CS
Sello-Cara SC
Sello-Sello SS
52
Ejemplo. En una heladera se venden los sabores: chocolate, mantecado,
fresa, y en las presentaciones: barquilla y tinita. Describa las posibles
escogencias de los clientes (espacio muestral).
Presentacin Sabores
Barquilla: B Chocolate: C
Tinita: T Mantecado: M
Fresa: F
2 3
= {1 , 2 , . , }
Presentacin Sabores
C
B M
F
C
T M
F
53
Definicin Informal de Probabilidad.
0 ( ) 1
= {1 , 2 , . , }
(1 ) + (2 ) + + ( ) = 1
Si A es un evento compuesto
A = { , , . , }
() = ( ) + ( ) + + ( )
= {1 , 2 , . , }
54
1
( ) = || k = 1, 2, , n
Ejemplo. Dado el caso del comit integrado por Carlos, Ana y Pedro, para
los cargos de Presidente, Tesorero y Vocal.
|| = 6
Comit Probabilidad
CAP 1/6
ACP 1/6
PAC 1/6
CPA 1/6
APC 1/6
PCA 1/6
55
regiones: Distrito Capital, Centro y Occidente. La segunda letra es
para identificar el departamento: Ventas, Administrativo y Produccin.
La ltima letra identifica el escalafn ocupado: Gerencia, Oficinista y
Obrero. Si todas las identificaciones tienen igual oportunidad al ser
seleccionada al azar, describa el espacio muestral de las
identificaciones. Describa la probabilidad de los sucesos: a) La
identificacin corresponda a un personal administrativo, b) La
identificacin corresponda a un personal en el Distrito Capital y sea un
obrero, c) La identificacin corresponda a un personal ubicado en el
centro, sea gerente y tenga una numeracin mayor o igual que 5.
2. Se desea realizar una encuesta a familias con tres hijos. Describa
todas las combinaciones del sexo de los tres hijos que una familia
puede tener (espacio muestral). Si cualquier combinacin del sexo de
los tres hijos que se puede obtener tiene la misma oportunidad de
aparecer en la encuesta, determine la probabilidad de los sucesos: a)
el primer y segundo hijos sea varones, b) Todos los hijos sean
hembras, c) el primer hijo sea varn o el ltimo hijo sea hembra, d) el
tercer hijo sea varn.
3. La tabla siguiente muestra en promedio el nmero de nacimientos por
dia en EEUU. Determina la probabilidad de los sucesos siguientes: a)
nacer un lunes, b) nacer un da laborable, c) nacer un fin de semana,
d) nacer un lunes, o un mircoles o un viernes.
Dia Nmero de Nacimientos
Domingo 7563
Lunes 11733
Martes 13001
Mircoles 12598
Jueves 12514
Viernes 12396
Sbado 8605
Pregunta 1 2 3 4
Respuesta V F V F
Cada respuesta correcta vale 5 puntos. Si alguien selecciona al azar
sus respuestas, calcule la probabilidad de los sucesos siguientes:
obtener 20 puntos, obtener 15 puntos, obtener 10 puntos y salir
aplazado.
57