Академический Документы
Профессиональный Документы
Культура Документы
MINIMOS CUADRADOS
INTRODUCCIN
El presente trabajo forma parte de los objetivos y contenidos de aprendizaje de
la ctedra ESTADSTICA, que pretende desarrollar las habilidades para la
utilizacin de los mtodos lineales y estimacin de mnimos cuadrados.
Para lograr este fin, se realizo la consulta de una bibliografa bsica la cual
permiti desarrollar los conceptos y ejemplos, como base.
En este trabajo bsicamente se habla de cmo desarrollar la aplicacin de los
mtodos lineales y estimacin por mnimos cuadrados, adems de inferencia,
prediccin y correlacin.
Se desarrollaron una serie de ejemplos mediante los cuales se trata de
presentar manera mas sencilla usar estos mtodos.
ESTADISTICA APLICADA
Re emplazando
nos queda
ESTADISTICA APLICADA
y = na + bx
xy = ax + bx
ESTADISTICA APLICADA
XY
4.2
7.2
30.24
51.84
4.9
6.7
32.83
44.89
7.0
17.0
119.00
289.00
6.2
12.5
77.50
156.25
3.8
6.3
23.94
39.69
7.6
23.9
181.64
571.21
4.4
6.0
26.40
36.00
5.4
10.2
55.08
104.04
43.5
89.8
546.63
1292.92
ESTADISTICA APLICADA
se
ESTADISTICA APLICADA
el segundo termino es la
entonces
ESTADISTICA APLICADA
obtenido con la
estimado de
ESTADISTICA APLICADA
Regresin lineal
Las tcnicas de regresin permiten hacer predicciones sobre los valores de cierta
variable Y (dependiente), a partir de los de otra X (independiente), entre las que
intuimos que existe una relacin. Para ilustrarlo retomemos los ejemplos mencionados
al principio del captulo. Si sobre un grupo de personas observamos los valores que
toman las variables
no es necesario hacer grandes esfuerzos para intuir que la relacin que hay entre ambas
es:
Obtener esta relacin es menos evidente cuando lo que medimos sobre el mismo grupo
de personas es
ESTADISTICA APLICADA
A la deduccin, a partir de una serie de datos, de este tipo de relaciones entre variables,
es lo que denominamos regresin.
Figura: Mediante las tcnicas de regresin de una variable Y sobre una variable
X, buscamos una funcin que sea una buena aproximacin de una nube de puntos
(xi,yi), mediante una curva del tipo
de que la diferencia entre los valores yi e
, tal como
ESTADISTICA APLICADA
El trmino que hemos denominado error debe ser tan pequeo como sea posible (El
objetivo ser buscar la funcin (tambin denominada modelo de regresin) que lo
minimice.
Proposicin
En los ajustes lineales se conservan las medias, es decir
ESTADISTICA APLICADA
En cuanto a la varianza, no necesariamente son las mismas para los verdaderos valores
de las variables X e Y y sus aproximaciones y , pues slo se mantienen en un factor
de r2, es decir,
Demostracin
Basta probar nuestra afirmacin para la variable Y, ya que para X es totalmente anlogo:
ESTADISTICA APLICADA
y=X +
donde
ESTADISTICA APLICADA
(X'X)b = X'y
y
Las ecuacio<nes normales se pueden escribir en la forma matricial
AB=g
Si la matriz A es no singular, podemos escribir la solucin para el coeficiente de
regresin como
b = A-1g =(XX)-1Xy
De esta forma se puede obtener la ecuacin de prediccin o la ecuacin de
regresin al resolver un conjunto de k + 1 ecuaciones con un nmero igual de
incgnitas. Esto implica la inversin de la matriz X'X de k + 1 por k + 1. Las
tcnicas para invertir esta matriz se explican en la mayora de los libros de
texto sobre determinantes y matrices elementales. Por supuesto, se dispone de
muchos paquetes de computadora de alta velocidad para problemas de
regresin mltiple, paquetes que no slo imprimen estimaciones de los
coeficientes de regresin, sino que tambin proporcionan otra informacin
relevante para hacer inferencias respecto a la ecuacin de regresin.
ESTADISTICA APLICADA
Ejemplo 1
Se midi el porcentaje de sobrevivencia de cierto tipo de semen animal,
despus del almacenamiento, en varias combinaciones de concentraciones de
tres materiales que se utilizan para aumentar su oportunidad de sobrevivencia.
Los datos son los siguientes:
y(%
sobrevivencia)
x1(peso
%)
x2(peso
%)
x3(peso
%)
25,5
1,74
5,30
10,80
31,2
6,32
5,42
9,40
25,9
6,22
8,41
7,20
38,4
10,52
4,63
8,50
18,4
1,19
11,60
9,40
26,7
1,22
5,85
9,90
26,4
4,10
6,62
25,9
6,32
8,72
9,10
32
4,08
4,42
8,70
25,2
4,15
7,60
9,20
39,7
10,15
4,83
9,40
35,7
1,72
3,12
7,60
26,5
1,70
5,30
8,20
ESTADISTICA APLICADA
=
De los resultados de una computadora obtenemos los elementos de la matriz
inversa
ESTADISTICA APLICADA
=
Al resolver estas r + 1 ecuaciones, obtenemos las estimaciones b 0, b1,....., br y
por ello generamos la ecuacin de prediccin de regresin polinomial
ESTADISTICA APLICADA
Ejemplo 2
Los siguientes datos representan el porcentaje de impurezas que ocurren a
varias temperaturas y tiempos de esterilizacin durante una reaccin asociada
con la fabricacin de cierta bebida.
20
25
14.05 10.55
7.55
14.93
9.48
6.59
16.56 13.63
9.23
15.85 11.75
8.78
ESTADISTICA APLICADA
b0 = 56,4668
b11 =0,00081
b1 = -0,36235
b22 = 0,08171
b2 = -2,75299
b12 = 0,00314
. Se
ESTADISTICA APLICADA
4.2
7.2
4.6
-0.4
0.16
4.9
6.7
4.5
0.4
0.16
7.0
17.0
6.6
0.4
0.16
6.2
12.5
5.7
0.5
0.25
3.8
6.3
4.4
-0.6
0.36
7.6
23.9
8.0
-0.4
0.16
4.4
6.0
4.4
0.0
0.00
5.4
10.2
5.2
0.2
0.04
1.29
ESTADISTICA APLICADA
COEFICIENTE DE DETERMINACIN.
El cambio de la variable Y generalmente depende de muchos factores, en
ocasiones, difciles de identificar; con el modelo lineal simple, slo tenemos
presente uno. Por ejemplo, en nuestro caso la mediana del ingreso depende no
slo del porcentaje de graduados en el nivel superior, que es, el factor que
tenemos presente, pueden entrar a jugar factores tales como, la distribucin de
la edad en la poblacin, la distribucin por sexo en la poblacin, la
industrializacin de la ciudad, el numero de universidades y muchos otros.
El coeficiente de determinacin mide o interpreta la cantidad relativa de la
variacin que ha sido explicada por la recta de regresin, es decir, la proporcin
de cambio en Y explicado por un cambio en la variable X ( X es el factor que se
utiliza para calcular la recta de ajuste o ecuacin de regresin, en el ejemplo es
el porcentaje de graduados en el nivel superior en cada ciudad).
Para el ejemplo el Coeficiente de determinacin va a medir la proporcin del
cambio en el ingreso mediano de cada ciudad, debido o explicado por un
cambio en el porcentaje de graduados en el nivel superior.
Veamos algunos componentes de la variabilidad en el anlisis de regresin:
La diferencia entre cada valor de Y observado y
variacin de Y.
media se denomina
ESTADISTICA APLICADA
ESTADISTICA APLICADA
4.2
5.44
-1.24
1.54
4.6
-0.84
0.71
-0.4
0.16
4.9
5.44
-1.24
0.29
4.5
-0.84
0.88
0.4
0.16
ESTADISTICA APLICADA
7.0
5.44
1.56
2.43
6.6
1.16
1.35
0.4
0.16
6.2
5.44
0.76
0.58
5.7
0.26
0.07
0.5
0.25
3.8
5.44
1.64
2.69
4.4
-1.04
1.08
-0.6
0.36
7.6
5.44
2.16
4.66
8.0
2.56
6.55
-0.4
0.16
4.4
5.44
1.04
1.08
4.4
-1.04
1.08
0.0
0.00
5.4
5.44
0.4
0.001
5.2
-0.24
0.06
0.2
0.04
43.5
13.271
11.78
COEFICIENTE DE CORRELACIN
Este Coeficiente como ya se dijo mide la fuerza de la relacin entre las
variables. El coeficiente tiene el signo que tiene b y su valor estar
El signo menos en el ndice significa una relacin negativa y un
signo ms una correlacin positiva. El coeficiente se obtiene sacando la raz
cuadrada al coeficiente de determinacin y se simboliza con "r".
1.29
ESTADISTICA APLICADA
0.0
0.2
0.2
0.4
0.4
0.7
Correlacin moderada
0.7
0.9
0.9
1.0
CORRELACIN
LINEAL
RECTA
DE
REGRESIN
ESTADISTICA APLICADA
DIAGRAMA DE DISPERSIN
La primera forma de describir una distribucin bivariante es representar los
pares de valores en el plano cartesiano. El grfico obtenido recibe el nombre de
nube de puntos o diagrama de dispersin.
ESTADISTICA APLICADA
Lnea
De
Tendencia
La lnea de tendencia es la herramienta bsica ms importante con la que
cuenta
el
analista
tcnico.
Es una lnea o conjunto de lneas que se trazan en el grfico uniendo con una
misma pendiente series sucesivas de puntos mnimos (lnea de tendencia
alcista)
o
de
puntos
mximos
(lnea
de
tendencia
bajista).
Sirve para determinar en primer lugar la direccin del mercado y establecer sus
objetivos
de
proyeccin.
Marca los niveles de soporte o de resistencia que estn proyectando los
precios.
Permite analizar en cada momento el nivel de Beneficio/Riesgo que se puede
tomar al iniciar o cerrar una posicin, tomando como referencia el precio actual
respecto
a
lnea
de
tendencia
y
su
proyeccin.
La ruptura de una lnea de tendencia al alza o la baja es una de las seales
que confirma un cambio en la direccin de los precios.
Son la base para trazar los canales que encuadran el posible movimiento de
los
precios.
Segn sea la dispersin de los datos (nube de puntos) en el plano cartesiano,
pueden darse alguna de las siguientes relaciones, Lineal, Logartmica,
Exponencial, Cuadrtica, entre otras.
Mo
delo Matemtico
Llamado tambin ajuste de curvas es una ecuacin dada en un grafico,
dependiendo del grado de correlacin que mas se ajuste al conjunto de datos.
AJUSTE LINEAL: Y=BX+A
AJUSTE LOGARITMICO: Y=B Ln X+A
AJUSTE EXPONENCIAL: Y=AC BX
AJUSTE PARABOLICO, CUADRATICO O POLINOMIAL: Y= AX 2 + BX +
A.
ESTADISTICA APLICADA
VIVIR EN CASAS
VIVIR EN APART.
MEXICO
10
40
50
MONTERREY
30
20
50
ESTADISTICA APLICADA
50
50
100
Xi
5.5
4.8
5.7
5.8
3.2
2.2
4.9
Yi
3.1
2.3
4.7
2.9
5.0
3.5
5.9
n
1
2
3
4
5
Xi
4.8
5.2
3.3
1.9
2.5
Yi
1.8
2.3
5.9
6.0
3.8
ESTADISTICA APLICADA
6
7
6.0
6.9
4.2
2.9
10 11 7
10 14
peso 58 42 51 54 40 39 49 56
Existe una relacin lineal importante entre ambas variables? Calcular la recta
de regresin de la edad en funcin del peso y la del peso en funcin de la
edad.En qu medida, por trmino medio, vara el peso cada ao? En cunto
aumenta la edad por cada kilo de peso?
5.- Se realiza un estudio para establecer una ecuacin mediante la cual se
pueda utilizar la concentracin de estrona en saliva(X) para predecir la
concentracin del esteroide en plasma libre (Y). Se extrajeron los siguientes
datos de 14 varones sanos:
X 1,4 7,5 8,5
11 13 14 14,5 16
17 18
20 23
48,5 51 64,5 63 68
ESTADISTICA APLICADA
4,5 5,5 7
13 15 14
17 22 35 43 80 85 91 92 96 100
Porcentaje de plomo
17 18 25 58 59 41 30 43 58
Automtico
ESTADISTICA APLICADA
Calcule los errores para cada una de dichas predicciones, es decir, las
variables
e
.
Que relacin hay entre las medias de X y
Calcule las medias de
obtenido?
, Y,
? Y entre las de Y e
Y entre
y
.
y
10 15 20 25 35
Creatinina (mg/dl)
3,8
.
Hllese la expresin de la ecuacin lineal que mejor exprese la variacin
de la creatinina, en funcin de los das transcurridos tras la dilisis, as
como el grado de bondad de ajuste y la varianza residual.
En qu porcentaje la variacin de la creatinina es explicada por el
tiempo transcurrido desde la dilisis?
Si un individuo presenta 4.1 mg/dl de creatinina, cunto tiempo es de
esperar que haya transcurrido desde la suspensin de la dilisis?
ESTADISTICA APLICADA
84
88
85
80 80 92 90
76 90
87 102 89
9 12 28 72 30 38 76 26 52
Mtodo experimental
6 10 27 67 25 35 75 27 53