Вы находитесь на странице: 1из 22

INGENIERO AGRONOMO LUIS GONZALEZ PEA

MARACAY 2008
ESTADISTICA ECONOMICA

Introduccin:

En los trabajos de investigacin, estudios, o proyectos se genera


frecuentemente una masa de informacin, la cual es necesaria: Ordenar,
Organizar para Analizar e Interpretar. Y de ello derivar Conclusiones. Por
otro lado tambin o conjuntamente se trabaja con informaciones que tienen
en muchas ocasiones cierto grado de elaboracin de modo que, para su
correcta interpretacin y su utilizacin es necesario, conocer los mecanismos
que se han usado en la misma. Es as que cotidianamente se habla o se leen
informaciones tales como: la produccin de petrleo en Venezuela alcanza a
200.000 barriles diarios; que los rendimientos de maz han alcanzado un
promedio de 2.000 kg/ha; que el ingreso del venezolano per-capita es de
1.900 $/ao; el precio de la cesta alimenticia es de 100.000 Bs/mes, tambin
que el Gato Galarraga batea sobre 300, que el consumo de carne es de 30
kg/ao por persona, etc.

De esta manera hay toda una constelacin de datos que usamos, y que
aceptamos sin mayores problemas y sin anlisis de lo que representan. Pero,
cuando nos dedicamos a una investigacin en particular, es necesario hacer
uso de las herramientas que existen para analizar e interpretar la
informacin, que nos dar evaluacin de hechos y situaciones, facilitando el
proceso de toma de decisiones, bien para tomarlas o para facilitarla a
otros. En cierta medida son cuestiones que en la vida prctica hay que hacer
o usamos. De manera que aplicando en forma sistemtica los instrumentos
estadsticos se puede minimizar riesgo.

Objetivo:

Basado en lo anteriormente expuesto, el objetivo fundamental de estas notas


es: Dar a conocer los mtodos estadsticos ms comunes aplicados en la
Economa Agrcola, su utilidad y limitaciones.

Para los efectos de iniciar las notas, se ha credo conveniente desarrollarlo


siguiendo los pasos que se cumplen en una investigacin.
En primer trmino:

DEBE EXISTIR UN PROBLEMA.

Es necesario que exista un problema a estudiar o investigar, que debe


formularse o definirse con la mayor claridad, de manera que permita
establecer los propsitos del estudio y determinar las unidades de
medidas, como: Poblacin: conjunto de elementos con caractersticas
similares presentes en un espacio claramente definido y durante un
tiempo determinado. Variables: Si bien es cierto que los elementos de
una poblacin, tienen caractersticas comunes que los identifican, las
mismas no son idnticos para todos ellos. Se hace necesario estudiar
esos caracteres que varan de un elemento a otro. Esos caracteres que
les son comunes a los elementos de una poblacin y que varan de uno
a otro, en estadstica se denominan en forma genrica variables.

Ejemplo: Conocer la eficiencia de los explotadores forestales, en la regin


central de Venezuela.

No hay que confundir el enunciado con el planteamiento del problema.

Se debe tener presente - en toda investigacin que involucre datos


estadsticos, conocer:

Alcance geogrfico
Alcance temporal
Alcance de contenido.

Se requiere tener claro lo que se quiere, con la mayor precisin posible. Esto
a su vez permitir establecer los Objetivos. Con los objetivos claros, se
facilitara determinar los mecanismos a seguir, herramientas o recursos a
utilizar y orientar cual informacin se requiere.

En segundo trmino:

RECOPILACION U OBTENCION DE LA INFORMACION

De la informacin: Esta puede ser producida por el investigador, u obtenerse


de fuentes de informacin, al respecto se debe revisar de donde se origina,
bien de Fuentes Primarias que son aquellas que contienen datos obtenidos
por el ente o entidad que lo publica. Ejemplo los Anuarios, Registros,
Organismos de Investigacin, etc.
Fuentes Secundarias aquellas donde se publican datos originados de otras
fuentes, no responsables del dato que publica.

Ing. Luis Gonzlez 2


Se recomienda en lo posible, para la recopilacin de datos, acudir a fuentes
primarias, esto porque la informacin es ms detallada, ms confiable. Las
fuentes secundarias tienen menos detalles, tienden a presentar errores de
transcripcin. De las fuentes primarias es probable conocer definiciones de
trminos y unidades, mtodos utilizados etc.

La validez de las conclusiones finales de un estudio o investigacin dependen


de lo adecuado del procedimiento de recopilacin de los datos.
Se recomienda examinar si los datos reflejan:

Lo que el ttulo sugiere

Si los datos son comparables, observados, calculados o


estimados.

Cuando la informacin no esta publicada (original), se debe entonces


proceder a obtener los datos, mediante un Censo, el cual en ocasiones no es
fcil aplicarlo y resulta generalmente costoso. Se puede o se debe obtener
informacin mediante una muestra. Al respecto hay que conocer como se
toma una muestra y tcnicas de muestreo.

En tercer trmino:

PRESENTACION DE LA INFORMACION

Obtenida la informacin, se debe representar mediante: tablas o cuadros


estadsticos, o bien mediante grficos.

Recomendaciones tcnicas para construir un buen cuadro estadstico.


Debe ser debidamente identificado:

Cuadro No
Capitulo
Sub-capitulo
Punto.

El titulo del cuadro debe expresar: que, donde, criterios usados y


periodo de tiempo.

PRODUCCION DE MAIZ
1970-1978

Ing. Luis Gonzlez 3


PRODUCCION DE MAIZ
Por entidad federal 1970-1978
(ton)
* Identificacin de columnas:

Debe ser breve pero que explique, no usar abreviaturas, al menos que sean
de uso universal.
Los totales o cualquier cifra que se desea resaltar, se reserva al cuadro
primero. El cuadro debe disearse de izquierda a derecha y de arriba
hacia abajo.

* Pie del cuadro.

Debe ir, nota al pie y la fuente


La fuente: sirve para indicar el origen de los datos incluidos en el cuadro,
identificar autores, titulo del documento, ao de publicacin.

Es conveniente hacer cuadro para cada cosa y para una solo cosa; las cifras a
comparar deben colocarse en columnas continuas.

En cuanto a los Grficos: Es el mtodo ms efectivo para atraer la atencin


sobre un fenmeno expuesto a travs de informacin numrica, permite de
manera rpida una visin integral de todo el conjunto de datos.

Los grficos tienen los mismos componentes que fueron sealados para los
cuadros, con la observacin de que: los ejes deben ser correctamente
identificados, no deben llevar excesos de datos, la escala deber ser lo
conveniente para que no se presenten distorsiones y no deben usarse
unidades diferentes en un mismo eje.
Existen distintos tipos de grficos: Lineales, Barras (simple, divididas), Torta,
etc.

ELABORACION Y ANALISIS DE LOS DATOS.

Para la elaboracin y anlisis de los datos, es necesario para ellos discutir dos
grupos de mtodos de medicin:

Mtodos descriptivos Tendencia Central


Dispersin
Porcentajes
Nmeros Indices

Mtodos estimativos Tasa de crecimiento


Variacin estacional
Correlacin
Regresin simple.

Ing. Luis Gonzlez 4


PRESENTACION DE RESULTADOS Y REDACCION DEL
INFORME TECNICO FINAL.

Sobre este aspecto se puede sugerir recomendaciones y discutir algunas


modalidades.

MEDIDAS DE LA TENDENCIA CENTRAL O DE POSICION.

Las medidas de tendencia central indican los valores alrededor de los cuales
se distribuyen los datos.

Entre las medidas tenemos los promedios: Media aritmtica, Mediana y


Moda. Un promedio es un valor simple, el cual es considera como el valor
ms representativo o tpico para un grupo de nmeros. Dan idea de la
magnitud de los datos.
El promedio se emplea con frecuencia como mecanismo para resumir un
conjunto de cantidades o nmeros, sobre todo si es grande, a fin
de describir los datos estadsticos.

Media aritmtica o simplemente media:

X1+X2....... X N xi
X= ------------------- = -------
N N

Se le denomina promedio, pero se tiene tan presente que existen otras


medidas que se le denominan asi. En caso de que los datos estn agrupados
por clases, se considera lo relativo a la frecuencia o sea el numero de veces
que un dato aparece.

X1fi+X2f2....... X nfn xi fi

Ing. Luis Gonzlez 5


X=------------------------------ = -------
f1+f2....... fn fi

La media tiene como ventaja que es ampliamente utilizada, es fcil de


calcular, es ms estable en el muestreo, uniforme de una muestra a otra,
dado que la suma de los cuadrados de las desviaciones con respecto a la X,
es mnimo, permite mas ajustes y por tanto mas exactitud. La media es
sensible a los valores extremos.
_
Ejemplo X (3, 4, 5, 6, 10, 100) = 128/6= 21,3

La mediana:

Se refiere al valor central de una serie arreglada en orden ascendente o


descendente.

Ejemplo: 7,8,10,11,12,14,15 Mediana= 11


6,7,9,12,16,20 Mediana= 9+12/2=10.5

Los datos extremos no afectan a la mediana, pero tiene menos estabilidad


que la media.

Moda:

La moda de una serie de datos, es aquel valor que se presenta con mayor
frecuencia, en tal sentido puede no existir, y de existir puede ser no nica.

Ej. 1,2,3,4,4,5,6,7 moda= 4


1,2,3,4,5,6,7 moda= no hay moda
1,2,2,3,4,5,5,5 moda= 2 y 5.

La moda no es afectada por valores extremos, es recomendable para cuando


una distribucin es bastante asimtrica. No es estable, se puede cambiar
radicalmente los valores sin modificar la moda.

La media geomtrica:

Se aplica a datos para los cuales la razn entre cualesquiera dos nmeros
consecutivos, es constante o casi constante. Presenta algunos
inconvenientes de clculos, no lo afecta valores extremos y se utiliza para
determinar tasa de crecimiento durante un periodo de tiempo. (ritmo de
crecimiento de la poblacin).

Ing. Luis Gonzlez 6


MG= X1.X2 ..... XN
Para efectos de facilitar el clculo se puede realizar la siguiente operacin:

logX1+logX2........logN
logMG= ------------------------
N

MEDIDAS DE DISPERSION

Los valores de una serie de datos, pueden ser pequeos o grandes, vale decir
varan en magnitud. La variacin de los datos es llamada dispersin y pueden
ser medidas por distintos mtodos. Cuando la dispersin es baja, el valor
promedio se vuelve altamente significativo, pero cuanto la dispersin de la
data es alta, el promedio se vuelve de poca o ninguna significacin.

El rango:

Que se refiere a la diferencia entre el mayor valor y el menor de los nmeros.

Ejemplo: 1,4,8,10,10

Rango=10-1=9

La desviacin media:

Es la media aritmtica del valor absoluto de las desviaciones de los valores


individuales con respecto al promedio de los datos dados.

Ing. Luis Gonzlez 7


Xi - X
D.M=-------------------=
N
La desviacin estndar:

Es una forma refinada de la desviacin media, esta medida esta basada en


cada uno de los valores de los datos, esta calculada con respecto a la media
aritmtica, y mide la dispersin alrededor de la media. La desviacin
estndar es matemticamente lgica, en virtud de que su clculo no
desprecia los signos positivo y negativo de las desviaciones individuales.

(Xi X )2
S2 = ---------------
N

(Xi - X)2
= ----------------------
N

NOTAS SOBRE CORRELACION

Cuando se estudia una variable cualquiera, la misma puede analizarse a


travs de las denominadas medidas de posicin (media aritmtica, moda,
mediana, etc.), igualmente a travs de las medidas de dispersin (varianza,
desviacin tpica, etc.) De esa manera, con el uso de las medidas
mencionadas puede lograrse una mejor interpretacin del comportamiento
de la variable objeto de estudio y as derivar conclusiones mas apropiadas.

Ing. Luis Gonzlez 8


Cuando se trata no solo de una variable, sino de dos (2) o ms, se pueden
estudiar de manera conjunta a travs de tcnicas estadsticas multivariables,
tales como la tabulacin-cruzada, covarianza, correlacin, regresin, etc. Las
cuales permiten establecer grados de relaciones existentes entre las
variables, ayudando a explicar el porqu de las variaciones. Logrndose as,
al igual que las medidas para analizar una variable, un mayor grado de
interpretacin de lo que es estudia.

Ahora bien, cuando queremos establecer si existe relacin o no, entre dos
variables, la misma se puede determinar mediante el anlisis de correlacin,
utilizndose el coeficiente de correlacin (r), definida por la expresin
matemtica:

Sxy
r=-----------
SxSy
_ _
Donde Sxy es igual a (Yi-Y)(Xi-X)

_
Sy = (Yi-Y)2

Sx = (Xi-X)2

_ _
(Yi -Y) (Xi -X)
Es decir que r= --------------------------
_ _
(Yi-Y)2 (Xi-X)2
El coeficiente de correlacin r, toma valores que varan de -1 a +1, cuando
ms se aproxima a 1 la relacin que existe entre las variables es ms intensa
y directa, es decir, igual direccin; cuando se aproxima a -1 la relacin es
tambin intensa pero inversa de direccin contraria. Cuando el valor de r se
aproxima a 0 (cero), se dice que entre las variables no existe relacin.

Para los efectos de una anlisis de correlacin el mejor punto de partida es


construir un diagrama de dispersin o nube de puntos, que no es ms que
una representacin grfica de las relaciones entre las variables. Un diagrama
de dispersin muestra si hay una alta correlacin o una baja correlacin.
Posteriormente se calcula el coeficiente que nos dar la medida de la relacin
lineal entre las dos variables.

Ing. Luis Gonzlez 9


Con un ejemplo, vamos a ilustrar la aplicacin del anlisis de correlacin.

Se quiere establecer la relacin que existe entre el consumo de carne de


bovino y el ingreso familiar, e identificar si el consumo de carne, aumenta o
disminuye con aumentos o disminuciones del ingreso. Para ello en una
ciudad se entrevisto a cinco grupos familiares, obtenindose los resultados
siguientes:

Cuadro No 1

Familia Consum Ingreso


No o Kg s Bs.
1 10 110.00
0
2 20 120.00
0
3 30 130.00
0
4 40 140.00
0
5 50 150.00
0

Para efectos del anlisis, se procede en primer termino a establecer el


diagrama de dispersin, observndose en el grfico lo siguiente:

Existe una correlacin intensa y positiva en el sentido de que a medida


que aumenta el ingreso tambin ocurre con el aumento del consumo de la
carne. Es decir valores bajos de una variable estn asociados a valores bajos
de la otra variable y viceversa. Cuando ocurre lo contrario, donde valores
bajos se encuentran asociados a valores altos, se dice que la correlacin es
negativa. Una muestra se presenta a travs del diagrama de dispersin
siguiente:

Ing. Luis Gonzlez 10


Y

Es el caso que se da, entre costo fijo unitario y produccin, donde a medida
que aumenta la produccin los costos fijos unitarios disminuyen. Otro
ejemplo, se presenta entre precios y cantidades adquiridas de algunos
productos, cuando se da la relacin de que a medida que aumenta el precio
del producto, las cantidades adquiridas disminuyen.

Como bien se observa, con el diagrama de dispersin se obtiene una


aproximacin de la relacin que existe entre dos variables, pero no una
medida de la misma. Por ello es conveniente calcular el coeficiente de
correlacin que si es un dato indicativo del valor de relacin existente.

Para el clculo del coeficiente de correlacin se procede de la manera


siguiente:

_ _ _ _ _ _
Familia Consumo Ingreso (Y-Y) (Y-Y)2 (X-X) (X -X)2 (Y-Y) (X-X)
1 10 110.000 -20 400 - 4.108 400.000
2 20 120.000 -10 100 20.000
- 1.108 100.000
3 30 130.000 0 0 10.000
0 0 0
4 40 140.000 10 100 10.000 1.108 100.00
5 50 150.000 20 400 20.000 4.108 400.000

Resultados: _ _ __
Y= 150 Y= 30 ; X= 650.000 X= 130.000
_ _
(Y-Y)2 = 1.000 (X-X)2 = 10.000.000

Entonces aplicando la frmula:

Ing. Luis Gonzlez 11


(Yi -Y) (Xi -X)
r= -----------------------------
_ _
(Yi-Y) (Xi-X)2
2

1.000.000
r= ---------------------------= 1
1.000.000

Con el anlisis de correlacin se puede entonces precisar el grado de relacin


que existe entre dos variables y la interpretacin del coeficiente se tiene que
hacer tomando en cuenta la magnitud del coeficiente, as como el signo de la
misma.

Si el valor del coeficiente es alto igual o cercano a 1 o a -1, indica que hay
tendencia de estar asociado valores de una variable con valores de la otra
variable.

As tenemos que en el caso presentado, el coeficiente es 1, indicando que a


medida que aumenta el ingreso tambin aumenta el consumo de carne,
siendo una relacin fuerte.

Si el coeficiente es menor, por ejemplo, 0.3 o 0.2, se puede concluir que no


hay suficiente evidencia que indique relacin entre las variables.
Para valores intermedios de r, se hace necesario realizar una prueba de
significacin para poder concluir si existe o no correlacin lineal entre las
variables.

En lo que respecta al signo, este indicara si la relacin es positiva o negativa.


Un coeficiente positivo indica que altos valores de una variable se
corresponde con altos valores de la otra variable, es le caso presentado.
Cuando el coeficiente es negativo indica una relacin negativa, es decir altos
valores de una variable se corresponden con bajos valores de la otra variable.
Si el coeficiente (r), hubiese sido negativa, podra sealarse que el consumo
de carne disminuye a medida que aumenta el ingreso.

Bien, como se puede observar, el coeficiente de correlacin indica el grado


de relacin como tambin la direccin o sentido de la misma. No revelando
causas y efectos que se establecen entre las variables. No permitiendo
predecir cambios que puedan ocurrir en una variable si la otra experimenta
alteraciones.

Ing. Luis Gonzlez 12


REGRESION

Cuando se quiere tener mas precisin acerca de las relaciones que existen
entre variables, de cmo son esas relaciones, su variacin y tendencia es
conveniente hacer uso de la tcnica de regresin, mediante el cual se
busca una lnea que exprese de una manera exacta la relacin entre las
variables. La lnea de regresin constituye una especie de lnea media que se
desplaza por el centro de la nube de puntos o diagrama de dispersin,
representando la relacin que existe entre las variables, de no ocurrir
alteraciones o modificaciones debido a otros factores denominados factores
de perturbacin o errores.

Bien, al igual que la correlacin es conveniente construir un diagrama de


dispersin donde representaremos los valores de la variable dependiente en
el eje vertical y los valores de la variable independiente en el eje horizontal.
Para ilustrar lo relativo a la regresin vamos a presentar un ejemplo:

"Se dispone de un conjunto de pares de informacin (X,Y), siendo Y, la


variable dependiente que representa rendimiento, y la X variable
independiente, que es la cantidad de fertilizante aplicado. Se sugiere
determinar el grado de relacin existente entre las variables". La
informacin la presentamos en el cuadro siguiente:

Rendimiento y cantidad de fertilizante aplicado


Cultivo "A"

Fertilizante
Rendimientos
ton/ha kg./ha

1 300
2 450
3 500
4 550
5 600

Ing. Luis Gonzlez 13


Si graficamos la informacin tenemos:

Rendimiento vs cantidad
de fertilizante

800
600

kig/ha
400
200
0
0 1 2 3 4 5 6
ton/ha

Se nota que en la medida que se aplica ms fertilizante, el rendimiento


aumenta, es decir existe una correlacin positiva. Sin embargo, la nube de
puntos no se presenta de manera lineal que indique exacta correspondencia
entre los valores de las variables, tal como se presenta el siguiente grfico.

Y
.
.
.
.

En el cual se puede trazar una lnea que pasa por cada uno de los puntos. En
tal sentido la idea es obtener una lnea la cual contenga valores de la
variable dependiente, excluidos los errores o perturbaciones. Este
procedimiento se denomina ajuste.

Para la fijacin de la lnea existen varios criterios, siendo uno de ellos el del
mnimo cuadrado, donde se hace uso de la ecuacin Y=a + bX, que
representa la lnea recta. De all que se le denomina ecuacin de regresin
lineal.

Es conveniente precisar lo que se entiende por error o perturbacin, de


manera que haciendo uso de un grfico veremos que el punto A, as como el
B, que representan pares de valores (Yi, Xi) se encuentran de la lnea recta a
cierta distancia que se denomina error.

Y A.
error

Ing. Luis Gonzlez 14


B.

^
Si el valor de Yi corresponde a la lnea recta, se le denomina Y estimada (Y)
entonces el error ser: _
(Yi - Y)
^
Si queremos que este sea mnimo, significa que (Yi - Y) debera ser mnimo.
^
Para que se de la condicin de mnimo, entonces (Yi - Y).

Vamos a usar el criterio del mnimo cuadrado, para lo cual se tiene que (Yi -
Y)2

Como lo que se quiere es determinar la lnea Y= a +bX con un mnimo de
error, entonces obtendremos por substitucin que:
[Yi -(a +bX)]2 es decir (Yi -a
-bX)2 , expresin que derivaremos con respecto a los parmetros a y b,
igualando a cero para obtener los mnimos.

De tal forma que tendremos:

(Yi -a -bX)2
d (Yi -a -bX)2 = 2(-1)(Yi -a-bX) ; -2(Yi -a - bX)= 0
da

dividiendo entre -2, la ultima expresin se reduce a:


(Yi -a - bX)= 0
Yi -a - bX= 0
Yi -na - bX= 0 sta
expresin constituye la
Primera Ecuacin Normal.

Si la expresin (Yi -a -bX)2 se deriva con respecto al factor b y se iguala a


cero, se obtiene la Segunda ecuacin Normal.

XiY i -aXi -bXi2=0

Sustituyendo el factor a en esta segunda ecuacin normal se obtiene:

n Yi Xi - Xi Yi
b=-----------------------------
Ing. Luis Gonzlez 15
n[ Xi2] - [Xi]2

En funcin de las ecuaciones normales, podemos determinar la lnea de


regresin del ejemplo en cuestin:
^
y= a + bx

Fertilizantes(X) Rendimientos (Y) X2 Xi Yi


1 300 1 300
2 450 4 900
3 500 9 1500
4 550 16 2200
5
600 25 3000
X=15 Y= 2.400 (X2 )=55 XiYi=7.900
_ _
X=3 Y=480 N=5

5(7.900) - (15)(2.400) 39.500 - 36.000 3.500


b=------------------------------- = ---------------------------= ----------
5(55) - (15)2 275 - 225 50

donde b= 70
_ _
a= Y - bX
= 480 - 70(3) = 480 - 210 = 270
^
Y= 270 + 70X

Esta expresin es la lnea de regresin.


Volviendo al grfico A, para trazar la lnea de regresin tendremos

rendim iento vs fertilizante


700
600
500
kg/ha

400
300
200
100
0

0 2 4 6
ton/ ha

Dando valor a X
Ing. Luis Gonzlez 16
Para X=0 Y= 270
X=2 Y= 410
Se obtiene dos puntos, pudindose trazar la recta.

La ecuacin de regresin nos da una ms completa descripcin de las


relaciones entre variables, as tenemos que se lograrn rendimientos de 300
a 450 kg./ha aplicando de 1 a 2 ton, o rendimientos de 500 a 550 kg./ha
aplicando de 3 a 4 ton. Es decir, que se puede predecir en cuanto variara la
variable dependiente de ocurrir cambios en la variable independiente. Esto
nos lo indica el parmetro b de la ecuacin, para nuestro ejemplo que es 70,
indica que por cada unidad en que aumente X (fertilizante) es predecible que
Y, (rendimientos) aumente en 70 unidades.

Evaluacin de la Ecuacin de Regresin.

Cuando se quiere evaluar una ecuacin de regresin, en trminos del grado


de "explicacin" en la variacin experimentada en la variable dependiente,
se procede a determinar el coeficiente de determinacin (R 2), que toma
valores que oscilan de cero a uno.
Cuando R2 alcanza el valor de 1, el mismo es indicativo de que la ecuacin
de regresin calculada "explica" en un 100% la variacin que experimenta la
variable dependiente alrededor de su media. En ese caso se dice que la
ecuacin tiene buen ajuste y que el modelo seleccionado es el ms
adecuado. Igualmente indica que cada punto en el diagrama de dispersin
cae precisamente sobre la lnea de regresin por lo que los errores sern
iguales a cero.
Cuando R2 toma valor igual a 0 (cero) es indicativo e que la ecuacin de
regresin no "explica" con propiedad las variaciones que se observan en la
variable dependiente, en este caso el modelo seleccionado no es el mejor y
los errores sern mayores que cero.

Para el clculo de R2 se utiliza la formula siguiente:


_ ^
(Yi-Y) - (Yi-Y)2
2

R2= -------------------------
(Yi-Y)2
Calculemos el coeficiente de Determinacin (R 2) para el ejemplo que hemos
venido utilizando.

_ _
Yi Xi Y=a+bX Yi-Y (Yi-Y)2 ( Yi-Y) (Yi-Y)2

300 1 340 -180 32.400 -40 1.600


450 2 410 -30 900 40 1.600
Ing. Luis Gonzlez 17
500 3 480 20 400 20 400
500 4 550 70 4.900 0 0

600 5 620 120 14.400 -20 400

= 2.350 =53.000 =4.000


Y= 470

Aplicando la formula tenemos:

53.000 -4.000
2
R =-----------------------= 0.9245
53.000

De acuerdo con el resultado obtenidos se puede interpretar que la ecuacin


de regresin calculada Y= 270 + 70X tiene buen ajuste en razn de que
explica en un 92% las variaciones que ocurren en la variable dependiente.

Cuando el coeficiente de determinacin alcanza valores cercanos a cero, se


dice que el modelo adoptado no es el mas adecuado. En ese caso debe
pasarse de la regresin simple a la regresin mltiple, seleccionando
modelos tales como:


Y=a+bX+cX2 ; b
Y= Ax ; Y= A.Bx

REFERENCIA BIBLIOGRAFICAS

Angarita Felix y Amanda Dagger. Estadstica (Tema No 1).


Mimeografiado. Dpto. de Ingenieria Agrcola. Ctedra de
Estadstica. Fagro. U.C.V. Maracay. 1973.
Barbancho, Alfonso. Ejercicios de Estadstica Descriptiva para
Economistas. Editorial Ariel. S.A. Espaa. 1973.
Mosquera C, Genaro. Hiptesis Estadstica con Aplicaciones.
Diseo y composicin litogrfica. S. A. Mexico. 1974.

Ing. Luis Gonzlez 18


Rivas Gonzlez, Ernesto. Estadstica General. (8 ed.) Ediciones de la
Biblioteca. Coleccin Ciencias Sociales 9 U.C.V. Caracas. 1990.
Shao, Stephen. Estadstica para Economistas y Administradores de
Empresas. Herrero Hermanos, Sucs. , S.A. Mexico. 1967.
Vsquez D, Tulio. Estadstica Econmica. Contexto/editores. Caracas.
1977.

Ing. Luis Gonzlez 19


Ing. Luis Gonzlez 20
ESTADISTICA

Definiciones:

Tcnica especial apta para el estudio cuantitativo de los fenmenos


naturales, econmicos, sociales, etc., cuya medicin requiere de una masa
de observaciones de otros fenmenos ms simples llamados individuales o
particulares. ( Conrado Gini).

Ciencia que trata de la recoleccin, clasificacin y presentacin de los


hechos, sujetos a una apreciacin numrica como base a la explicacin,
descripcin y comparacin de un fenmeno (Udny Yule).

Es la ciencia que trata de la coleccin, representacin y anlisis de


datos cuantitativos (Kenney y Keeping).

Contempla los mtodos cientficos para coleccionar, organizar,


presentar y analizar datos, tanto para la deduccin de conclusiones vlidas
para tomar decisiones razonables. (Spiegel)

Estadstica: Ciencia o mtodo cientfico?


No es una ciencia, sino un conjunto de mtodos

Ing. Luis Gonzlez 1

Вам также может понравиться