Вы находитесь на странице: 1из 7

1.

Aplicación de la regresión lineal en un problema de pobreza


Algunos profesionales, sin importar su especialidad, confían en su intuición para juzgar
como se relacionan dos variables. Debido a ello, hacen pronósticos a tientas e incluso temerarios;
sin embargo, si dichos profesionales tienen la posibilidad de tomar datos y utilizar un
procedimiento estadístico de análisis para determinar cómo lo conocido se relaciona con el
evento futuro, podrían ayudar considerablemente en el mejoramiento de los procesos que
administran o en la solución eficaz de los problemas que se les presentan.
El procedimiento estadístico que se utiliza para este fin se conoce como análisis de
regresión que permite establecer la relación funcional o ecuación matemática que relaciona las
variables, así como la fuerza de esa relación.
Este análisis se aplicará a una situación particular en el campo de la economía.
En este artículo se describirá el análisis de regresión donde intervienen una variable
dependiente y una independiente, y en la cual la relación entre ellas se aproxima por medio de
una línea recta. A esto se le llama regresión lineal simple.
Una aplicación del modelo de regresión lineal Con el fin de estudiar este modelo, se
emplearán los datos tomados de una muestra real, extraídos de un comunicado de prensa que
revela el porcentaje de pobreza, pobreza extrema y el coeficiente de Gini (indicador de la
desigualdad económica en una población) en los años 2010 y 2011 de las trece principales
ciudades de Colombia.

1
Para decidir qué clase de función podría ajustarse a la curva, de acuerdo con las
posibilidades de la figura 1, debe hacerse una gráfica de dispersión de los datos observados. Si en
dicha gráfica se aprecia que los puntos se distribuyen alrededor de una recta, se procede a realizar
un análisis de regresión lineal.

La gráfica de dispersión nos sugiere que existe una relación lineal entre la variable
independiente porcentaje de pobreza en 2010 y la variable dependiente porcentaje de pobreza en
2011.
El modelo de regresión lineal simple es:
𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜖
Los valores de los parámetros 𝛽0 𝑦 𝛽1no se conocen y deben estimarse a partir de los
datos de la muestra . Estos coeficientes que se calculan de la muestra son conocidos como
regresores . La ecuación estimada de regresión es
𝑦̂ = 𝛽0 + 𝛽1 𝑥
Para calcular los regresores se emplea el método de los mínimos cuadrados, este método
emplea los datos de la muestra para determinar las características de la recta que hacen mínima la
suma de los cuadrados de las desviaciones:

𝑚í𝑛 ∑(𝑦𝑖 − 𝑦̂𝑖 )2


2
Siendo
𝑦𝑖 valor observado de la variable dependiente para la i-ésima observación.
𝑦̂𝑖 valor estimado de la variable dependiente para la i-ésima observación.
Ecuaciones normales

∑ 𝑦𝑖 = 𝑛𝑏0 + 𝑏1 ∑ 𝑥𝑖

∑ 𝑦𝑖 𝑥𝑖 = 𝑏0 ∑ 𝑥𝑖 + 𝑏1 ∑ 𝑥𝑖 2

Donde n es el número de observaciones.


Al resolver algebraicamente el sistema de ecuaciones anterior se obtienen las soluciones
para 𝛽0 𝑦 𝛽1 .
Con el fin de evitar desarrollos algebraicos y aritméticos engorrosos se utilizará la hoja de
cálculo EXCEL®. Al ingresar los datos de la tabla 1 y empleando la herramienta ANÁLISIS DE
DATOS en la opción REGRESIÓN, se obtiene la siguiente información:

En esta tabla los valores de intercepción y variable X1 hacen referencia a los coeficientes
𝛽0 𝑦 𝛽1 respectivamente. Remplazando estos datos en la ecuación 2, se tiene que la ecuación de
regresión para las variables pobreza en 2010 y pobreza en 2011 es:
𝑦̂ = −1,3148 + 0,94126𝑥
El coeficiente b1 también corresponde a la pendiente de la recta. En general, este
coeficiente expresa la razón de cambio entre la variable dependiente con respecto a un cambio
unitario en la variable independiente x.
En el ejemplo, la pendiente de la recta es positiva, lo que implica que en las ciudades
donde se observó mayor pobreza en 2010, también se observó mayor pobreza en 2011. Pero
como la pendiente es un número entre cero y uno, significa que el incremento en el porcentaje de
pobreza en 2011 entre una ciudad y otra es menor que en el 2010.

3
La tabla 3 muestra el valor de SSE, SSR Y SST en la columna que indica la suma de
cuadrados, de alli se obtiene el coeficiente r2 que aparece (0,969175). Esto revela que la ecuación
de regresión explica en un 96,92% los valores observados de la pobreza en 2011 según los
valores de pobreza en 2010.
(a) Tomando como variable dependiente en este estudio porcentaje de pobreza en 2011 y
la variable independiente porcentaje de pobreza 2010. Se utiliza este método debido a es una
técnica estadística utilizada para estudiar la relación entre variables, resaltando que en la
investigación social, el análisis de regresión se utiliza para predecir un amplio rango de
fenómenos, desde medidas económicas hasta diferentes aspectos del comportamiento humano. En
este caso al realizar el grafico de dispersión nos sugiere que existe una relación lineal entre la
variable independiente porcentaje de pobreza en 2010 y la variable dependiente porcentaje de
pobreza en 2011.
(b) Debido a su simplicidad y gran utilidad, en este estudio fue utilizado el programa
EXCEL, utilizando la herramienta ANALISIS DE DATOS,

2.

4
Supongamos el siguiente ejemplo. La resistencia a la rotura de un componente eléctrico
constituye una característica importante de un cierto proceso. Un fabricante utiliza un material
nuevo de fabricación frente al material clásico. Se recoge una muestra de 10 elementos usando el
primer componente y otra de 10 elementos usando el segundo componente.
Se pueden considerar a los dos procesos como dos tratamientos o dos niveles diferentes de
un factor dado.
Componente Nuevo Componente
antiguo
16.85 17.50
16.40 17.63
13.21 18.25
16.35 18.00
16.52 17.86
17.04 17.75
16.96 18.22
17.15 17.90
16.59 17.96
16.57 18.15
Se tiene que la media muestral del componente nuevo es ȳ1 = 16,76 y la del componente antiguo
es ȳ2 = 17,92.
Se pretende averiguar si existen diferencias significativas entre ambos tratamientos a nivel
de resistencia.
En este caso, se considera que los datos proceden de una m.a.s de una distribución normal,
y que el diseño es completamente aleatorizado.

5
El contraste de hipótesis que se tiene que realizar es bilateral:

H0 ≡ µ1 = µ2
H1 ≡ µ1 ≠ µ2
Fijamos α = P {error tipo I} = P{Rechazar H0|H0 siendo cierta}
Suponiendo normalidad y suponiendo que 𝜎12 = 𝜎22 , se utiliza el estadístico
siguiente:
𝑦1 − ̅̅̅
̅̅̅ 𝑦2
𝑡0 =
1 1
𝑆𝑝 √𝑛 + 𝑛
1 2

donde ȳ1 e ȳ2 son las medias muestrales, n1 y n2 son el tamaño de cada muestra y
(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22
𝑆𝑝 2 =
𝑛1 + 𝑛2 − 2
Se compara el valor de este estadístico con el valor de una distribución t de
Student 𝑡𝛼;𝑛1 +𝑛2−2
2

Si |t0|>𝑡𝛼;𝑛1 +𝑛2 −2entonces se rechaza H0.


2

Así, si H0 es verdadera, t0 se distribuye como una t de Student y es de esperar


que un 100(1 − α) % de los valores de t0 estén entre ( −𝑡𝛼;𝑛1 +𝑛2 −2; 𝑡𝛼;𝑛1 +𝑛2 −2 ) Una
2 2

muestra concreta que produzca un valor fuera de este intervalo es rara si H0 fuese cierta,
lo que lleva a rechazar la hipótesis H0.
En el ejemplo:

Componente nuevo Componente antiguo


𝑦1 16,76
̅̅̅= 𝑦2 17,92
̅̅̅=
𝑠12 = 0,10 𝑠22 = 0,061
𝑠1 = 0,316 𝑠2 = 0,247
𝑛1 = 10 𝑛2 = 10

2 (𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22


𝑆𝑝 = = 0,081
𝑛1 + 𝑛2 − 2

6
𝑆𝑝 = 0,204
𝐴𝑠í,
𝑦1 − ̅̅̅
̅̅̅ 𝑦2
𝑡0 = = −9,13
1 1
𝑆𝑝 √𝑛 + 𝑛
1 2

Por otro lado, 𝑡𝛼;𝑛1 +𝑛2−2 = t0,025;18 = 2,10, y como |t0| = 9,13 > t0,025;18 =
2

2,10, entonces no se acepta H0, esto es, existen diferencias significativas entre las dos
medias al nivel de confianza del 95 %.
(a) Variable: resistencia a la rotura de un componente eléctrico
Muestras independientes porque los valores de una muestra no revelan
información sobre los valores de la otra muestra.
(b) la distribución t (de Student) es utilizada debido a que las muestras tiene el
tamaño suficientemente pequeño para ser aplicado y son aproximadamente normal. En
este caso estamos estimando la media de una población normalmente distribuida cuando
el tamaño de la muestra es pequeña.

BIBLIOGRAFÍA
Cardona, González, Rivera, Hernán (2013) Aplicación de la regresión lineal en
un problema de pobreza
http://www.unilibre.edu.co/revistainteraccion/volumen12/art4.pdf
Walpole (2007) Probabilidad y estadística para ingenieros, p. 380