Вы находитесь на странице: 1из 29

UNIVERSIDAD NACIONAL ABIERTA

CARRERA ADMINISTRACIÓN DE EMPRESAS


CONTADURIA PÚBLICA (CÓD. 610)

ANALISIS COMPARATIVO DE

TRES (3) MODELOS DE REGRESIÓN MÚLTIPLE

Preparado por
YONIRA MARCANO
C.I. No. XXXXXXXX
Asignatura
ESTADÍSTICA APLICADA (CÓD. 746)

Enero, 2011
RESUMEN

No existen estándares únicos, perfectamente reconocidos y universalmente aceptados en los


procesos de ventas. Lo que se tiene son muchísimos modelos o metodologías. Los Gerentes de
Mercadeo desarrollan estrategias que deben fundamentar la orientación que deseamos darle a un
producto o servicio con los objetivos de rentabilidad y de asignación eficiente de los recursos. En
éste proceso debemos evaluar cuidadosamente el impacto que puede tener para nuestra Empresas
sus fortalezas, debilidades, oportunidades, amenazas y ventajas competitivas. La toma de
conciencia por parte de los directivos y responsables de la venta respecto a que "cuanto mejor sea
y resulte la formación e idoneidad de cada uno de los representantes de venta, más cerca y segura
estará la empresa de su destino posible de éxito", representa el camino que corresponderá
transitarse. En la medida que más aciertos existan en cada una de las decisiones y acciones
operativas del negocio, tanto mayor será la probabilidad de una alta rentabilidad del negocio, en
donde no surjan por generación espontánea sino sólo por la implementación eficiente de tales
decisiones estratégicas y operativas. La Empresa busca esas ventajas competitivas mediante
programas de mercadeo bien integrados que coordinen el precio, el producto, la distribución y las
comunicaciones de nuestra oferta de bienes o servicios para satisfacer las necesidades de un
mercado meta. es por ello, que se desea conocer que factores afectan el volumen de ventas, para
ello se cuenta con 60 observaciones de mercadeo para cada territorio que le está asignado a cada
representante de ventas.

Con la construcción de tres modelos propuestos se busca:


• Inferir sobre los parámetros poblacionales para cada uno de los modelos.
• Realizar un análisis de residuos para cada uno de los modelos propuestos.
• Determinar cuál de los modelos propuestos explica mejor la variable dependiente.

Para lo cual se consideraran las siguientes variables como objeto de estudio: X1: Total de ventas
acreditadas al vendedor. X2: Antigüedad del vendedor en la empresa, en meses. X3: Potencial de
mercado, ventas totales en unidades en el territorio de ventas. X4: Gastos de publicidad en el
territorio. X5: Participación en el mercado, promedio ponderado de los últimos cuatro años.
X6: Cambio de participación en el mercado en los últimos cuatro años. X7: Número de cuentas
asignadas a los vendedores. X8: Trabajo, índice ponderado basado en compras anuales y
concentración de cuentas. X9: Evaluación general del vendedor sobre ocho aspectos de su
desempeño, en una escala del 1 al 7. X10: Zona, división geográfica del país. X11: Territorio,
división estratégica de cada Zona.
INDICE

RESUMEN.................................................................................................................... 2

INTRODUCCION........................................................................................................... 5

METODOLOGIA............................................................................................................ 8

RESULTADOS............................................................................................................... 9

DISCUSIÓN................................................................................................................18

.................................................................................................................................. 26

CONCLUSIONES.........................................................................................................27

REFERENCIAS............................................................................................................ 29
INTRODUCCION

EL procedimiento de análisis de varianza, o ANOVA, utiliza una sola variable numérica medida
en los elementos de la muestra para probar la hipótesis nula de igualdad de medias poblaciones.
Esta variable puede ser de intervalo o de escala de razón.

Esta variable algunas veces recibe el nombre de variable dependiente, en especial en programas
de computadora que ejecutan ANOVA.

La hipótesis nula que se prueba en el ANOVA es que la mayoría de las poblaciones que se
estudian (al menos tres) tienen el mismo valor de la media para la variable dependiente. Las
hipótesis nula y alternativa en ANOVA son:

Ho: β1 = β2 … = βk = 0
HA: Al menos un no es cero

En la prueba ANOVA, se reúne evidencia muestral de cada población bajo estudio y se usan
estos datos para calcular un estadístico muestral. Después se consulta la distribución muestral
apropiada para determinar si el estadístico muestral contradice la suposición de que la hipótesis
nula es cierta. Si es así, se rechaza; de lo contrario no se rechaza.

Hemos de recordar que en la prueba de varianza con dos poblaciones se calcula el coeficiente de
las varianzas muestrales y se verifica con arreglo a la distribución F. Este procedimiento también
se usa en ANOVA para probar la hipótesis nula.

Se supone que todas las poblaciones bajo estudio tienen la misma varianza, sin importar si sus
medias son iguales. Es decir, ya sea que las poblaciones tengan medias iguales o distintas, la
variabilidad de los elementos alrededor de su respectiva media es la misma. Si esta suposición es
válida, entonces se puede probar la hipótesis nula de las medias poblacionales iguales usando la
distribución F.

El paso final en ANOVA requiere el cálculo de un cociente con la estimación del método entre en
el numerador y la estimación del método dentro en el denominador.. Si la hipótesis nula de que
las poblaciones tienen la misma media es cierta, esta razón consiste en dos estimaciones
separadas de la misma varianza poblacional y, se puede obtener la distribución F si las medias
poblacionales no son iguales. La estimación en el numerador estará inflada, y el resultado será un
cociente muy grande. Al consultar la distribución F no es probable que un cociente tan grande
haya sido obtenido de esta distribución, y la hipótesis nula será rechazada. La prueba de hipótesis
en ANOVA es de una cola: un estadístico F grande llevará al rechazo de la hipótesis nula y un
valor pequeño hará que no se rechace.

Para los efectos del presente informe se estudiarán 60 observaciones suministradas por la
empresa, a fin de conocer los factores que afectan el volumen de las ventas en cada territorio, se
procederá a estudiar la correlación existente entre las variables independientes, un coeficiente de
intercepción y una variable dependiente. Las variables objeto de estudio son:

1 X1: Total de ventas acreditadas al vendedor.


2 X2: Antigüedad del vendedor en la empresa, en meses.
3 X3: Potencial de mercado, ventas totales en unidades en el territorio de ventas.
4 X4: Gastos de publicidad en el territorio.
5 X5: Participación en el mercado, promedio ponderado de los últimos cuatro años.
6 X6: Cambio de participación en el mercado en los últimos cuatro años.
7 X7: Número de cuentas asignadas a los vendedores.
8 X8: Trabajo, índice ponderado basado en compras anuales y concentración de cuentas.
9 X9: Evaluación general del vendedor sobre ocho aspectos de su desempeño, en una escala
del 1 al 7.
10 X10: Zona, división geográfica del país Además para mejor desarrollo y elaboración del
informe se emplearan diversas herramientas descriptivas, tablas de distribución, tablas de
contingencia y varios gráficos que se aplicará al conjunto de datos.
11 X11: Territorio, división estratégica de cada Zona.

El estudio de las mismas permitirán lograr determinar los factores de mayor incidencia en las
ventas.

Para efectos de este estudio se requiere la elaboración de tres (3) modelos, previamente
establecidos, a saber:

Modelo 1
X1 = b2 X2 + b3 X3 + b 4 X 4 + b5 X5 + b6 X6 + b7 X7 + b8 X8 + b9 X9 + b10 X10 + b11 X11

Modelo 2
X1 = b2 X2 + b3 X3 + b 4 X 4 + b9 X9 + b10 X10 + b11X11

Modelo 3
X1 = b2 X2 + b7 X7 + b8 X8

Todo esto con la finalidad de:

• Inferir sobre los parámetros poblacionales para cada uno de los modelos.
• Realizar un análisis de residuos para cada uno de los modelos propuestos.
• Determinar cuál de los modelos propuestos explica mejor la variable dependiente.

Para el estudio de los parámetros poblacionales de los modelos se utilizará el método de


Mínimos Cuadrados Ordinarios (MCO).
METODOLOGIA

POBLACION:

Los datos del problema nos suministran claramente la muestra a ser evaluada. En este caso las 60
observaciones suministradas por la empresa

INSTRUMENTOS/MATERIALES:

Se utilizarán tablas de distribución, de contingencia y herramientas estadísticas descriptivas de


los datos para crear grupos, pruebas de hipótesis, etc., utilizando para ello el Programa
Computacional EXCEL de Microsoft Office, bajo sistema operativo Windows XP, versión 2002.

PROCEDIMIENTO:

Se cargó en el programa Excel los datos suministrados por la Universidad para efectos de este
trabajo. Se corrió el mismo y se obtuvieron los índices y coeficientes, así como la tabla ANOVA
para efectuar el análisis de Varianza, los estadísticos "t" para cada una de las variables
independientes y determinar el valor significativo de cada una de ellas, los valores del parámetro
"F" y el valor crítico de "F" el cual nos indica el mínimo de grado de confianza con el que se
aceptarán los modelos a estudiar..
RESULTADOS

De acuerdo a los coeficientes obtenidos con la herramienta Excel indicados en las tablas adjunta,
podemos determinar la ecuación de regresión para cada uno de los modelos.

Modelo 1:

Estadísticas de la regresión
Coeficiente de correlación
0,62465428
múltiple
Coeficiente de Ecuación de la Regresión
0,39019297
determinación R^2 X1 = b2 X2 + b3 X3 + b 4 X 4 + b5 X5 + b6 X6 + b7 X7 + b8 X8 + b9 X9 + b10 X10 + b11 X11
R^2 ajustado 0,26574256 Y = -345,99+ 4,82+0,01+0,08+21,79-12,64+4,09+32,61+214,49+165,90-51,88
Error típico 1186,45691
Observaciones 60

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de Valor crítico de
F
libertad cuadrados los cuadrados F
3,1353288
Regresión 10 44135397,5 4413539,75 0,00361348
5
Residuos 49 68976320,4 1407680,01
Total 59 113111718

Coeficientes Error típico Estadístico t Probabilida Inferior Superior


d 95% 95%
Intercepción -345,996633 1126,1395 -0,30724136 0,7599617 -2609,05864 1917,06538
X2 4,82908813 2,11678432 2,28133215 0,02691228 0,57525085 9,08292541
X3 0,01235371 0,01060051 1,16538886 0,24950344 -0,0089488 0,03365623
X4 0,08011024 0,07100008 1,128312 0,26468247 -0,06256975 0,22279023
X5 21,7932595 66,1048013 0,32967741 0,74304896 -111,04931 154,635829
X6 -12,642434 182,520663 -0,06926577 0,94505998 -379,431431 354,146563
X7 4,09915876 3,73550031 1,097352 0,27785103 -3,40761003 11,6059275
X8 32,6180575 46,1824503 0,70628685 0,4833547 -60,1890494 125,425164
X9 214,490886 158,870894 1,35009554 0,18318899 -104,772123 533,753895
X10 165,905196 138,377183 1,19893462 0,23631945 -112,17416 443,984552
X11 -51,8816459 32,6930531 -1,58693181 0,11896098 -117,580795 13,8175029
Observació Pronóstico Residuos
Residuos
n X1 estándares
1 3157,44949 512,430513 0,47392648
2 3921,25281 - -0,41369247
447,302805
3 2277,11888 17,9811227 0,01663002
4 3899,69598 775,864024 0,7175656
Pronóstico Residuos
5 4389,09482 1736,86518 1,60635712 Observación Residuos
X1 estándares
6 2850,58459 - -0,66187105 31 3739,00992 -910,719923 -0,84228842
715,644593 32 3520,97309 -2361,88309 -2,18441118
7 5572,31507 - -0,50003024
540,655066 33 1954,7735 -214,723502 -0,19858918
8 3706,04271 - -0,31315085 34 4659,47107 1004,47893 0,92900238
338,592708
9 4767,46685 1751,98315 1,62033913 35 2234,97922 -1008,39922 -0,93262809

10 3188,54709 1687,82291 1,56099989 36 2179,53049 -841,460494 -0,77823315

11 2415,87747 52,3925286 0,04845575 37 5167,48367 836,536332 0,77367899

12 2882,70566 - -0,32314207 38 3213,55574 145,494262 0,13456182


349,395661 39 3171,70673 -408,616725 -0,37791326
13 2302,12183 105,98817 0,09802422
40 3321,3976 565,022397 0,52256661
14 2563,77935 - -0,2093877
41 3459,98577 1617,57423 1,49602969
226,399352
15 4174,40056 412,549441 0,38155047 42 3214,40267 2019,88733 1,86811298
16 3172,3806 - -0,40984301 43 3358,69686 142,983142 0,13223939
443,140595 44 3262,39367 -1006,79367 -0,93114319
17 3200,49018 88,9098222 0,08222914
45 3072,1342 640,1558 0,59205449
18 2911,31582 - -0,10223016
110,535818 46 2232,41875 -1426,07875 -1,31892318
19 3040,69895 223,501053 0,20670718 47 3509,32187 -3087,34187 -2,85535899
20 3721,76698 - -0,24799842 48 2709,86788 -148,967876 -0,13777443
268,146985
49 3758,01616 -796,106155 -0,73628673
21 1889,84576 - -0,1372453
148,395755 50 3449,28447 -583,31447 -0,53948422
22 2606,56547 - -0,5279244 51 2130,03472 390,435277 0,36109797
570,815475
23 1876,92376 - -0,27646263 52 1937,76519 1040,05481 0,96190509
298,923758 53 2078,78381 4015,53619 3,71380878
24 3198,54466 968,895337 0,89609254
54 2844,44097 -482,430967 -0,4461811
25 3322,54258 - -0,48330648
522,572585 55 2348,74614 -1254,87614 -1,16058474
26 653,403566 1406,32643 1,30065506 56 4256,01963 -885,419628 -0,81888919
27 3914,1889 -487,7289 -0,45108095 57 3169,25616 -681,946155 -0,63070472
28 3517,48647 - -0,49299336 58 3065,04787 222,722127 0,20598679
533,046473
59 3390,89549 -592,205493 -0,54770717
29 2811,35912 - -0,73411605
793,759119 60 3742,63455 726,25545 0,67168461
30 3580,8362 377,693803 0,34931389
Modelo 2:

Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,60215002
Coeficiente de Ecuación de la Regresión
determinación R^2 0,36258465 X1 = b2 X2 + b3 X3 + b 4 X 4 + b9 X9 + b10 X10 + b11X11
R^2 ajustado 0,29042442 Y = 558,03+5,42+0,01+0,10+206,51+208,35-64,07
Error típico 1166,34525
Observaciones 60

Análisis de Varianza
Grados de Suma de Promedio de Valor crítico de
F
libertad cuadrados los cuadrados F
5,0247159
Regresión 6 41012572,5 6835428,75 0,0003841
3
Residuos 53 72099145,3 1360361,23
Total 59 113111718

Coeficientes Error Estadístico Probabilidad Inferior Superior


típico t 95% 95%
Intercepción 558,031765 799,167198 0,6982666 0,48806302 -1044,8946 2160,95813
X2 5,4255281 1,90075154 2,85441204 0,00614023 1,61310339 9,23795281
X3 0,01616705 0,01002822 1,61215605 0,11286767 -0,003947 0,0362811
X4 0,10452256 0,06556776 1,59411515 0,11685706 -0,02698971 0,23603483
X9 206,51111 142,056668 1,45372346 0,15191921 -78,418476 491,440697
X10 208,350436 131,263475 1,58726894 0,11840047 -54,9307465 471,631618
X11 -64,0702604 30,1505094 -2,1250142 0,0382656 -124,544522 -3,59599839
Observació Pronóstico Residuos 114,335161
Residuos
n X2 estándares
29 -
1 3624,48719 45,3928123 0,04106275 2888,8349 -0,78812701
871,234898
2 -
4069,15071 -0,53842397 30 3508,28647 450,243525 0,40729439
595,200709
3 2170,26232 124,83768 0,1129293
4 3837,02623 838,533774 0,75854527
5 4290,4835 1835,4765 1,66038872
6 -
2958,45335 -0,74495766
823,513352
7 -
5201,23574 -0,15339976
169,575742
8 -
3727,25675 -0,32548446 Pronóstico Residuos
359,806754 Observación Residuos
9 X2 estándares
4574,81163 1944,63837 1,75913754
31 3753,35423 -925,064233 -0,83682151
10 3078,87959 1797,49041 1,62602616
32 3729,01999 -2569,92999 -2,32478203
11 2427,75497 40,5150289 0,03665026
33 2099,03474 -358,98474 -0,32474086
12 -
2882,03929 -0,31546368 34 4637,93499 1026,01501 0,9281425
348,729288
13 35 2149,19851 -922,618511 -0,83460909
2153,46827 254,641732 0,23035123
14 - 36 2004,03186 -665,961856 -0,60243515
2508,94853 -0,15520245 37
171,568533 4797,59538 1206,42462 1,09134268
15 4383,05636 203,893637 0,18444404 38 3716,47097 -357,420971 -0,32332626
16 - 39 3254,78433 -491,694327 -0,44479116
3491,6239 -0,6896594
762,383898 40 3472,4875 413,932504 0,37444711
17 - 41
3584,2996 -0,26676886 3608,44625 1469,11375 1,32897365
294,899602 42 2981,07327 2253,21673 2,03828034
18 -
3204,60185 -0,36530092 43 3054,20193 447,47807 0,40479273
403,821852
44 3382,4765 -1126,8765 -1,01938273
19 3024,39552 239,80448 0,21692931
45 3056,48328 655,80672 0,59324872
20 -
3801,16543 -0,31439275 46
347,545427 2069,08889 -1262,74889 -1,14229412
21 - 47 3373,9536 -2951,9736 -2,67038215
1808,56166 -0,06070982
67,1116595 48 2451,56189 109,338113 0,09890825
22 - 49
2428,56338 -0,35534255 3732,9759 -771,065904 -0,69751323
392,813375 50 3347,37403 -481,404031 -0,43548246
23 -
1792,95557 -0,19445076 51 2280,02227 240,447733 0,21751121
214,955571
52 2534,21119 443,608813 0,40129257
24 2777,61606 1389,82394 1,25724737
53 1873,4005 4220,9195 3,81828215
25 -
3195,82912 -0,35809775 54 2418,70585 -56,6958536 -0,05128758
395,859116
26 1227,1871 832,542898 0,75312587 55 2509,20049 -1415,33049 -1,28032083
27 - 56 4375,08306 -1004,48306 -0,90866451
3877,06948 -0,40762544
450,609484 57 3093,30645 -605,996454 -0,5481899
28 3098,77516 - -0,10342863 58 3111,43555 176,334448 0,15951374
59 3331,25843 -532,568434 -0,48176625
60 3844,57853 624,311473 0,56475783
Modelo 3:

Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,5221449
Coeficiente de Ecuación de la Regresión
determinación R^2 0,2726353
X1 = b2 X2 + b7 X7 + b8 X8
R^2 ajustado 0,23366933
Ŷ = 658,30+4,78+8,47+54,02
Error típico 1212,09287
Observaciones 60

Análisis de Varianza
Valor
Grados de Suma de Promedio de los
F crítico de
libertad cuadrados cuadrados
F
Regresi 6,996754 0,0004440
3 30838246,7 10279415,6
ón 41 3
Residuo
56 82273471,2 1469169,13
s
Total 59 113111718

Coeficien Error Estadísti Probabili Inferior Superior


tes típico co t dad 95% 95%
Intercepció 837,23271 0,7862785 0,4350189 -
n 658,298 2 8 6 1018,8805 2335,4768
2,0142130 2,3755904 0,0209682 0,7499916 8,8198989
X2 4,785 8 1 3 5 2
3,4669919 2,4430234 0,0177438 1,5247231
X7 8,470 7 1 1 1 15,415162
-
40,460618 1,3350884 0,1872495 27,033853 135,07086
X8 54,019 5 5 8 3 2
Observació Pronóstico Residuos 851,281129
Residuos
n X3 estándares
29 -
1 2311,56768 1358,31232 1,15025925 3010,35952 -0,84069827
992,759516
2 3163,43805 310,511948 0,26295075 30 3480,45705 478,072954 0,40484639
3 -
2480,5739 -0,15706481
185,473902
4 3925,66241 749,897589 0,63503557
5 3913,6573 2212,3027 1,87344369
6 -
2465,58328 -0,27999856
330,643277
7 -
5589,69475 -0,47256041
558,034746
8 -
3859,56761 -0,41673982 Pronóstico Residuos
492,117607 Observación Residuos
9 X3 estándares
3931,56674 2587,88326 2,19149648
31 3295,32004 -467,030045 -0,39549493
10 3332,79803 1543,57197 1,30714263
32 2674,01334 -1514,92334 -1,28288212
11 -
2800,7827 -0,28158164 33 2162,20486 -422,154864 -0,35749329
332,512704
12 - 34 3532,37254 2131,57746 1,80508316
2760,03908 -0,19200093 35
226,729084 2381,10484 -1154,52484 -0,97768596
13 - 36 3065,06557 -1726,99557 -1,46247119
2527,15112 -0,10080756
119,041117 37 4817,24129 1186,77871 1,00499949
14 - 38
2522,0102 -0,15635034 3080,09321 278,956788 0,2362289
184,630196 39 2701,13094 61,9590599 0,05246877
15 2911,10575 1675,84425 1,41915473 40 3238,55325 647,866752 0,54863283
16 -
2990,90067 -0,22158203 41 3835,55058 1242,00942 1,0517705
261,660667
42 3609,66296 1624,62704 1,37578247
17 2793,30516 496,09484 0,42010786
43 3663,3466 -161,666603 -0,13690409
18 2392,84138 407,938623 0,34545455
44 3436,72881 -1181,12881 -1,00021499
19 3010,04213 254,157871 0,21522844
45 3580,63898 131,651021 0,111486
20 -
3589,88899 -0,11539663 46
136,268989 2792,80313 -1986,46313 -1,68219603
21 - 47 4078,12835 -3656,14835 -3,09613511
2483,13579 -0,62808157
741,685787 48 3222,74671 -661,846715 -0,56047147
22 - 49
2762,12782 -0,61511833 3932,8843 -970,974296 -0,8222499
726,377815 50 2761,71519 104,254806 0,08828607
23 -
2503,70987 -0,78391864 51 2583,61649 -63,1464885 -0,05347432
925,709871
52 1802,8491 1174,9709 0,99500029
24 3433,33365 734,106354 0,62166308
53 2665,41365 3428,90635 2,90369983
25 -
2858,36007 -0,04944645 54 3696,57815 -1334,56815 -1,13015199
58,3900739
26 1230,9575 828,772504 0,70182919 55 2399,7363 -1305,8663 -1,1058464
27 - 56 4222,19634 -851,596337 -0,72115709
3640,77266 -0,18148633
214,312659 57 3388,40262 -901,092618 -0,76307202
28 3835,72113 - -0,72089017 58 3190,43265 97,3373487 0,08242816
59 3273,86941 -475,179411 -0,40239605
60 4044,31783 424,572173 0,35954034
DISCUSIÓN

El análisis de varianza, como técnica de lo que trata es: si se está estudiando la característica
cuyos valores dependen de varias clases de efectos que operan simultáneamente, poder decidir si
tales efectos son debido al azar o si realmente son diferentes. Para la aplicación de ANOVA son
esenciales tres (3) suposiciones:

1. Todas las poblaciones involucradas son normales.


2. Todas las poblaciones tienen la misma varianza.
3. Las muestras se seleccionan independientemente.

El análisis de varianza o ANOVA, es un procedimiento que prueba si algunas de las variables


independientes tienen relación con la variable dependiente, si alguna variable independiente no
está relacionada con la variable Y, su coeficiente debería ser cero. Es decir, Si X1 no está
relacionada con Y, entonces βi = 0. Al mismo tiempo prueba la hipótesis nula de que todos los
valores β son cero contra la alternativa de que por los menos un β no es cero. Si no se rechaza la
hipótesis nula, entonces no hay relación lineal entre Y i cualquiera de las variables
independientes. Por otra parte, si la hipótesis nula se rechaza, entonces por los menos una
variable independiente está relacionada linealmente con Y.

Continuado con el ANOVA, estructuramos la hipótesis y la evaluamos

HO: β2 = β3 = β4 = β5 = β6 = β7 = β8 = β9 = β10 = β11 =0


HA : Al menos un β no es cero

Siguiendo la metodología implementada, procedemos a describir los hallazgos encontrados según


los modelos en estudio:
Modelo 1

Los coeficientes que acompañan a cada variable independiente en la Ecuación de Regresión


obtenida nos indican el grado de relación que éstas tienen con respecto a la variable dependiente,
para este primer modelo:

Y = b2 X2 + b3 X3 + b 4 X 4 + b5 X5 + b6 X6 + b7 X7 + b8 X8 + b9 X9 + b10 X10 + b11 X11

El resultado obtenido es:

Y = -345,99+ 4,82+0,01+0,08+21,79-12,64+4,09+32,61+214,49+165,90-51,88

Estos resultados muestran que si varia la Antigüedad del vendedor en la empresa en una unidad,
manteniéndose fijos los valores de las otras variables, la variable dependiente Total de Ventas
acreditadas al vendedor variará en 4,83; igual criterio se aplicaría a las demás variables.

El error típico o error estándar de estimación mide los grados de dispersión de los valores Yi
alrededor del plano de regresión, entre menos dispersión se presente, más pequeño será el Se
(error estándar), y más preciso será el modelo en su predicción y pronostico, los resultados
obtenidos para el Modelo 1 muestran un resultado de 1186,456914.

El coeficiente de determinación múltiple mide la fuerza de la relación entre Y y las variables


independientes, entre mayor sea R2 mayor poder explicativo tendrá el modelo, para el Modelo 1
este coeficiente según los resultados es de 0.62465428; la relación es de 62.47%.

El coeficiente de determinación ajustado o corregido procura contrarrestar la incorporación de


alguna variable absurda sin un poder realmente explicativo al modelo, es una corrección de
honestidad, R2 nos castigará si introducimos variables innecesarias en nuestro modelo, los
resultados de Modelo 1 en estudio nos muestran un coeficiente de determinación ajustado de
0,265742559.
Para el Modelo 1, el valor de F es de 3,13532885 y los grados de libertad son 10 y 49, probamos
nuestra hipótesis con un nivel de significancia del 5%, con la ayuda de la tabla G se determina
que F0.05,10,49 es 1,92. La regla de decisión es “no rechazar si F < 1.92; rechazar si F>1,92, debido
a que el valor de F = 3,13532885 > 1.92, la hipótesis se rechaza, existe por los menos con un α =
0,05 una relación lineal entre Y y por lo menos una de las variables independientes.

A un nivel de significancia del 5%, con grados de libertad g.l. = n-k-1 = 60-10-1 = 49, el valor
t0.05,49 es de 2.0116 (con la ayuda de la Tabla F, hallamos el valor para 40 y 60 g.l, e
interpolamos); la regla de decisión es “no rechazar si t ± 2.0116; de lo contrario rechazar”.

X2 como 2,28133215 > 2.011 Se rechaza la hipótesis nula


6
X3 como 1,16538886 Está entre ± 2.011 No se rechaza la hipótesis nula
6
X4 como 1,128312 Está entre ± 2.011 No se rechaza la hipótesis nula
6
X5 como 0,32967741 Está entre ± 2.011 No se rechaza la hipótesis nula
6
X6 como - Está entre ± 2.011 No se rechaza la hipótesis nula
0,06926577 6
X7 como 1,097352 Está entre ± 2.011 No se rechaza la hipótesis nula
6
X8 como 0,70628685 Está entre ± 2.011 No se rechaza la hipótesis nula
6
X9 como 1,35009554 Está entre ± 2.011 No se rechaza la hipótesis nula
6
X10 como 1,19893462 Está entre ± 2.011 No se rechaza la hipótesis nula
6
X11 como - Está entre ± 2.011 No se rechaza la hipótesis nula
1,58693181 6

Se extrae que con un nivel del 95% de confianza que la variable 2, contribuyen
significativamente a la explicación del modelo, debido a que este caso la hipótesis se rechaza; por
otra parte, podemos estar seguros en un 95% que las demás variables contribuyen
significativamente con la explicación del modelo, pues en estos casos la hipótesis no es
rechazada.
La gráfica para este modelo:

Modelo 2

Los coeficientes que acompañan a cada variable independiente en la Ecuación de Regresión


obtenida nos indican el grado de relación que éstas tienen con respecto a la variable dependiente,
para este primer modelo:

X1 = b2 X2 + b3 X3 + b 4 X 4 + b9 X9 + b10 X10 + b11X11

El resultado obtenido es:

Y = 558,03+5,42+0,01+0,10+206,51+208,35-64,07

El grado de relación que existe entre las variables, podemos decir que si aumentamos en una
unidad la variable Antigüedad del vendedor en la empresa (X2), dejando fijos el valor de las otras
variables independientes, la variable dependiente X1 variará 5.4255281; el mismo razonamiento
se puede aplicar a las otras variables independientes, de acuerdo a los resultados mostrados en la
Tabla.

Al evaluar el Modelo 2 propuesto, con la finalidad de determinar su grado de significancia y su


aporte explicativo. Cuando detallamos los resultados arrojados por el Modelo 1, definimos cada
una de las herramientas estadísticas de la cuales nos valemos para evaluar un modelo o ecuación
de regresión múltiple. Sería redundante volver a explicar lo mismo, motivo por el cual nos
limitaremos a describir cada uno de los resultados arrojados y sus correspondientes estimaciones
más importantes.

El error típico o error estándar de estimación muestra un resultado de 1166,34525, una leve
diferencia con el Modelo 1, mostrando éste ultimo una menor dispersión, esto no puede ser
concluyente pues esto tan solo muestra el grado de dispersión que tienen o presentan los datos.

El coeficiente de determinación múltiple es de 0,60215002; podemos inferir que las variables


independientes están relacionadas en un 60.02% con la variable Y, al ser el resultado positivo, la
relación es directa, los valores de la variable dependiente aumentarán o disminuirán de acuerdo a
los aumentos o disminuciones de las variables independientes.

El coeficiente de determinación corregido es de 0.29042442; lo cual indica que las variaciones de


la variable dependiente X1 pueden ser explicadas en un 29,04% por el comportamiento de las
variables independientes.

El Modelo 2, muestra un valor de F de 5.0271593 y grado de libertad de 6 y 53, vamos utilizar un


nivel de significancia del 5%, con la ayuda de la Tabla G buscamos el valor t 0.05,6,53 el cual es
2,25; la regla de decisión es “no rechazar si F > 2,25; rechazar si F > 2,25”; Como F = 5.0271593
> 2,25; la hipótesis se rechaza, podemos decir con un α = 0,05 que existe por lo menos una
relación lineal de Y por los menos con una de las variables independientes.
Al aplicar nivel de significancia del 5%, con grados de libertad g.l. = n-k-1 = 100-3-1 = 96, con la
ayuda de las tablas buscamos el valor de t0.05, 96 el cual es 2,0074; la regla de decisión es “no
rechazar si t ± 2,0074 (con la ayuda de la Tabla F, hallamos el valor para 60 y 120 g.l, e
interpolamos); de lo contrario rechazar”.

X2 como 2,8544120 > 2.007 Se rechaza la hipótesis nula


4 4
X3 como 1,6121560 Está entre ± 2.007 No se rechaza la hipótesis nula
5 4
X4 como 1,5941151 Está entre ± 2.007 No se rechaza la hipótesis nula
5 4
X9 como 1,4537234 Está entre ± 2.007 No se rechaza la hipótesis nula
6 4
X10 como 1,5872689 Está entre ± 2.007 No se rechaza la hipótesis nula
4 4
X11 como -2,1250142 Está entre ± 2.007 No se rechaza la hipótesis nula
4

Con un grado de confianza del 95% que sólo la variable X2, contribuye significativamente en la
explicación del modelo, al ser rechazada, mientras que las variables independientes de este
modelo (X3, X4, X9, X10 Y X11), no contribuyen significativamente a la explicación del modelo
al ser aceptada su hipótesis. Las gráficas de los residuales para este modelo:
Modelo 3

X1 = b2 X2 + b7 X7 + b8 X8

Los resultados obtenidos de la regresión de esta ecuación o modelo de regresión múltiple,


presentan los siguientes coeficientes:

Ŷ = 658,30+4,78+8,47+54,02

La ecuación de regresión múltiple muestra la relación que existe entre las variables
independientes y la variable dependiente, de cómo el comportamiento o variación de las primeras
afectan a la segunda, los resultados nos dicen que si la variable Antigüedad del vendedor en la
empresa (X2) aumenta en una unidad, manteniendo fijo el valor de las otras variables
independientes, la variable dependiente Evaluación del Vendedor (X9) modificará su valor en
4.78494529.
El error típico o error estándar de estimación es de 1212.09287; si verificamos los resultados
podemos afirmar que la dispersión de datos más alta la posee el Modelo 3, esto no debe tomarse
como concluyente por cuanto debemos seguir evaluando la ecuación.

El coeficiente de determinación es de 0,2726353; se puede decir que un 27,27% el grado de


relación que existe entre las variables independientes con la variable dependiente Ŷ.

El coeficiente de determinación ajustado o corregido es de 0,23366933; el grado de relación de


las variables independientes X2, X7 y X8 según este coeficiente es de 23,37%, prevé la posible
inclusión por accidente, error u omisión de una variable absurda.

En el Modelo 3, el valor de F es 6.99675441; con grados de libertad de 3 y 56, probamos la


hipótesis con un grado de significancia del 5%, con la ayuda de la Tabla G hallamos del valor
para F0,05;3;56 y nos da 2,61; la regla de decisión es “no rechazar si F > 2,61; rechazar si F > 2,61;
Como F = 6.99675441 > 2,61 la hipótesis se rechaza, podemos inferir con un grado de seguridad
del 95% que existe por lo menos una relación entre el comportamiento de la variable dependiente
X1 y alguna de la variables independientes.

Con un grado de significancia del 5%, con grados de liberta g.l. = n-k-1 = 60-3-1 = 56, con la
ayuda de la Tabla T, para la distribución t buscamos el valor para t 0,05;56 el cual es 2.0042;
construimos la regla de decisión “no rechazar si t ± 2.0042; de lo contrario rechazar la hipótesis”

X2 como 2,3755904 > 2.007 Se rechaza la hipotesis


1 4
X7 8,470 2,4430234 > 2.007 Se rechaza la hipotesis
1 4
X8 54,01 1,3350884 < 2.007 No se rechaza la hipotesis
9 5 4

Podemos inferir, por los resultados obtenidos, con un 95% de seguridad que las variables X2 y
X7, contribuyen significativamente a la explicación del modelo, pues para estas variables la
hipótesis nula se rechaza, mientras que la variable independiente X8 no contribuyen con la
explicación del modelo, pues las hipótesis no fueron rechazadas.

Las graficas de los residuales del tercer modelo en estudio son:


CONCLUSIONES

• De menor a mayor los modelos objeto de estudio de acuerdo al grado de dispersión de los datos,
el cual es medido a través del error típico o error estándar de estimación:
Modelo 1 1186,4
6
Modelo 2 1166.3
5
Modelo 3 1212.0
9

Se evidencia que el Modelo 2 es el presenta menor grado de dispersión de los datos

• La relación que existe entre las variables independientes y la variable dependiente, medidas a
través del coeficiente de determinación múltiple, mostramos los hallazgos realizados, según el
modelo:
0.39019297 ó
Modelo 1
39.02%
Modelo 2 0.36258465 ó 36.26%
Modelo 3 0.2726353 ó 27.26%

Se muestra que el Modelo 1 es el que presenta mayor grado de relación entre las variables
independientes y la variable dependiente.

• El coeficiente de determinación corregido o ajustado, que prevé la posible la introducción de una


variable absurda, se presenta en el siguiente orden según el modelo:
Modelo 1 0.26574257 ó 26.57%
0.29042442 ó
Modelo 2
29.04%
Modelo 3 0.23366933 ó 23.37%
Se demuestra que el Modelo 2 es el más propenso a la introducción de una variable
absurda

El análisis de varianza o ANOVA demostró que de los Modelos 1, 2 y 3, por lo menos una de sus
variables independientes tienen relación con la variable dependiente, el mayor valor F lo tiene el
Modelo 3 con 6.99675441; seguido del Modelo 2 con 5.02471593; y por último el Modelo 1 con
3.13532885.

Se concluye que el Modelo 1 explica con mayor fuerza la relación entre las variables
independientes y la variable dependiente, ya que presenta una mayor significancia en predecir el
comportamiento de la variable dependiente.
REFERENCIAS

Webster A. (2003) Estadística aplicada a los negocios y a la economía. 3ª Edición, Colombia:


Irwin Editorial McGraw Hill

Prof. Gilberto Noguera (2007) Elementos de Excel para la Estadística – Guía de Excel
Venezuela: Universidad Nacional Abierta