Вы находитесь на странице: 1из 9

1.

Un tcnico ha solicitado a usted realizar una evaluacin del rendimiento en millas por galn ( mpg) de un grupo de automviles, los cuales estn influenciados por tres elementos que son primordiales, segn el criterio del tcnico, que son desplazamiento ( displace), ca!allos de fuerza (horsepower) " peso (weight). #oda esta informacin est contenida en el fichero Cardata. Usted est suspicaz con la informacin suministrada " piensa realizar un estudio de regresin para corro!orar o rechazar lo dicho anteriormente. a. $%u tipo de regresin (directa o inversa) esperar&a para cada varia!le regresora " por qu' R: ( ( ( para el desplazamiento: es una regresin directa con respecto a mpg, ya que entre mas millas por galon tenga, mas podr desplasarce. Para horsepower: es una regresin directa con respecto a mpg, ya que entre mas fuerza tiene, mas mpg necesitara. Para la aria!le weight: es una regresin in ersa con respecta a mpg, ya que entre mas peso tenga, rendir menos en lo que respecta a la cantidad de mpg necesaria.

!. )*uste un modelo de regresin simple para cada varia!le i desplazamiento, ii ca!allos de fuerza " iii peso. +rafique los diagramas de dispersin. $,ul modelo es acepta!le en este caso'. -ustifique. Para desplazamiento
Para caballos de fueza Para peso

R"#= 56,9671 Correlation Coefficient = -0,754765 R"#= 62,212 Correlation Coefficient = -0,788746 R"#= 68,7 75 Correlation Coefficient = -0,829081

!l "odelo "as aceptable en este caso con respecto a el factor "p#, es la $ariable peso, %a &ue este tiene un coeficiente de deter"inaci'n =68,7 75( , el cual es "a%o al de los otros ) se acerca "as al 100(*+

c.

)*uste el me*or modelo de regresin lineal mltiple a estos datos (sin interaccin). )nalice el ./. 0ndique claramente cual es el modelo de regresin que Ud. propone " el valor de los respectivos parmetros. -ustifique.

R: aveces si p-value es muy poco significativo, uso Criterio del 2% Para el pri"er "odelo, "p# = 58,4764 - 0,0189706.displace - 0,118 07./orsepo0er - 0,00827656.0ei#/t 1-s&uared = 72,8525 percent 1-s&uared )ad2usted for d+f+* = 72,2947 percent

Com $lfa% &,&'


Parameter C3456746 displace /orsepo0er 0ei#/t Estimate 58,4764 0,0189706 -0,118 07 -0,00827656 Standard Error 2,17528 0,011428 0,02 62 0,001 4 86 T Statistic 26,8822 1,66 -5,00809 -6,15881 P-Value 0,0000 0,0991 0,0000 0,0000

!n los datos de las tres $ariables usadas para el pri"er "odelo, displace tiene un p-$alue, el cual es "u% alto con respecto a alfa, por ende lo eli"inar8a"os de nuestro "odelo+

9odelo sin displace, 1-s&uared = 72, 401 percent 1-s&uared )ad2usted for d+f+* = 71,96 8 percent Co"o 1-s&uared dis"inu%e relati$a"ente poco con respecto al "odelo anterior % ade":s se acerca al 100(, se conclu%e &ue displace no es necesario en nuestro "odelo, por ende el "e2or "odelo seria, "p# = 55,7694 - 0,104891./orsepo0er - 0,00661426.0ei#/t

d. $#odas las varia!les son importante para el modelo elegido por Ud.' -ustifique. R: todas las aria!les son importantes para el modelo elegido por mi, pero el primer modelo en anlisis, tenia una aria!le que no era importante, la cual era displace. e. 1 un intervalo de confianza del 234 para los parmetros estimados del modelo propuesto por Ud. 56plique que significan estos intervalos. .
95,0( confidence inter$als for coefficient esti"ates Standard Parameter Estimate Error Lower Limit C3456746 55,7694 1,44821 52,9074 /orsepo0er -0,104891 0,022 299 -0,14902 0ei#/t -0,00661426 0,0009015 8 -0,008 9591

Upper Limit 58,6 14 -0,060762 -0,0048 26

(os inter alos de confianza muestran con que precicion los coeficientes se pueden estimar dada la cantidad de datos disponi!les y el ruido que est presenta.
f. 5stime el rendimiento para un automvil con un desplazamiento de 788, 198 ca!allos de fuerza " peso de 3888. $5st Ud. de acuerdo con el valor o!tenido en el modelo'. -ustifique.

R% el rendimiento seria: ),)*+'* mpg ,o estoy de acuerdo, ya que las aria!les a calcular, no estn contenidas dentro de los alores de las aria!les que se usaron para la creacin del modelo. /. Utilice los datos de los vectores mpg " origin para evaluar el rendimiento (en millas por galn) de los autos de U:), 5U.;<) " -)<;=. Utilice anlisis de varianza para analizar la influencia de los distintos niveles. Utilice nivel de significacin del 34. .esponda las siguientes preguntas

a. $5s el rendimiento el mismo para todos los pa&ses'. -ustifique. -e acepta .iptesis nula: u&%u/%u# -e rechaza hiptesis nula: -i e0iste $lguna diferencia

743;7 6able for "p# b% ori#in Source Sum of Squares <et0een #roups 2 79,22 =it/in #roups 5947,5 6otal )Corr+* 8 26,75

Df 2 151 15

Mean Square 1189,61 9, 876

F-Ratio 0,20

P-Value 0,0000

P alor1$lfa %2 e0iste alguna diferencia, se rechaza hiptesis nula !. 5ncuentre intervalos de confianza para la diferencia de medias. 0nterprete. R: 3nter alo /4#: (4/&,/5 46,6+7 este inter alo no contiene al & por ende / y # no son iguales. 3nter alo /4): (4/&,'#5 4',8/7 este inter alo no contiene al & por ende / y ) no son iguales. 3nter alo #4): (46,&)5 #,/97 este inter alo si contiene al & por ende # y ) si son iguales. c. )nalice los rendimientos de a pares. $%u se puede concluir' . :e puede concluir que los rendimientos de los veh&culos *aponeses " los europeos son los mismos. d. :tilice el test de Cochran para pro!ar la hiptesis de homogeneidad de Comprue!e mediante diagrama de ;ca<a y !igote=. Comente. R:
Cochran's C Test 0,506 !5 P-Value 0,00 " #2$

arianzas.

Como p-valor es menor a alfa, se puede concluir %ue e&iste alguna diferencia en sus varian'as( )rafico:
>o04and4?his@er Plot

origin

/'

#'

)' mpg

6'

''

Como se puede presenciar en el grafico de ca<a y !igotes, las arianzas de los datos de <apon y de europa son distintas. e. Concluya .. 1a lo mismo elegir entre veh&culos de europa " *apon, "a que sus rendimientos son los mismos.

PREGUNTA 1: Se piensa que la potencia elctrica consumida al mes por una planta qumica ( PE) est relacionada con la temperatura ambiente promedio ( TA), el nmero de das del mes ( ND), la pureza promedio del producto (PP) y las toneladas de producto producidas ( TP). Los datos correspondientes al ao pasado son los siguientes PE !"# !'( !%# !*" '#& '&( '## !%( !(* !*( !)) !(& TA !$ '& "$ (# ($ *! )# )" *$ (# $# ') ND !" !& !" !$ !$ !( !$ !$ !" !$ !$ !' PP %& %# )) )* %& %" )* )( )) %& %# )% TP &## %$ &&# )) %" %% %* %( &&# &#$ &## %)

a) +,u tipo de correlaci-n (directa o in.ersa) esperara para cada .ariable regresora y por qu/. 01plique razonadamente SIN usar Statgraphics. 2 ( TA es inversamente proporcional a la PE, a !ue entre m"s temperatura ha , menos electrici#a# se pro#uce$ ( ND es #irectamente proporcional a la PE, a !ue entre m"s #%as se usa la electrici#a#, mas consumo #e electrici#a# ha $ ( PP es #irectamente proporcional a la PE, a !ue para pro#ucir un pro#ucto lograr !ue sea m"s puro, necesitaremos m"s PE, para su #esarrollo$ ( TP es #irectamente proporcional a la PE, a !ue si se pro#uce m"s, m"s PE se necesitara para pro#ucirlas$ b) 3roponga el me4or modelo para pronosticar la 3otencia (PE). 5usti6ique y e1plique. &o#elo:
potencia electrica ' (1)*,+1, - ),.)/,+10temperatura am1iente - 2,3*,.40numero #e #ias #el mes 1,4,+4.0pure5a prome#io #el pro#ucto - ),)1,.)3,0tonela#a #e pro#uctos pro#uci#as 1-s&uared = 74,475 percent > 1-s&uared )ad2usted for d+f+* = 59,889 percent 6omo el coe7iciente #e correlacion es sercano a 1))8, el mo#elo se acepta$ Standard Error 207,859 0, 68897 5, 0052 2, 9162 0,7 821 T Statistic -0,494149 1,6410 1,68 54 0,6010 9 0,0185458

Parameter C3456746 te"peratura a"biente nu"ero de dias del "es pureza pro"edio del producto tonelada de productos producidas

Estimate -102,71 0,605 71 8,92 64 1,4 746 0,01 609

P-Value 0,6 6 0,1448 0,1 61 0,5668 0,9857

6omo to#as las varia1les son insigni7icantes, eliminar%amos las menos signi7icativas, en pocas pala1ras, la varia1le con p(valor mas cercanos a 1, en estos casos serian las varia1les PP TP$ Nuevo mo#elo: potencia electrica ' ),/*2.3. - ),43+,..0temperatura am1iente - 1),*.+0numero #e
#ias #el mes 1-s&uared = 7 ,1 86 percent > 1-s&uared )ad2usted for d+f+* = 67,1694 percent Co"o 1-s&uared dis"inu%o "enos de un 2( al del "odelo inicial, por criterio del 2(, dire"os &ue las $ariables anterior"ente "encionadas, no son si#nificati$as+ Por ende el "e2or "odelo a ele#ir seria, potencia electrica ' ),/*2.3. - ),43+,..0temperatura am1iente - 1),*.+0numero #e #ias #el mes

c) 3rediga el consumo de potencia para un mes en el que TA7*$89, ND7!" das, PP7%#: y TP7%) toneladas. Si nuestro me9or mo#elo #e PE est" en 7unci:n solo #e TA PE' *24,*,3 d) +,u puede decir del modelo propuesto respecto del grado de a4uste/ ND, PE seria:

1, 5e podr8a decir, &ue el "odelo inicial tenia $alores de"asiado poco si#nificati$os, por ende solo era necesario traba2ar con los $alores &ue se acercaran a un $alor si#nificati$o )%a &ue todos no eran lo suficiente"ente si#nificati$os*, por eso al utilizar el "odelo propuesto al #rado de a2uste el cual dis"inu%o "enos del 2( al eli"inar estos datos, se podr8a decir &ue el nue$o "odelo es el "e2or para representar P!, en funci'n de las $ariables 67 % 4? )las cuales son las $ariables "as apro@i"adas al $alor si#nificati$o*+
e) +,u puede decir del modelo propuesto respecto del 0rror/ ;alor #e PE, seg<n mo#elo elegi#o PE mo#elo' */3,,+ PE real' *4) Error' =PEmo#elo(PEreal>' 13,,+ los valores #e la primera potencia real$

PREGUNTA *:

Se quiere estudiar, 3;2 S03<2<=;, la in6luencia del tipo de semilla ( semilla) y el tipo de abono (abono) sobre el rendimiento (rendi) de la cosec>a de cebada. 3ara ello se siembran ' parcelas con cada una de las posibles combinaciones de " tipos de semilla y ' tipos de abono. Los rendimientos, tipos de semilla y tipos de abono de las '( parcelas (en ?g.) se presentan en el arc>i.o A;AR*. @sted debe decidir la compra del tipo de semilla y del tipo de abono considerando como in6luyen 3;2 S03<2<=; los 6actores semilla y abono en el rendimiento (rendi). Usan#o an"lisis #e varian5a a un 7actor:

a) +,u tipo de abono elegira/ 5usti6ique y e1plique. Para elegir un a1ono seg<n su ren#imiento, ten#remos !ue ver si e?iste #i7erencia entre sus me#ias, en pocas pala1ras reali5ar una hip:tesis #e #i7erencia #e me#ias, sien#o u) 'me#ia ren#imiento a1ono 1, u1'ren#imiento a1ono *, u,' a1ono semilla,$ @): u)'u1'u* @1: e?iste alguna #i7erencia entre estos #atos$ Tenien#o encuenta #e !ue la signi7icancia es ),)/ =al7a'),)/>$ P(valor ' ),).1/ 6omo p(valorAal7a, se acepta @), sien#o !ue no e?iste #i7erencia entre estos$ Ahora Utili5aremos intervalos #e con7ian5a para anali5ar !uB tipo #e a1ono es me9or seg<n su ren#imiento si e?isten similitu#es entre estas, con un gra#o #e con7ian5a #e un 3/8$ Sa1ien#o !ue estas #e por si no tienen #i7erencias entre s%, solo aremos esto para tomar una #ecisi:n, sa1ien#o !ue #a lo mismo$ Ta1la #e me#ias
abono 1 2 ount 12 12 12 Mean 99, 99,6667 111,0 !omo"eneous #roups X X X

6abla de inter$alo de confianza ontrast 1A2 1A 2A Si"$ . . Difference -11,6667 -0, 11, %&- Limits 10,96 2 10,96 2 10,96 2

En la ta1la #e intervalo #e #i7erencias, veremos !ue a las #i7erencia entre a1onos, les restamos sumamos los limites, estos 7ormaran intervalos, sien#o los intervalo !ue no contienen al cero las ro9as, las !ue los contienen las negras, sien#o los !ue contienen al cero, las !ue son iguales$ Estas igual#a#es se pue#en ver en la

ta1la #e me#ias, veremos !ue en la columna #e grupos homogBneos, las e!uis !ue pertenecen a una misma columna son iguales, por en#e los a1onos 1 , son iguales seg<n intervalos #e con7ian5a$ C vien#o las me#ias #e estos valores, o1servaremos !ue el a1ono * tienen el ma or ren#imiento$ Por en#e concluiremos !ue el a1ono #e me9or ren#imientos es el *$

b) +,u tipo de semilla elegira/. 5usti6ique y e1plique. Para elegir una semilla seg<n su ren#imiento, ten#remos !ue ver si e?iste #i7erencia entre sus me#ias, en pocas pala1ras reali5ar una hip:tesis #e #i7erencia #e me#ias, sien#o u) 'me#ia ren#imiento semilla 1, u1'ren#imiento semilla *, u, ren#imiento semilla,$ @): u)'u1'u* @1: e?iste alguna #i7erencia entre estos #atos$ Tenien#o encuenta #e !ue la signi7icancia es ),)/ =al7a'),)/>$ P(valor ' ),)) 6omo p(valorDal7a, se recha5ara @), sien#o !ue e?iste #i7erencia entre estos$ Ahora Utili5aremos intervalos #e con7ian5a para anali5ar !uB tipo #e semilla es me9or seg<n su ren#imiento si e?isten similitu#es entre estas, con un gra#o #e con7ian5a #e un 3/8: Ta1la #e me#ias
Semilla 2 1 4 ount 9 9 9 9 Mean 87,5556 101,556 102,778 121,444 !omo"eneous #roups X X X X

c) <nalice la .ariabilidad de los datos para los distintos tipos de semilla. +,u puede concluir/

3ara analizar la .ariabilidad de los datos para los tipos de semillas, usaremos el test de crocan. siendo asi.
Cochran's C Test 0,"*$$#! P-Value 0,0*"*002

Aomo pB.alorCa6la, e1iste similitud en la .ariabilidad de los datos de cada grupo. 0sto se puede .er re6le4ado en un gra6ico de ca4a y bigotes.
>o04and4?his@er Plot

semilla

6 98 *8 88 /&8 rendi //8 /#8 /)8

d) 0ncuentre inter.alos de con6ianza del %$: para la di6erencia de medias de a pares para los distintos tipos de semilla. +,u puede concluir/
6abla de inter$alo de confianza ontrast 1A2 1A 1A4 2A 2A4 A4 Si"$ . . . . . Difference 14,0 -19,8889 -1,22222 - ,8889 -15,2222 18,6667 %&- Limits 6,7562 6,7562 6,7562 6,7562 6,7562 6,7562

en la ta1la #e intervalo #e #i7erencias, veremos !ue a las #i7erencia entre semillas, les restamos sumamos los limites, estos 7ormaran intervalos, sien#o los intervalo !ue no contienen al cero las ro9as, las !ue los contienen las negras, sien#o los !ue contienen al cero, las !ue son iguales$ Estas igual#a#es se pue#en ver en la ta1la #e me#ias, veremos !ue en la columna #e grupos homogBneos, las e!uis !ue pertenecen a una misma columna son iguales, por en#e las semillas 1 4 son iguales$ C vien#o las me#ias #e estos valores, o1servaremos !ue las semillas , tienen el ma or ren#imiento$ Por en#e concluiremos !ue las semillas #e me9or ren#imientos son las semillas n<meros ,$

e) Daga un anlisis de los residuos para estudiar la .alidez de los resultados de las semillas. 3ara analizar el ni.el de ruido (el ni.el de residuos), .eremos una gra6ica de residuos
Residual Plot for rendi

#&

/& residual

&

4/&

4#& / # semilla ) 6

0n el gra6ico demostrado, podremos .er que la cantidad de residuos es el mismo, pero la dispersi-n de las semillas ' es la mayor, siendo este la menos con6iable segn su .alor medio. 6) Aomente la siguiente ase.eraci-n EComo el p-valor para el anlisis de varianza del rendimiento segn tipo de semilla es 0.000, el tipo de semilla NO es significativo, o sea, da lo mismo cualquier semillaF.

5so no es as&, el hecho de que p(valor sea igual a 8, significa que e6iste si o si una diferencia , por lo que el valor es mu" significativo, por lo tanto, para elegir una semilla se de!er revisar cual de estas tiene un me*or rendimiento medio.

Вам также может понравиться