Вы находитесь на странице: 1из 6

J. The effect of the temperature of the deodorizing process on the color of the finished product was determined experimentally.

The data collected were as follows: 1. Fit the model Y=b0+b1X+e 2. Is this model sensible? (use a=0.05) 3. Obtain a 95% confidence interval for the true mean value of Y at any given value of X, SAY, X0

K. The data below (provided by tom B. Whitaker) show 34 pairs of values of X= average level of aflatoxin in a mini-lot sample of 120 pounds of peanuts, pbb. Y= percentage of noncontaminated peanuts in the batch-99 1. Plot the data (Y as ordinate, X as abscissa) and, by eyee only, draw what appears to you to be a well-fitting straight line through the points. Keep this figure; you will need it for comparison purposes later. Whould you say your line is a good fit? 2. Also, evaluate blablabla, all summations being from i=1 through 34. 3. Fit the model blablabal by least squares. Draw the fitted line on your plot and check how good your eye-fit was. 4. Evaluate the residuals to three decimal places. Check that blablabla, within rounding error. Examine plots of the residuals. Give conclusions. 5. Obtain the analysis of variance table in the form given in table 1.4 6. Find the standart errors of b0 and b1 7. Find the formula for the standard error of Ytopi, and construct 95% confidence bands for the true mean value of Y. (Plot about half a dozen poins over the X-range and join them up smoothly.) 8. Test the overall regression via an F-test, and find how much of the variation about the mean Ybar is explained by the fitted line.

W. In the chicago maroon for Friday, November 10, 1972. The party mart advertised per bottle prices for vintage port as given in the companying table. 1. Plot the data and examine them. Would it be sensible to fit a regression of the response price on the predictor year? what disadvantages can you see? 2. What transformation of the predictor year would be sensible? (Hint: Pretend it is 1972, and think, for example, how you describe your own year, typically.) Plot price versus your new predictor, and examine the plot. What type of transformation on price would seem sensible here to make the data look more straight-line-ish? 3. Plot the data Y= in(price) versus Z= age of bottle. Fit a straight line through the data by least squares, evaluate the residuals, and produce the analysis of variance table.

4. What do you conclude about the price of vintage port as exhibited by this set of data and your analysis? To the nearest cent, at what per-year rate would you expect the price of the bottle of vintage port to rise if a similar price pattern continued into the future ? 5. A subsequent advertisement three years later on Tuesday, November 25, 1975, offered 1937vintage port at $20.00 per bottle. If it can be assumed that a straight line relationship is preserved, and applies also to this new data point, how much per bottle per year does it appear price have risen in the intervening three years? Are your answer here and in (4) consistent, or does it appear that per year price rises have accelerated?

X. (Source: Graphs in statitical analysis, by F.J. Anscombe. The American Statistician, 27, 1973, 1721.) Fit a straight line model blblabla to each of the four sets of data below and show that for each set, blablabla,. Regression blablabalaa. Residuals blablabla. Plot all four sets of data andexplain how the sets of data differ and what their main characteristics are. (Note that data sets 1-3 all have the same X values but different Ys.)

DD. A synthetic fiber, which because of its hairlike appearance has been found suitable in the manufacture of wigs, must necessarily be preshrunk prior to manufacture. This is accomplished in two steps: Step 1. The fiber is soaked in a dilute solution of chemical A, which is necessary to preserve the luster of the fiber during step 2. Step 2. The fiber is baked in large ovens at a very high temperature for 1 hour. It is suggested that the temperature at which the fiber is baked may influence the effective-ness of the preshrinking process. An experiment is performed in which the baking temperature T is varied for various batches of fiber. The finished fiber is then soaked in rainwater for a suitable length of time and put out in the sun to dry. The amount of further shrinkage Y (in percent) resulting from the rainwater test is recorded along with the value of T for each batch: 1. Fit a regression line blablabla to the data by least square. (Note: Coding the variable T may simplify the calculations, but remember in the end to express the fitted equation in terms of the original variable T.) 2. Perform an analysis of variance and test : a. The lack of fit b. The significant of the regression What is the percentage variation explained by the regression equation? 3. What is the standart error of b1? Give a 95% confidence interval for the true regression coefficient b1. 4. Give the fitted value Ytopi, and the residual blabla, corresponding to each run (batch)

5. For T0=315, find an interval about the predicted value Ytopi0 within which a single future observation Y will fall with probability 0.95 6. Could we use the fitted equation to predict a value of Y at T=360? Give reasons for your answer. (See Exercise L in Exercise for Chapter 5 and 6 for a continuation.)

JJ. (Source : USA Today for Monday, December 6, 1993,page 5B.) The data in the accompanying table JJ consist of average Sunday circulation (X) for 48 U.S. newspaper . All values are in thousands, rounded to the nearest thousand. Two of the top 5 were omitted; the second and 20th were removed because they had no Sunday edition. The figures are for the 6 months ended September 30, 1993 and include bulk sales, defined as lower price sales to, for example, hotels and airlines , who give them free to customers. 1. Plot Y versus X 2. Fit blablabla by least squares and plot the fitted line on your diagram. Table JJ. Average Sunday (Y) and daily (X) circulations in thousands for 48 of the top 50 newspaper in the united states for the period march-september 1993 3. 4. 5. 6. Evaluate the residuals to one decimal place. Check that blablabla, within rounding error. Obtain an analysis of variance table Find out how much of the variation about the mean Ybar is explained by the fitted line. There any only two pairs of exact repeat runs in the rounded data quoted. As an approximation, however, treat the Y values at X = BLABLABLA as repeats; also, those at X=BLABLABAL; those at X=BLABLABAL; and finally those at X=411 and 413. (One could argue about these groupings, of course, and you might wish to do a second, alternative calculation using only the two pairs, to see what difference it makes.) Use the pseudo repeat runs to test (approximately) for lack of fitand state your clonclusion. If lack of fit shown, omit parts (7), (8), and (9). Is it appropiate to test for overall regression via the F-test? If so, do it. Find standart error for b0 and b1. Find the formula for the standart error of Ytopi and, assuming that s^2 is an appropriate estimate of $^2 for this part, construct 95% confidence bands for the true mean value of Y. (Plot about half a dozen points over the X-range and join them up smoothly.) Plot the residuals versus Ytopi . Does this plot seem to confirm, or deny, the basic assupmtion of constant error variance. If it does deny it, suggest what could be done. Below are the average daily bulk sales for the first nine newspaper in the data list. Adjust the data for these number (subtract them) and repeatthe analysis. State your conclusions overall.

7. 8. 9.

10. 11.

J. Pengaruh suhu proses penghilang bau pada warna dari produk jadi yang ditentukan secara eksperimental. Data yang dikumpulkan adalah sebagai berikut: 1. Fit model Y = b0 + + e B1X 2. Apakah ini masuk akal model? (Gunakan = 0,05) 3. Mendapatkan interval kepercayaan 95% untuk nilai rata-rata sebenarnya dari Y pada setiap nilai tertentu X, SAY, X0 K. Data di bawah (yang disediakan oleh tom B. Whitaker) menunjukkan 34 pasang nilai X = rata-rata tingkat aflatoksin dalam sampel mini banyak dari 120 pon kacang, PBB. Y = persentase kacang noncontaminated dalam batch-99 1. Plot data (Y sebagai ordinat, X sebagai absis) dan, "oleh eyee" saja, menarik apa yang tampaknya Anda menjadi Jauhkan angka ini "baik-pas garis lurus 'melalui' titik-titik.", Anda akan perlu untuk tujuan perbandingan nanti. Whould Anda katakan baris Anda adalah "cocok"? 2. Juga, mengevaluasi blablabla, semua penjumlahan yang dari i = 1 sampai 34. 3. Fit blablabal model oleh kuadrat terkecil. Gambarkan garis dipasang pada plot dan periksa seberapa baik Anda "mata-fit" itu. 4. Mengevaluasi residu sampai tiga tempat desimal. Periksa blablabla itu, dalam kesalahan pembulatan. Periksa plot dari residu. Berikan kesimpulan. 5. Mendapatkan analisis tabel varians dalam bentuk yang diberikan dalam tabel 1.4 6. Menemukan kesalahan standart dari b0 dan b1 7. Cari rumus untuk standard error Ytopi, dan membangun band kepercayaan 95% untuk nilai ratarata sebenarnya dari Y. (Plot sekitar setengah lusin poins selama rentang X-dan bergabung dengan mereka lancar.) 8. Uji regresi keseluruhan melalui uji F-, dan menemukan berapa banyak variasi tentang Ybar ratarata dijelaskan oleh garis dipasang. W. Dalam marun chicago untuk Jumat, November 10, 1972. Mart Partai diiklankan per botol harga untuk port antik seperti yang diberikan dalam tabel yang sejalan. 1. Plot data dan memeriksa mereka. Apakah akan masuk akal untuk menyesuaikan regresi dari "harga" respon pada "tahun" prediktor? apa kelemahan dapat Anda lihat? 2. Apa transformasi dari "tahun" prediktor akan masuk akal? (Petunjuk:. Berpura-pura itu adalah 1972, dan berpikir, misalnya, bagaimana Anda menggambarkan Anda sendiri "tahun," biasanya) Harga Plot dibandingkan prediktor baru Anda, dan memeriksa plot. Apa jenis transformasi pada harga tampaknya masuk akal di sini untuk membuat data terlihat "lebih garis lurus-ish"? 3. Plot data Y = di (harga) dibandingkan Z = usia botol. Pasanglah garis lurus melalui data dengan kuadrat terkecil, mengevaluasi residu, dan menghasilkan analisis tabel varians. 4. Apa yang Anda simpulkan tentang harga pelabuhan vintage dipamerkan oleh serangkaian data dan analisis Anda? Dalam sen yang terdekat, apa per-tahun tingkat Anda harapkan harga botol port vintage untuk naik jika pola harga yang sama berlanjut ke masa depan? 5. Sebuah iklan berikutnya tiga tahun kemudian pada Selasa, November 25, 1975, menawarkan pelabuhan 1937vintage pada $ 20.00 per botol. Jika dapat diasumsikan bahwa hubungan garis lurus yang diawetkan, dan berlaku juga untuk titik data baru, berapa banyak per botol per tahun tidak tampak harga telah meningkat dalam tiga tahun intervensi? Apakah jawaban Anda di sini dan di (4) konsisten, atau apakah itu tampak bahwa kenaikan harga per tahun telah dipercepat?

X. (Sumber:.. "Grafik dalam analisis statitical," oleh FJ Anscombe The Statistician Amerika, 27, 1973, 17-21) Pasanglah blblabla garis model langsung ke masing-masing empat set data di bawah ini dan menunjukkan bahwa untuk setiap set , blablabla,. Regresi blablabalaa. Residu blablabla. Plot keempat set data yang andexplain bagaimana set data yang berbeda dan apa karakteristik utama mereka. (Perhatikan bahwa data set 1-3 semua memiliki nilai yang sama X tetapi berbeda Y ini.) DD. Sebuah serat sintetis, yang karena penampilannya mirip rambut yang telah ditemukan yang cocok dalam pembuatan wig, tentu harus preshrunk sebelum memproduksi. Hal ini dilakukan dalam dua langkah: Langkah 1. Serat yang direndam dalam larutan encer kimia A, yang diperlukan untuk menjaga kilau serat selama langkah 2. Langkah 2. Serat yang dipanggang dalam oven besar pada suhu yang sangat tinggi selama 1 jam. Disarankan bahwa suhu di mana serat yang dipanggang dapat mempengaruhi efektifitas dari proses preshrinking. Sebuah eksperimen dilakukan di mana suhu T kue bervariasi untuk batch berbagai serat. Serat selesai kemudian direndam dalam air hujan untuk jangka waktu yang sesuai dan menempatkan keluar di bawah sinar matahari sampai kering. Jumlah Y penyusutan lebih lanjut (dalam persen) yang dihasilkan dari tes air hujan dicatat bersama dengan nilai T untuk setiap batch: 1. Pasanglah blablabla garis regresi ke data dengan kuadrat terkecil. (Catatan: Coding T variabel dapat menyederhanakan perhitungan, tapi ingat pada akhirnya untuk mengekspresikan persamaan dipasang dalam hal T. variabel asli) 2. Lakukan analisis varians dan uji: a. Kurangnya fit b. Yang signifikan dari regresi Apa variasi persentase dijelaskan oleh persamaan regresi? 3. Apa kesalahan standart b1? Berikan interval kepercayaan 95% untuk koefisien regresi b1 benar. 4. Berikan Ytopi nilai dipasang, dan blabla sisa, sesuai dengan masing-masing berjalan (batch) 5. Untuk T0 = 315, menemukan selang tentang Ytopi0 nilai prediksi di mana Y pengamatan tunggal masa depan akan jatuh dengan probabilitas 0,95 6. Bisakah kita menggunakan persamaan dipasang untuk memprediksi nilai Y pada T = 360? Berikan alasan untuk jawaban Anda. (Lihat L Latihan di "Latihan Bab 5 dan 6" untuk kelanjutan.) JJ. (Sumber:. USA Today untuk Senin, 6 Desember, 1993, halaman 5B) Data dalam tabel JJ menyertainya terdiri dari sirkulasi Minggu rata-rata (X) selama 48 surat kabar AS. Semua nilai dalam ribuan, dibulatkan ke ribuan terdekat. Dua dari "top 5" dihilangkan, yang kedua dan ke-20 telah dihapus karena mereka tidak memiliki edisi Minggu. Angka-angka adalah untuk 6 bulan yang berakhir 30 September 1993 dan termasuk penjualan massal, yang didefinisikan sebagai harga jual yang lebih rendah untuk, misalnya, hotel dan maskapai penerbangan, yang memberi mereka gratis kepada pelanggan. 1. Plot Y terhadap X 2. Fit blablabla oleh kuadrat terkecil dan plot garis dipasang pada diagram Anda. Tabel JJ. Rata-rata Minggu (Y) dan (X) harian sirkulasi dalam ribuan untuk 48 dari 50 surat kabar besar di negara-negara bersatu untuk periode Maret-September 1993 3. Mengevaluasi residu ke satu tempat desimal. Periksa blablabla itu, dalam kesalahan pembulatan.

4. Mendapatkan analisis tabel varians 5. Cari tahu berapa banyak variasi tentang Ybar rata-rata dijelaskan oleh garis dipasang. 6. Ada pun hanya dua pasang ulangi tepat berjalan dalam data bulat dikutip. Sebagai perkiraan, namun, memperlakukan nilai Y pada X = blablabla sebagai mengulangi, juga, orang-orang di X = BLABLABAL, mereka di X = BLABLABAL, dan akhirnya mereka di X = 411 dan 413. (Satu bisa berdebat tentang pengelompokan ini, tentu saja, dan Anda mungkin ingin melakukan perhitungan, kedua alternatif yang menggunakan hanya dua pasang, untuk melihat apa bedanya.) Gunakan ulangi semu berjalan untuk menguji (sekitar) karena kurangnya fitand menyatakan clonclusion Anda. Jika kurang fit yang ditunjukkan, menghilangkan bagian (7), (8), dan (9). 7. Apakah sesuai jika untuk menguji untuk regresi keseluruhan melalui uji F-? Jika demikian, melakukannya. 8. Menemukan kesalahan standart untuk b0 dan b1. 9. Cari rumus untuk kesalahan standart Ytopi dan, dengan asumsi bahwa s ^ 2 adalah perkiraan yang tepat dari $ ^ 2 untuk bagian ini, membangun band kepercayaan 95% untuk nilai rata-rata sebenarnya dari Y. (Plot sekitar setengah lusin poin atas X-range dan bergabung dengan mereka lancar.) 10. Plot residu dibandingkan Ytopi. Apakah rencana ini tampaknya untuk mengkonfirmasi, atau menyangkal, yang assupmtion dasar varians kesalahan konstan. Jika tidak menyangkalnya, menunjukkan apa yang bisa dilakukan. 11. Berikut adalah penjualan massal rata-rata harian untuk surat kabar sembilan pertama dalam daftar data. Mengatur data untuk nomor ini (kurangi mereka) dan analisis repeatthe. Nyatakan kesimpulan Anda secara keseluruhan.

Вам также может понравиться