Вы находитесь на странице: 1из 14

Apa Apakah Ini Ambil untuk Panaskan Kamar Baru?

Memperkirakan Utilitas Permintaan di Depan suatu Robert Carver Stonehill Sekolah Jurnal Statistik, Pendidikan v.6 N.1 (1998) Copyright (c) 1998 oleh Robert Carver, semua hak cipta. Teks ini dapat secara bebas bersama antara individu, tetapi tidak boleh dipublikasi dalam media apapun tanpa izin tertulis dari penulis dan pemberitahuan kemajuan editor.

-------------------------------------------------- -----------------------------Kata Kunci: Peramalan, Pengukuran, Regresi, seri Waktu; transformasi Variabel.

Abstrak Dalam sebuah rumah perumahan, konsumsi energi terkait erat dengan suhu di luar ruangan dan ukuran rumah. Dalam sebuah rumah ukuran tertentu, konsumsi bahan bakar yang cukup bervariasi diperkirakan sepanjang tahun. Ketika pemilik rumah menambahkan sebuah ruangan, hal lain dianggap sama, konsumsi energi harus meningkat. Dataset ini memungkinkan siswa untuk memperkirakan permintaan energi, membuat perkiraan selama berbulan-bulan masa depan, dan menyelidiki hubungan lainnya. 1. Pengantar Dataset mengandung gas alam dan data penggunaan listrik untuk rumah keluarga tunggal di wilayah Boston dari September 1990 hingga Mei 1997, disertai dengan data klimatologi bulanan. Dataset ini berguna untuk menggambarkan konsep dan teknik tendensi sentral, dispersi, analisis time series, korelasi, regresi sederhana dan ganda, dan transformasi variabel.

1 Di antara tantangan bekerja dengan data nyata dalam kursus statistik pengantar adalah terbatas "dunia nyata" pengalaman mahasiswa. Banyak siswa yang mungkin tidak memiliki latar belakang pengetahuan yang diperlukan untuk menafsirkan atau menghargai cerita dalam dataset. Dataset yang dijelaskan dalam artikel ini adalah mudah diakses oleh siswa, seperti sifat dari pertanyaan yang diajukan dan hubungan kausal yang mendasari. 2 Dataset dapat digunakan untuk menggambarkan beberapa teknik dalam kursus khas, memungkinkan siswa untuk kembali ke data akrab sebagai kecanggihan statistik mereka berkembang. Lebih penting dari penggunaannya sebagai gandum untuk pabrik komputasi, data juga memberikan kesempatan untuk mendapatkan wawasan ke dalam konsep dengan siswa yang sering berjuang: variasi, kesalahan standar, dan pemodelan kausal.

2. This Old House 3 Keluarga saya tinggal di dekat Boston, Massachusetts, di sebuah rumah dibangun pada sekitar tahun 1890. Selama bertahun-tahun, banyak perubahan telah dibuat untuk struktur dan sistemnya. Kamar telah ditambahkan dan saluran air diperkenalkan. Layanan listrik dan kabel telah diubah dan ditingkatkan beberapa kali, dan jaringan kabel di ruang bawah tanah hampir sebuah museum sejarah kabel perumahan. Sistem pemanas awalnya dipicu oleh batubara, maka minyak, dan sekarang oleh gas alam. Meskipun sistem batubara tergantung pada konveksi untuk mendistribusikan udara hangat, sistem saat ini dipaksa udara panas, mengandalkan sebuah kipas angin listrik untuk mendorong udara panas ke seluruh sistem saluran. 4 tungku kami, kompor, dan pemanas air menggunakan gas alam. Pengering pakaian kami adalah semua-listrik. Pada awal tahun 1996, kami menambahkan kamar tidur dan dapur diperbesar, dan kami tertarik dalam memperkirakan konsumsi tambahan gas alam dan listrik disebabkan oleh konfigurasi baru. Keluarga tetap ukuran yang sama, dan anak-anak kami yang berkembang belum mulai mengubah kebiasaan mandi, sehingga permintaan untuk air panas tetap stabil. Konstruksi baru meningkatkan isolasi di daerah yang terkena, dan beberapa sirkuit pencahayaan baru yang ditambahkan. Tidak ada AC di rumah.

2.1. Data 5 Dataset berisi pengamatan bulanan dimulai pada bulan September 1990, dan berlanjut sampai Mei 1997. Variabel termasuk suhu rata-rata untuk bulan di Boston, konsumsi gas alam, konsumsi listrik, pemanasan dan pendinginan hari gelar, dan variabel dummy menunjukkan adanya ruang baru. Ini variabel terakhir adalah 0 untuk bulan-bulan sampai November 1995, dan 1 setelahnya. 6 hari Gelar adalah ukuran dari fluktuasi suhu yang merangsang permintaan untuk pemanasan atau pendinginan. Secara khusus, hari tingkat pemanasan jumlah dari nilai absolut dari penyimpangan temperatur di bawah temperatur dasar 65 derajat Fahrenheit. Sebagai contoh, jika suhu harian rata-rata adalah 60 derajat satu hari, yang akan mewakili lima hari pemanas derajat. Sebaliknya, pendinginan gelar hari jumlah deviasi positif dari dasar 65 derajat.

7 Karena dataset rentang beberapa tahun, saya memilih untuk mengekspresikan penggunaan utilitas dalam unit-unit konsumsi, bukan dalam jumlah dolar. Dengan cara ini, kita tidak perlu khawatir dengan inflasi harga. Perusahaan gas menghitung tagihan berdasarkan therms digunakan, di mana satuan panas adalah indeks yang mewakili kapasitas pemanasan variabel satu kaki kubik gas alam. Karena volume gas alam adalah fungsi dari suhu, kapasitas pemanasan satu kaki kubik bervariasi sepanjang tahun. Bay Gas Negara menghitung konsumsi dalam therms pada setiap tagihan gas. Penggunaan listrik diukur dalam kilowatt jam (kwh). Bay State Gas dan Boston Edison diberikan semua angka konsumsi dalam bentuk faktur bulanan. Suhu rata-rata 8 harian dan Data gelar hari diperoleh dari National Weather Service. Perhatikan bahwa periode pengamatan tidak sempurna selaras. Sebagai contoh, data temperatur untuk Januari 1991 mengacu pada periode 1 Januari hingga 31 Januari tahun itu. Konsumsi Gas pengamatan untuk bulan mencerminkan periode dari tanggal 18 Desember, 1990 sampai 17 Januari 1991, sedangkan pengamatan listrik mencerminkan periode dari tanggal 12 Desember, 1990 sampai 11 Januari 1991. Penyimpangan ini memberikan kesempatan untuk diskusi kelas kesulitan khas dengan data pengamatan, dan mungkin kesempatan latihan menulis atau diskusi tentang bagaimana seseorang dapat mendesain ulang penelitian ini. 9 Selain masalah non-aligned bulan, ada yang hilang pengamatan dalam dataset. Perusahaan gas biasanya melompat satu atau dua tagihan selama bulan-bulan musim panas. Secara khusus, pada tahun 1991 dan 1992, tidak ada tagihan bulan September. Mulai pada tahun 1993, perusahaan telah mengirimkan tagihan pada bulan Juni, Agustus, dan Oktober, dan account dua terakhir tagihan selama sekitar 60 hari kalender lebih dari 30. Oleh karena itu, masuk akal untuk membagi angka penagihan total dengan panjang periode penagihan, dan menganalisis konsumsi gas rata-rata per hari.

2.2. Pertanyaan 10 Pertanyaan-pertanyaan utama yang mendorong pengumpulan data adalah: Dalam satu bulan rata-rata, kita menggunakan gas alam tambahan sebagai hasil dari penambahan ruangan? Jika demikian, berapa banyak? Dalam satu bulan rata-rata, kita menggunakan listrik tambahan sebagai hasil dari penambahan ruangan? Jika demikian, berapa banyak? 11 mendasari pertanyaan-pertanyaan ini, tentu saja, adalah masalah apakah atau tidak ada hubungan cukup stabil antara suhu dan menggunakan utilitas untuk memungkinkan kita untuk menggunakan data yang tersedia secara produktif. Selain itu, ada banyak pertanyaan yang berguna yang bisa diajukan, memungkinkan praktek baik dengan teknik dan pengalaman dengan penalaran statistik. Sebagai contoh, Boston Edison hanya membaca meteran listrik setiap bulan, namun masalah tagihan bulanan. Dalam satu bulan, periode penagihan dimulai dengan pembacaan aktual dan diakhiri dengan pembacaan diperkirakan; di akhirat, sebaliknya adalah benar. Apakah penggunaan dilaporkan secara konsisten yang berbeda dalam dua jenis tagihan? Selain pertanyaan-pertanyaan seperti, dataset menyediakan pakan ternak yang baik untuk datang untuk mengatasi dengan konsep-konsep statistik dasar seperti standard error dari mean.

3. Penggunaan Data untuk Ilustrasikanlah Berbagai Teknik 12 Selain memperkirakan biaya yang dikenakan dengan menambahkan ruangan, dataset cocok untuk berbagai teknik statistik. Bagian ini beberapa review banyak kemungkinan.

3.1. Eksplorasi dan Deskripsi 13 Saya pertama kali menyarankan bahwa siswa hanya melihat dataset, sebaiknya pada halaman cetak, dan jelaskan apa yang mereka perhatikan. Ada dua ciri yang menonjol: data hilang (musim panas tagihan gas) yang mencolok, seperti pola-pola seperti gelombang komplementer dalam pemanasan dan pendinginan gelar kolom hari. Refleksi sejenak membawa penjelasan untuk yang kedua. Adapun mantan, kita membahas mengapa data yang hilang, dan mulai mempertimbangkan implikasi untuk analisis nanti. 14 Siswa dapat membangun dan mengomentari histogram dari dua variabel dependen (gas harian dan penggunaan listrik). Kilowatt-jam per-hari distribusi simetris, berbentuk lonceng, dan cukup baik berperilaku, sedangkan distribusi konsumsi gas, dengan perbandingan, sangat tidak beraturan (Gambar 1). Kontras dalam dua grafik cocok untuk diskusi yang berguna.

-------------------------------------------------- -----------------------------Gambar 1 (5.2K gif) Gambar 1. Histogram Mean Penggunaan Gas dan Rata-rata Harian Harian Penggunaan Listrik.

-------------------------------------------------- -----------------------------15 Karena ini adalah data time series, siswa harus membangun plot time series awal dalam analisis. Aku memiliki mereka merencanakan lima variabel terhadap waktu: suhu hari pemanasan, derajat, pendinginan hari gelar, konsumsi gas, dan konsumsi listrik. Sebelum membangun grafik, saya meminta mereka apa yang mereka harapkan untuk melihat di masing-masing. Kemudian, setelah melihat grafik, saya meminta mereka (a) jika ada kejutan dan (b) apa yang mereka. Grafik penggunaan gas berarti sehari-hari adalah ditunjukkan pada Gambar 2. Kami mendiskusikan perbedaan antara lima grafik, dan apakah dua terakhir grafik memberikan petunjuk mengenai pertanyaan utama tentang konsumsi meningkat. Saya juga ingin tanyakan kepada siswa bagaimana grafik tingkat pendinginan dan pemanasan hari mungkin terlihat di bagian lain negara.

-------------------------------------------------- -----------------------------Gambar 2 (5.4K gif) Gambar 2. Time Series Plot Penggunaan Gas Rata-rata harian.

-------------------------------------------------- -----------------------------16 Side-by-side boxplots gas dan konsumsi listrik pra-dan pasca-konstruksi (lihat Gambar 3 untuk boxplots gas) menawarkan wawasan ke dalam pertanyaan utama dalam kasus tersebut. Para boxplots menyarankan agar kita mengkonsumsi lebih dari setiap utilitas sekarang bahwa kita memiliki ruangan baru, meskipun peningkatan lebih diucapkan dalam kasus gas alam.

-------------------------------------------------- -----------------------------Gambar 3 (3.7K gif) Gambar 3. Boxplots Penggunaan Gas Pra-dan Pasca-Penambahan.

-------------------------------------------------- -----------------------------17 Selain boxplots, adalah wajar untuk menghitung berarti, deviasi standar, dan kuartil untuk dua variabel tergantung, pra-dan pasca-pembangunan ruang baru. Dengan demikian, jelas bahwa sarana dan kuartil lebih tinggi setelah konstruksi, tapi begitu adalah deviasi standar. Konsumsi menjadi lebih volatile setelah ruangan itu ditambahkan. Selain itu, ketika kita menghitung langkah-langkah yang sama untuk variabel iklim, kita menemukan bahwa, rata-rata, suhu telah rendah, pemanasan hari tingkat yang lebih tinggi, dan hari-hari yang lebih sedikit tingkat pendinginan sejak konstruksi. Dengan demikian, sulit untuk mengatakan apakah peningkatan konsumsi utilitas harus dihubungkan ke ruang baru atau variasi suhu kesempatan. 18 Akhirnya, scatterplots dari penggunaan sehari-hari dibandingkan hari suhu atau derajat dapat mulai untuk mengungkapkan hubungan di tempat kerja. Hal ini sangat berguna untuk merencanakan konsumsi gas terhadap temperatur, dengan menggunakan warna yang berbeda atau simbol untuk pengamatan sebelum dan sesudah konstruksi (Gambar 4). Seperti yang diharapkan, hubungan antara temperatur dan konsumsi gas cukup kuat, namun bahwa antara konsumsi listrik dan suhu jauh lebih lemah. Juga seperti yang diharapkan, pasca Selain konsumsi cenderung lebih tinggi pada setiap tingkat suhu, meskipun tidak selalu. -------------------------------------------------- -----------------------------Gambar 4 (4.0K gif) Gambar 4. Sebar Penggunaan Gas vs Suhu.

-------------------------------------------------- ------------------------------

3.2. Analisis Regresi 19 Karena hubungan sebab dan akibat antara suhu di luar ruangan dan pemanas

begitu jelas, titik awal alami untuk inferensi adalah regresi sederhana dari penggunaan gas sehari-hari (dalam therms) di kedua hari derajat suhu atau pemanasan. Hal ini sangat berguna untuk memiliki beberapa diskusi tentang apa yang "menyebabkan" konsumsi gas sepanjang tahun, serta diskusi tentang kekuatan dan kelemahan relatif dari dua ukuran iklim. Rata-rata suhu harian yang mudah dipahami dan tidak memiliki batas bawah (tidak seperti hari derajat), tetapi tidak mencerminkan variasi suhu selama sebulan. Hari tingkat pemanasan membutuhkan beberapa terjemahan untuk kelas, tapi jangan menangkap variasi suhu rata-rata sekitar. Sebagai variabel penjelas, gelar hari masuk akal, dan memiliki kebajikan bahwa y-intercept dalam model yang menampilkan hari gelar memiliki interpretasi alam: itu adalah jumlah gas yang diperlukan untuk memasak dan pemanas air, bahkan ketika ada tidak perlu untuk panas. 20 Ketika kita meneliti koefisien korelasi, kita menemukan bahwa penggunaan gas memiliki korelasi kuat dengan suhu (-0,93) dibandingkan dengan hari pemanasan derajat (0,90). Dengan demikian, regresi pertama kita mempertimbangkan menggunakan konsumsi sehari-hari dan rata-rata suhu. Kemiringan garis adalah negatif: semakin tinggi suhu, gas kurang dikonsumsi. Minitab output untuk regresi tersebut adalah ditampilkan di sini. Persamaan regresi GaspDay = 15,4-0,217 Temp 71 kasus 10 kasus digunakan mengandung nilai-nilai yang hilang Koefisien prediktor STDEV TP Konstan 15,3677 0,5049 30,44 0,000 Temp -0,21696 0,01036 -20,94 0,000 S = 1,314 R-Sq = 86,4% R-Sq (adj) = 86,2% Analisis Varians Sumber DF SS MS FP Regresi 1 757,09 757,09 438,54 0,000 Kesalahan 69 119,12 1,73 Jumlah 70 876,21 Biasa Pengamatan Obs Temp GaspDay Fit Residual St STDEV Fit Resid 38 50,0 1,900 4,520 0,160 -2,620-2.01R 65 30,0 11,600 8,859 0,230 2,741 2.12R 67 37,0 11,600 7,340 0,184 4,260 3.27R R menunjukkan sebuah pengamatan dengan standar residu yang besar 21 Hasil ini konsisten dengan hipotesis hubungan, dan semua uji statistik menunjukkan hubungan yang signifikan. Tentu saja, model ini memberitahu kita apaapa tentang dampak dari ruangan baru, tetapi tidak meminjamkan kepercayaan pada gagasan bahwa kita harus kontrol untuk variasi musiman seperti yang kita

konsumsi rata-rata memeriksa pra-dan pasca-konstruksi. Output ini juga menyediakan kesempatan untuk diskusi akal sehat pengamatan yang tidak biasa, dan siswa cukup mampu berteori tentang proses-proses yang menimbulkan pengamatan tersebut. 22 Regresi berikutnya memperkenalkan kehadiran ruang baru ke dalam model. Hal ini dicapai melalui NewRoom disebut variabel boneka, yang sama dengan 0 sebelum konstruksi, dan 1 setelahnya. Dengan demikian, koefisien estimasi NewRoom adalah peningkatan marginal dalam penggunaan gas, setelah mengendalikan variasi suhu. Persamaan regresi GaspDay = 15,0-0,215 Temp + 1.11 NewRoom 71 kasus 10 kasus digunakan mengandung nilai-nilai yang hilang Koefisien prediktor STDEV TP Konstan 15,0060 0,4885 30,72 0,000 Temp -0,214562 0,009775 -21,95 0,000 NewRoom 1,1125 0,3521 3,16 0,002 S = 1,236 R-Sq = 88,1% R-Sq (adj) = 87,8% Analisis Varians Sumber DF SS MS FP Regresi 2 772,34 386,17 252,80 0,000 Kesalahan 68 103,87 1,53 Jumlah 70 876,21 Sumber DF Seq SS Temp 1 757,09 NewRoom 1 15,25 Biasa Pengamatan Obs Temp GaspDay Fit Residual St STDEV Fit Resid 8 50,0 7,000 4,278 0,169 2,722 2.22R 31 33,0 10,800 7,925 0,216 2,875 2.36R 67 37,0 11,600 8,180 0,317 3,420 2.86R 74 53,0 1,900 4,747 0,321 -2,847-2.38R 75 40,0 5,000 7,536 0,312 -2,536-2.12R R menunjukkan sebuah pengamatan dengan standar residu yang besar 23 Model ini sedikit perbaikan dalam beberapa hal: kesalahan standar berkurang (1,314-1,236), koefisien determinasi berganda disesuaikan sedikit meningkat dari 86,2% menjadi 87,8%), dan semua nilai-p menunjukkan hasil yang signifikan seperti sebelumnya . Selain itu, kami telah estimasi pertama kami dari peningkatan permintaan untuk gas: 1.11 therms per bulan.

24 Model ini, bagaimanapun, memiliki beberapa masalah. Beberapa dari mereka, seperti korelasi serial, mungkin di luar lingkup dari kursus pertama, tapi harus ditunjukkan. Masalah yang lebih menarik dan mudah ditangani, meskipun, adalah non-linearitas. Sebuah plot residual vs nilai dilengkapi mengungkapkan pola (hingga cekung) nyata lengkung, menunjukkan bahwa model linier tidak cukup tepat. 25 Sebagai soal logis, siswa dapat dengan cepat melihat bahwa, meskipun scatter plot linier-cari, tidak mungkin bahwa suhu dan penggunaan gas yang berhubungan linier atas semua nilai suhu mungkin. Dalam hubungan ini miring ke bawah, suhu dapat terus meningkat, tetapi konsumsi gas harus berhenti di nol. Saya mengajak kelas untuk menerapkan model untuk satu bulan pra-konstruksi di mana suhu ratarata adalah 75 derajat, dan mereka dengan cepat melihat masalah: model memprediksi konsumsi gas negatif. 26 Oleh karena itu, model yang lebih baik akan menjadi salah satu di mana kita cocok dengan kurva yang mendatar pada temperatur tinggi tepat. Bagian berikutnya membahas salah satu model tersebut. 27 Jelas, ada beberapa model lain yang mungkin melibatkan regresi gelar hari dan konsumsi listrik. Ini contoh pertama dapat berfungsi untuk menggambarkan bagaimana analisis mungkin dilanjutkan dalam kasus-kasus. 28 Sebelum beralih ke hal-hal lain, pertimbangkan model regresi konsumsi listrik. Model (ditampilkan di bawah) memiliki tiga prediktor: suhu, dummy ruangan baru, dan variabel dummy menunjukkan apakah penggunaan listrik diperkirakan. Tiga poin patut mendapatkan perhatian. Pertama, hubungan antara konsumsi listrik dan suhu jauh lebih lemah dari itu untuk penggunaan gas, dengan R2 hanya 33,3%. Kedua, kita dapat yakin bahwa penggunaan telah meningkat dengan penambahan ruangan, pada urutan dari sekitar 6 kwh per hari, karena kami memperkirakan koefisien 6,181 (nilai p sekitar nol). Ketiga, tidak ada perbedaan yang signifikan dalam penggunaan dilaporkan ketika perusahaan listrik memperkirakan pembacaan meter, sesuai dengan nilai p-untuk koefisien estimasi "Est." Persamaan regresi KWHpDay = 21,9-0,118 Temp + 6,18 NewRoom - 1,34 Est Koefisien prediktor STDEV TP Konstan 21,850 1,811 12,07 0,000 Temp -0,11837 0,03209 -3,69 0,000 NewRoom 6,181 1,218 5,08 0,000 Est -1,338 1,015 -1,32 0,192 S = 4,543 R-Sq = 35,8% R-Sq (adj) = 33,3% Analisis Varians Sumber DF SS MS FP Regresi 3 886,01 295,34 14,31 0,000 Kesalahan 77 20,64 1.589,31 Total 80 2475,31

Sumber DF Seq SS Temp 1 323,71 NewRoom 1 526,48 Est 1 35,81 Biasa Pengamatan Obs Temp KWHpDay Fit Residual St STDEV Fit Resid 25 61,0 32,200 14,630 0,845 17,570 3.94R 27 40,0 6,000 17,116 0,855 -11,116-2.49R 36 72,0 22,400 11,990 1,067 10,410 2.36R 37 62,0 3,600 14,511 0,857 -10,911-2.45R 67 37,0 37,800 23,651 1,263 14,149 3.24R R menunjukkan sebuah pengamatan dengan standar residu yang besar

3.3. Transformasi variabel dan Teknik Time Series 29 Setelah membahas non-linearitas pada data ini, itu adalah perpanjangan alami untuk menggunakan data untuk menggambarkan penerapan berbagai transformasi. Kelas harus melihat keinginan pemasangan kurva ke data, dan menggunakan logaritma natural dari temperatur bekerja dengan baik dalam model regresi sebelumnya. Hal ini juga instruktif untuk mempertimbangkan transformasi yang sama dalam model dengan pemanas hari gelar sebagai variabel independen, karena nol derajat hari sering sama, transformasi ini menyajikan siswa dengan teka-teki lain untuk menyelesaikan. 30 Data juga berguna untuk pembangunan indeks musiman. Iklim dan data konsumsi gas menggambarkan seri dengan kecenderungan sedikit, namun variasi musiman sangat teratur. Sebaliknya, seri konsumsi listrik jauh lebih teratur, dan cenderung terus naik sejak ruangan itu ditambahkan. Suhu dan seri listrik yang lengkap, tetapi seri konsumsi gas terganggu.

4. Peluang untuk Membahas Konsep statistik 31 Mungkin lebih penting daripada kemungkinan komputasi dalam dataset ini adalah yang konseptual. Sebagian karena kebiasaan dari subyek data, siswa dapat membawa intuisi-intuisi mereka untuk menanggung pada beberapa ide dasar, namun berduri, tentang statistik. Bagian ini mengulas beberapa cara di mana konsep-konsep inti dalam kursus dapat dieksplorasi dengan dataset ini.

4.1. Pengukuran 32 Dataset ini memberikan ilustrasi kategoris, interval, dan skala pengukuran rasio. Dengan demikian memberikan kesempatan untuk memperkenalkan atau meninjau definisi tersebut dalam konteks praktis. 33 Lebih menarik lagi, kita memiliki pilihan untuk membuat dalam memilih variabel untuk analisis. Apakah "therms" variabel lebih baik daripada "kaki kubik"? Apa adalah hari gelar? Apa bedanya untuk dasar analisis regresi pada hari-hari tingkat

pemanasan daripada rata-rata suhu harian? Apa yang hilang atau diperoleh dengan menggunakan data klimatologi dari Boston, yang di pantai dan sekitar dua puluh mil dari rumah?

4.2. Variasi 34 Mengapa penggunaan gas akan berbeda dalam dua bulan dengan suhu rata-rata yang sama? Misalnya, suhu rata-rata adalah 33 derajat pada Februari 1991 dan Maret 1992. Pada bulan pertama, rata-rata konsumsi adalah 8,5 therms per hari, tapi itu adalah 8,7 therms per hari di kedua. Mengapa ini terjadi? Siswa cenderung menyarankan faktor-faktor perilaku: mungkin kita berada di rumah lebih sering Maret, dan muncul panas. Mereka cenderung untuk mengidentifikasi perbedaan varians suhu sebagai penjelasan, meskipun mereka bisa dibujuk dengan baris berikut penalaran: 35 Misalkan kita menjaga termostat ditetapkan pada 65 derajat. Ketika suhu di bawah 65, panas datang di. Pertimbangkan dua bulan di mana suhu harian rata-rata adalah 66 derajat. Pada bulan pertama, suhu secara ajaib tetap konstan pada tingkat itu. Berapa gas yang kita gunakan? Pada bulan kedua, suhu berfluktuasi, namun rata-ratanya adalah 66. Apakah kita menggunakan jumlah yang sama gas?

4.3. Standar Error Mean 36 Apakah ada sebuah konsep tunggal dalam kuliah pengantar yang membingungkan siswa lebih diprediksi dan mendalam daripada standard error? Formula ini cukup sederhana, dan siswa dengan cepat dapat bekerja dengan data untuk "mendapatkan jawaban yang benar." Tapi bertanya kepada kelas untuk menjelaskan apa kesalahan standar mewakili, dan menatap bingung berlimpah. Suhu rata-rata 37 variabel dalam dataset ini mungkin membantu beberapa siswa untuk mendapatkan wawasan ke dalam konsep. Dalam hal ini bagian dari negara, pada bulan September suhu sangat bervariasi. Malam cenderung menjadi dingin, tapi suhu siang hari tidak menentu liar. Apakah kelas untuk merekam suhu per jam pada bulan tersebut dan menghitung deviasi standar sampel, itu akan cukup tinggi. Seperti rata-rata sampel, standar deviasi sampel akan berbeda September mendatang, dan memang akan berbeda jika Amy mencatat suhu pada jam, dan catatan Bill mereka di setengah jam. Setiap statistik sampel akan tergantung pada sampel tertentu yang kita miliki dan pada nilai yang tidak diketahui dari parameter populasi. 38 Dalam dataset kami, kami memiliki mean suhu selama tujuh Septembers berturut-turut. Nilai rata-rata adalah: 62 61 61 62 64 64 64 Menanyakan kelas (a) apa yang mereka perhatikan tentang tujuh nilai rata-rata, dan (b) mengapa mereka semua sangat mirip dapat pergi jauh menuju pemahaman tentang apa kesalahan standar dari mean mewakili, dan mengapa kesalahan standar sehingga jauh lebih kecil dari standar deviasi dari x. 4.4. Penyebab dan Korelasi

39 Sangat mudah bagi siswa untuk melihat bahwa suhu hangat "menyebabkan" kita untuk menggunakan gas kurang alami: kami tidak muncul panas, kita bisa memasak sedikit kurang, dan air panas tetap panas. Bahwa rantai sebab-akibat cukup jelas memanifestasikan dirinya dalam variabel yang memiliki korelasi negatif yang tinggi. 40 Dalam kasus penggunaan listrik, meskipun, rantai jauh kurang jelas. Apa suhu di luar ruangan harus dilakukan dengan konsumsi listrik, AC tidak ada? Kelas dapat berspekulasi tentang mengapa kita bisa menggunakan listrik lebih atau kurang di musim panas atau musim dingin. Korelasi antara kwh per hari dan rata-rata suhu -. 362, menunjukkan bahwa kita menggunakan listrik lebih banyak dalam bulan-bulan dingin. Melalui mekanisme apa cuaca dingin tidak menyebabkan kita untuk menggunakan kilowatt jam lebih? Tentunya, kipas dalam tungku berjalan lebih dalam cuaca dingin, tetapi sekali lagi, kulkas dan kipas jendela bekerja lebih keras dalam cuaca hangat. Hampir pasti, faktor nyata adalah masalah daylight - sendiri merupakan berkorelasi suhu.

5. Kesimpulan 41 Meskipun dataset lain memberikan drama yang lebih atau koneksi yang lebih langsung ke bidang utama seorang siswa studi, set ini mengejutkan kaya. Saya berpikir bahwa murid-murid saya berhubungan dengan itu karena dua faktor: cerita dasar akrab dan dimengerti, dan itu rumah saya. Faktor kedua jelas tidak ditransfer ke pengaturan lain, meskipun salah satu dengan kecenderungan untuk tagihan listrik menimbun tua dapat dengan mudah membangun dataset yang sama. Bahkan, siswa mungkin ingin mengkompilasi sebuah dataset yang sama dari file keluarga mereka. Dari perspektif saya, kesederhanaan dataset ini adalah kebajikan yang terbesar, diikuti oleh fakta bahwa ia dapat ditinjau kembali dan dirujuk pada beberapa titik selama kursus.

6. Mendapatkan Data 42 Para utility.dat file berisi data mentah. Para utility.txt file adalah file dokumentasi yang berisi deskripsi singkat dari dataset.

Ucapan Terima Kasih Saya ingin mengakui bantuan yang cukup besar dari Bob Hayden dan Norton Starr. Partisipasi di Pertemuan Baru tahun lalu Statistik Inggris Terisolasi 'adalah bagian dari inspirasi untuk pekerjaan ini. -------------------------------------------------- ------------------------------

Lampiran - Kunci untuk Variabel dalam utility.dat Kolom 1 - 7 Pengamatan bulan (diformat mmm-yy) 10 - 11 Jumlah hari dalam bulan 14 - 15 Rata-rata suhu bulanan di Boston, dalam derajat Fahrenheit

17 - 20 Rata-rata penggunaan gas alam per hari untuk bulan, di therms 23 - 25 therms Jumlah total digunakan untuk bulan 28-29 Hari dalam siklus gas perusahaan penagihan untuk bulan ini 31 - 34 kilowatt jam Jumlah dikonsumsi dalam sebulan 36-39 kilowatt jam rata-rata per hari untuk bulan 42-43 Hari dalam siklus penagihan perusahaan listrik untuk bulan 46 Dummy variabel untuk metode penentuan kwh untuk bulan (0 = aktual akhir bulan pembacaan meter, 1 = membaca perkiraan) 48-51 hari Jumlah total derajat pemanasan untuk bulan 54-56 hari Jumlah total derajat pendinginan untuk bulan ini 58 Dummy variabel untuk ruang baru (0 = pra-Selain itu, 1 = pasca penambahan) Nilai adalah selaras dan dibatasi oleh kosong. Sebuah satuan panas adalah ukuran standar kapasitas pemanasan kaki kubik gas alam. Karena perubahan suhu udara sepanjang tahun, kapasitas pemanasan bervariasi dari bulan ke bulan. -------------------------------------------------- -----------------------------Robert Carver Departemen Administrasi Bisnis Stonehill Sekolah 320 Washington Street Easton, MA 02357-1150

rcarver@stonehill.edu

Вам также может понравиться