Вы находитесь на странице: 1из 4

Classical Statistics (C) VS Statistical

Learning (S): dalam Perspektif Dua


Budaya
Heru WiryantoAugust 30, 2017

Dalam ilmu statistika saat ini terdapat dua aliran besar yang oleh
Breiman (2015) disebut sebagai dua budaya. Yang pertama Statistika
Klasik disebut juga dengan notasi C (Classical) yang termasuk dalam
pendekatan ini adalah pengujian hipotesis nol, uji-t, korelasi Pearson,
dan ANOVA, ketersediaan data sebagai sumber daya dan
penghitungan power analysis. Yang kedua adalah pendekatan yang
disebut dengan statistical-learning methods atau dikenal dengan
notasi (S), termasuk kedalamnya adalah cross-validation, pattern
classification, and sparsity-inducing regression. Pendekatan ini lebih
berorientasi pada datanya sendiri dengan model yang fleksibel, secara
alami terukur pada data berdimensi tinggi, dan mengikuti agenda
heuristik dengan cara meningkatkan pengoptimalan secara
numerikal.

Pendekatan Statistika C mengacu pada "buku-buku teks statistika "


yang diajarkan di kelas psikologi, biologi dan kedokteran, sedangkan
pendekatan S terdiri dari cakupan yang heterogen dari "sistem
pembelajaran mesin"(Machine Learning), "Data Science", "Data
mining", dan "pengenalan pola". Selama beberapa dekade kedua
budaya statistik ini telah berevolusi dengan caranya masing masing
secara independen. Oleh karena itu, menurut saya bahwa pendekatan
C dan S adalah 1) berasal dari konteks historis yang berbeda, 2)
mengikuti asumsi pemodelan yang berbeda secara konseptual, 3)
membangun fondasi teoritis yang berbeda, dan 4) mengevaluasi hasil
pengukuran yang berbeda untuk memungkinkan kesimpulan
bernuansa yang berbeda dalam praktik pengambilan keputusan.

Secara historis, pendekatan C membuat banyak penemuan penting di


paruh pertama abad ke-20, kebanyakan di departemen statistik
dengan latar belakang akademisi pada bidang statistika atau
matematika. Sebaliknya, kemunculan pendekatan S sebagian besar
telah terjadi pada paruh kedua abad ke-20 karena banyak
perkembangan yang berbasis di dunia industri dan keterlibatan
akademisi dengan latar belakang non-statistik, seperti ilmu komputer,
fisika, dan teknik.

Mengenai hasil pengukuran atau analisa, banyak ahli-ahli dan praktisi


yang telah mewarisi kebiasaan sebagai tradisi untuk menilai kualitas
hubungan statistik dengan menggunakan nilai p, ukuran efek, interval
kepercayaan, dan kekuatan statistik. Dilain pihak, dalam pendekatan
S memberikan alternatif yang sahih namun belum banyak dikenal,
yang diukur dari akurasi, presisi, recall, confusion matrix, skor F1, dan
kurva belajar, sebagai toolkit yang koheren untuk mengukur relevansi
efek statistik seperti pada pendekatan C.

Kesimpulan dua budaya dan pendekatan baik C dan S memiliki


perbedaan yang sangat mendasar, yang dapat digambarkan sebagai
berikut :

Blue = C and Red = S


sedangkan dari segi teori dan metodenya dapat dijelaskan melalui :
Classical Inference = C, Generalization Inference = S

Mudah-mudahan penjelasan diatas memberikan kejelasan masing


masing kedudukan dua budaya. Bukan untuk dipertentangkan mana
yang lebih baik atau lebih akurat namun kesemuanya akan kembali
pada konteks penggunaan dan permasalahan yang dihadapi.
Depok, 30 Agustus 2017
Referensi :
Galit Shmueli (2010), To Explain or to Predict?,
https://www.stat.berkeley.edu/~aldous/157/Papers/shmueli.pdf
Leo Breiman (2001), Statistical Modeling: The Two Cultures,
https://projecteuclid.org/download/pdf_1/euclid.ss/1009213726
Peter Norvig (2010), On Chomsky and the Two Cultures of Statistical
Learning, http://daselab.cs.wright.edu/nesy/NeSy13/norvig.pdf
Danilo Bzdok, Denis Engemann, Gael Varoquaux, Alexandre
Gramfort, Bertrand Thirion, Sanmi Koyejo, Thomas Yeo
(2017),Culture Clash in Imaging Neuroscience: Classical Statistics
versus Statistical Learning,
https://ww5.aievolution.com/hbm1701/index.cfm?do=abs.viewAbs&a
bs=2231

Вам также может понравиться