Академический Документы
Профессиональный Документы
Культура Документы
Simpson Paradoksu
Erkek adaylarn %44 kabul edilirken, kadnlarn sadece 33% kabul edilmitir. Bu ayrmclk anlamna gelir mi?
Kabul Stun yzdesi Satr yzdesi Red Stun yzdesi Satr yzdesi Toplam Erkek 35 44% 64% 45 56% 53% 80 Kadn 20 33% 36% 40 67% 47% 60 Toplam 55 100% 85 100% 140
2
Simpson Paradoksu
Cinsiyet ve programa kabul arasnda iliki yoktur. Neden? Kadnlar dil blmlerine daha fazla bavurmaktadr ama programa kabul zordur Erkekler mhendislik blmlerine daha fazla bavurmaktadr ve bu blmlerin kabul oran daha yksektir.
Mhendislik Kabul Stun yzdesi Satr yzdesi Red Stun yzdesi Satr yzdesi Toplam Filoloji Kabul Stun yzdesi Satr yzdesi Red Stun yzdesi Satr yzdesi Toplam Erkek 30 50% 75% 30 50% 75% 60 Erkek 5 25% 33% 15 75% 33% 20 Kadn Toplam 10 40 50% 25% 100% 10 40 50% 25% 100% 20 80 Kadn Toplam 10 15 25% 67% 100% 30 45 75% 67% 100% 40 60
Simpson Paradoksu
ki deikenli (bivariate) analiz (apraz tablo ya da korelasyon) yanl ynlendirebilmektedir. Yeni bir deiken eklendiinde verileri daha iyi anlamak mmkn
lk yorumlar tersine bile dnebilir.
lekler
1. simsel (Nominal) lek: Kategorik. rn. cinsiyet
2. Sral (Ordinal) lek : Sralama (en kk=1 en
0=kadn, 1=erkek byk=10) Drt dzey
l e i n g c
NOT: Nominal ve ordinal deikenler iin ortalama ve std.sapma hesaplanmaz Parametrik testler yaplamaz.
8
likili
likili rneklem t testi
9
likili
ok Deikenli Analizler
2 genel tip
Bamllk analizi
Bir ya da daha fazla deikenin baml deiken olduu ve dier deikenlerce akland ve tahmin edildii durumlarda
rnek. oklu regresyon
Bamszlk analizi
Bamllk Analizleri
oklu Regresyon Ayrma Analizi (Discriminant Analysis) Logit/Lojistik Regresyon Multivariate Analysis of Variance (MANOVA) ve Kovaryans Conjoint Analizi Kanonik Korelasyon Yapsal Eitlik Modeli (Structural Equations Modeling (SEM))
12
Bamszlk Analizleri
Asal Bileenler (Principal Components) ve Factor Analizi Kmeleme Analizi (Cluster Analysis) ok Boyutlu lekleme (Multidimensional Scaling) Correspondence Analizi
13
14
Teknikler
oklu regresyon; tek bir srekli deiken (baml deiken), 2 ve daha ok srekli ya da nominal deiken (bamsz ya da tahmin edici deikenler) tahmin edilmeye allr.
x
x y
x
15
Regresyon
Aamal regresyon analizinde ama, bamsz deiken saysn azaltarak en nemli tahminleyicileri belirlemek
yi a b1 x1i ui
yi a b1x1i b2 x2i ui
yi a b1 x1i b 2 x2i b3 x3i ui
16
17
Model Summar y Model 1 R ,295a R Square ,087 Adjusted R Square ,082 Std. Error of the Est imat e 1,119
a. Predictors: (Constant), Genellikle Balkan kimligimi hatirlatan v ey a on plana cikaran urunleri v e markalari kullaniy orum , Gocm en oldugum icin ay rimciliga m aruz kaldigimi dusunuy orum
b A NOVA
Model 1
df 2 379 381
F 18,102
Sig. ,000a
a. Predictors: (Const ant), Genellikle Balkan kimligimi hatirlatan v ey a on plana cikaran urunleri v e markalari kullaniy orum, Gocmen oldugum icin ay rimciliga maruz kaldigimi dusunuy orum b. Dependent Variable: Goc oncesi geleneklerimizi buy uk olcude korudugumu dusunuy orum
18
a Coeffi ci ents
Unstandardized Coef f icients Model 1 (Constant) Gocmen oldugum icin ay rimciliga maruz kaldigimi dusunuy orum Genellikle Balkan kimligimi hatirlatan v ey a on plana cikaran urunleri v e markalari kullaniy orum B 3,092 -,165 St d. Error ,175 ,048
-,179
,305
,053
,294
5,722
,000
a. Dependent Variable: Goc oncesi geleneklerimizi buy uk olcude korudugumu dusunuy orum
Lojistik Regresyon
Baml deiken 0 ve 1 gibi ikili (binary) ya da ikiden ok kategori ieren kesikli kategorik deiken olduunda normallik varsaym bozulmakta ve dorusal regresyon analizi uygulanamamaktadr. Tahmin edici deikenler kalitatif ve kategorik (rn. cinsiyet) ya da kantitatif (rn. test deerleri) olmal Baml deiken kategorik olmal
Baml deiken srekli ise, oklu regresyon kullanlmaldr.
20
Lojistik Regresyon
Baml ve bamsz deiken aras iliki dorusal deilse
L ln( P / 1 P) a b1 x1 b 2 x2 u
Metrik olmayan metrik + metrik olmayan
ki gruplu ise (binary logistic) kiden fazla gruplu ise (multinomial logistic)
21
1.
2. 3.
lk iterasyonda 24,953, ikincide byklk deikeni eklenerek 21,215 ki -2logL arasndaki fark anlaml deil. p>0,05 Model verileri temsil etmiyor
a,b,c Iteration History
Iteration Step 0 1
a. Constant is included in the model. b. Initial -2 Log Likelihood: 24,953 c. Estimation terminated at iteration number 1 because parameter estimates changed by less than ,001.
Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square 3,739 3,739 3,739 df 1 1 1 Sig. ,053 ,053 ,053
Coeff icients Constant by klk -,800 1,800 -,847 1,943 -,847 1,946 -,847 1,946
b. Constant is included in the model. c. Initial -2 Log Likelihood: 24,953 d. Estimation terminated at iteration number 4 because parameter estimates changed by less than ,001.
24
Variables in the Equation Step a 1 by klk Constant B 1,946 -,847 S.E. 1,069 ,690 Wald 3,313 1,508 df 1 1 Sig. ,069 ,220 Exp(B) 7,000 ,429
L ln( P / 1 P) 0,847 1,946 x1i P 1 /(1 e ( 0,8471,946x1 ) ) 1 /(1 e 0,847e1,946xi ) x1 1 P 0,75 x1 0 P 0,30
Kanonik Korelasyon
Baml deikenler seti ile tahmin edici deikenler seti arasnda iliki
Y1+ Y2 + ... + Yn metrik, nonmetrik =
metrik, nonmetrik
X1 + X2 + ...+ Xn
26
Y a b1 x1 b 2 x2 b3 x3 ... b n xn
Metrik olmayan metrik
27
Kullanm amac
Diskriminant fonksiyonlar aracl ile gruplar aras ayrma en fazla etki eden ayrc deikenleri belirlemede Hangi gruptan geldii bilinmeyen bir birimin hangi gruba dahil edileceini belirlemede kullanlr.
28
Gruplarn kovaryans matrisleri eit olmal, deilse logistic regresyon kullanlabilir. H0: Gruplarn kovaryans matrisleri eittir. H1: Gruplarn kovaryans matrisleri eit deildir. Boxs M=8,797 F=2,669 p>0,05 Gzlem says fazla ise homojenlikten kk sapmalar nedeniyle p<0,05 kabilir.
Korelasyon matrisinde bamsz deikenler aras korelasyonlar 0,70den bykse deikenlerden biri analizden karlabilir ya da deikenler birletirilebilir.
29
Discriminant fonksiyonun ne kadar nemli olduunu grmek iin kanonik korelasyon, eigenvalue (zdeer) ve Wilks Lambda Kanonik korelasyon = 0,437 Kanonik korelasyonun karesi, modelin baml deikendeki deiimi aklama yzdesini aklar %19
31
Deikenlerin sras
Denklem Katsaylar
34
Aratrmacnn grup cevabnn varyansn dikkate alarak hipotezi test etmek iin deneysel durumu tasarlamasnda iki ya da daha fazla bamsz deikenin, birden fazla baml deiken zerindeki etkisi incelemede kullanlr.
36
MANOVA
Tek ynl MANOVA: Birden fazla baml deiken, 1 bamsz deiken ift ynl MANOVA: Birden fazla baml deiken, 2 bamsz deiken
y1 x1 y2 x2
y3
38
Tests the null hy pothesis that the observ ed cov ariance matrices of the dependent v ariables are equal across g a. Design: Intercept+S5
F 5,847 2,940
df 1 2 2
df 2 354 354
Tests the null hy pothesis that the error v ariance of the dependent v ariable is equal across groups. a. Design: Intercept+S5
39
Wilks lambda kldke bamsz deikenin baml deiken zerindeki etkisi artar. Dier istatistikler bydke bamsz deikenin baml deiken zerindeki etkisi artar.
c Multi variate Tests
Ef f ect Intercept
S5
Pillai's Trace Wilks' Lambda Hotelling's Trace Roy 's Largest Root Pillai's Trace Wilks' Lambda Hotelling's Trace Roy 's Largest Root
Part ial Eta Squared ,120 ,120 ,120 ,120 ,155 ,169 ,183 ,309
a. Exact st atist ic b. The statistic is an upper bound on F that y ields a lower bound on the signif icance lev el. c. Design: Intercept+S5
Partial Eta squared etki dzeyini gsterir. 1e yaklatka etki dzeyi artar.
40
a. R Squared = , 297 (Adjusted R Squared = ,293) b. R Squared = , 169 (Adjusted R Squared = ,165)
41
e1 x1
e2 x2
e3 x3
e4
x1
x4
x2
x3
x4
y1
y1 y2
y2
44
TBA
y1i y 2i
FA --- dorulayc faktr analizi ve yapsal eitlik modelleme (SEM). Model temellidir. Deikenler aras ilikileri anlama amac. TBA - Veri azaltma
46
Rotasyon
47
Faktr 1 (alkolizm)
Faktr 1 (alkolizm)
Faktr 2 (baar
Eik (oblique) rotasyon
48
Rotasyon Tipleri
Orthogonal; faktrler ilikisiz
Varimax (faktr yorumunu kolaylatrr) Quartimax (deiken yorumunu kolaylatrr)
Faktrlere yklenen deiken saysn minimize eder.
49
Aklayc (exploratory) ve dorulayc (confirmatory) yaklam fark Exploratory yaklamda aratrmac yklemeleri (loadings) kontrol edemez. Confirmatory yaklamda faktrler tahmin prosedrnde nce tanmlanr ve kavramlatrlr.
Verileri incelemek veya spesifik bir hipotezi etmek
50
18
x1
x2
x3
x4
x5
x6
51
f1
13
f2
23
f3
9 10 11
18
x1
x2
x3
x4
x5
x6
52
0,431
-0,542
F1
X06
X07 X08 X09
F2
-0,101
X10
X14
Marka imaj
F2
X10
X11 X12 X13 X14 X15
F3
Fiyat algs kincil rn zellikleri
0,003
F3 F4
F4
15 x 4 = 60 free ykleme
Kiisel tercihler, tutumlar, eilimler, inanlar ve bekleyiler gibi davransal verilerin analizinde kullanlabilir.
54
55
57
Uzaklk Matrisi
Raw (unscaled) Data for Subject 1 1 2 3 4 5
1 2 3 4 5 6 7 8
,000 14,399 ,000 15,193 10,632 30,669 29,400 29,753 32,187 32,869 33,338
58
2 Boyut iin Stress istatistiinin 0,001den kk olduu deere kadar 4 iterasyon yaplmtr.
Young's S-stress formula 1 is used. Iteration S-stress Improvement Sfra 1 2 3 4 ,22486 ,19200 ,18706 ,18681
Iterations stopped because S-stress improvement is less than ,001000 Sress values are Kruskal's stress formula 1. For matrix Stress = ,15756
RSQ = ,86996
Stimulus Coordinates Dimension Stimulus Stimulus Number Name 1 2 3 4 5 6 7 8 bdate educ jobcat salary salbegin jobtime prevexp minority 1 2
1,1742 -1,4033 ,9820 ,1855 ,4763 ,8809 ,7488 ,5689 ,5500 ,8421 -,7758 -1,1818 -1,6824 ,9890 -1,4732 -,8814
60
Kmeleme Analizi
Birey ya da nesnelerin anlaml alt gruplarn oluturmak iin kullanlr. Ayrma analizinden farkl olarak gruplar nceden tanmlanmaz.
Deiken deil case saysn azaltma Deikenler temelinde analize alnan caseler birbirlerine bir ya da daha fazla boyutta benzerler Benzerliklerden yola karak kmeler oluturmak mmkn
61
Kmeleme Analizi
Deikenlerin lekleri farkllk gsterebilir.
Farkllk varsa Z skorlarna gre standardize edilmelidir.
Hiyerarik ve hiyerarik olmayan kmeleme yntemleri bir arada kullanlabilir. Hiyerarik olmayan kmeleme ynteminde kme says dardan girilir.
62
a Iteration History
Iterat ion 1 2 3 4
Change in Cluster Centers 1 2 3 7,196 3,293 6,530 ,833 ,206 2,818 ,403 ,126 ,906 ,000 ,000 ,000
a. Conv ergence achiev ed due to no or small change in cluster centers. The maximum absolut e coordinate change f or any cent er is ,000. The current it eration is 4. The minimum distance between initial centers is 22,076.
63
1 Yasiniz Karsilikli baglilik Ortak girisim Paylasilan birikim 22 ,21765 ,15828 ,02954
1 2 3
ANOVA Clust er Mean Square 13254,303 5,334 3,094 ,165 Error Mean Square 13,775 ,941 ,971 1,034
df 2 2 2 2
The F t ests should be used only f or descriptiv e purposes because the clusters hav e been chosen to maximize the dif f erences among cases in dif f erent clusters. The observ ed signif icance lev els are not corrected f or this and thus cannot be interpreted as tests of t he hy pothesis that the cluster means are equal.
64
Conjoint Analizi
rn tasarm almalarnda kullanlr. Tketicilerin hangi rn zelliklerine nem verdii ve hangilerini tercih edeceini belirleme.
CONJOINT ; CONsider JOINTly ; karar verirken rn/hizmet zelliklerini bir arada dikkate almak Conjoint zelliklerin e anl olarak deerlendirilmesine dayanr. Trade-off rn. bir zellie daha fazla sahip olmak iin dierinden ne kadar vaz gemek gerek?
65
Daha ok yeni ya da gzden geirilen bir rn ya da hizmetin niteliklerini belirlemek, fiyatlarn oluturulmasna yardmc olmak, sat ya da kullanm dzeyini tahmin etmek ve yeni bir rn nermek amacyla kullanlr.
Conjoint Analizi
ok boyutlu lekleme gibi, conjoint analizi cevaplayclarn subjektif deerlendirmelerine dayanr. MDSde odaklanlan rn ya da markalarken, conjoint zellik kombinasyonuna odaklanr. Y = X1 + X2 + ...+ Xn metrik, metrik olmayan metrik olmayan
66
Conjoint Analizi
rn ya da hizmet zellikleri ile birlikte tanmlanr Katlmclara bu zelliklerin kombinasyonunu ieren rnler, prototip ya da resimler gsterilir ve kendilerinden bu rnleri tercihlerine gre sralamalar istenir. zellik kombinasyonlarn says arttka olas profil says da ssel olarak art gsterir.
67
Conjoint Analizi
Alternatif 1 2 3 4 5 6 7 8 Konfor dar koltuk dar koltuk dar koltuk dar koltuk geni koltuk geni koltuk geni koltuk geni koltuk Fiyat $225 $225 $800 $800 $225 $225 $800 $800 Sre 2 saat 5 saat 2 saat 5 saat 2 saat 5 saat 2 saat 5 saat
Correspondence Analysis
Ama:
Verilerin grsel sunumu ki saysal deiken arasndaki ilikiyi tanmlamak ve ayn zamanda her degikenin kategorileri arasndaki ilikileri belirlemek.
Veri tipi: Nonmetrik. zellikle kategorik verilerin analizinde uygundur. Bir tablodaki karlkl etkilerin grafik zetini sunar. Her deiken iin, dzleme yanstlan kategoriler arasndaki mesafe yaknlk ilikisini ifade eder. Benzer bir ok grafik gibi, bu da alg haritas olarak da bilinir. 69
Correspondence Analysis
Correspondence analiz grafikleri, noktalarn orijine gre incelenerek yorumuna dayanr.
Benzer ynlerdeki noktalar pozitif ilikilidir. Ters ynlerdeki noktalar negatif ilikilidir. Orijinden en uzak noktalar en gl ilikiyi gsteren noktalardr.
70
Ak oturum
ATV
NTV
KANAL7
KANAL E /CNBC-E
Haberler Hava durumu
Yerli diziler
Yabanc diziler
Magazin prog.
TGRT
Spor prog.
Yarma prog.
KANAL D
Talk show prog.
ocuk prog.
http://www.bilesim-int.com.tr/docs/2004_medya_raporu.ppt
71
72
Latent Deikenler
SEMin gerek gc gizil (latent) deiken modellemeden gelmektedir. Varsaym; gzlenen ve gzlenemeyen (gizil-latent) deikenler arasndaki nedensel ilikiler test edilirken gizil deikenler gzlenen deikenler araclyla llebilir Bu tip deikenler hi bir zaman dorudan llemeyen deikenlerdir.
Etkileri llr
Tutumlar Zeka (Intelligence) Tatmin Tercih Motivasyon
73
D5 Geribildirim arama
E E
Kk hatalarda bile birilerine yklenme E
E
in nasl yapld hakknda geribildirim isteme
E
Annda geribildirim iin sabrszlk
Hobileri olmama
74
rnek
Girdiler (Bamsz dsal deikenler)
Baarma Motivasyonu
1 ksi
2 eta
3
75
1
21 31
phi
1
gamma
2
2
2
32
2 3
76
Rota katsaylar iin yklerinin hesaplanmas sonucunda her birinin t deerleri 2den daha byk olmal
Gizil yaplar arasndaki korelasyon incelenir. Standart hatalar, parametrelerin deerlerinin doru bir ekilde nasl tahmin edildiini gsterir. Standart hata ne kadar kkse tahminler de o derece uygundur.
77
Anlaml sonular, deikenlerin istatistiki olarak belirlenen yaplar ile ilikili olduunu gsteririr.