Вы находитесь на странице: 1из 18

1

Biostatistics KUI: 6111


Final Examination: December 18, 2015

Name : _KEY__________________________________
Student ID No.:_________________
==================================
=========
Instruction:

1. Write your answer in the blank space in this paper sheet


2. It is a closed book examination
3. Time maximum 180 minutes

1. “The full power of the regression approach to case-control studies is obtained when
continuous risk variables are analyzed in the original form in which they were recorded,
rather than by grouping into intervals whose endpoints are often arbitrarily chosen.”
Breslow and Day (1980) page 227. We looked at a version of the Tuyns et al. (1977) data
that has continuous variable measurements (TuynsC.dat).
“Kekuatan penuh dari pendekatan regresi untuk studi kasus-kontrol diperoleh saat variabel
risiko terus menerus dianalisis dalam bentuk aslinya di mana mereka dicatat, bukan
dengan mengelompokkan ke dalam interval yang titik akhirya sering berubah-ubah
dipilih”, Breslow dan Day (1980) halaman 227. Kami melihat versi Tuyns et al. (1977) data
yang memiliki pengukuran variabel kontinu (TuynsC.dat)
The file tuyns.dat contains 88 records from Appendix I of Breslow and Day (1980). These
consist of grouped data from the Ille-et-Vilaine study of esophageal cancer in relation to
smoking, alcohol consumption and diet. The contents are as follows:
File tuyns.dat berisi 88 catatan dari Lampiran I Breslow dan Day (1980). Ini terdiri dari data
yang dikelompokkan dari studi Ille-et-Vilaine kanker esofagus dalam hubungannya
dengan merokok, konsumsi alkohol dan diet. Isinya sebagai berikut :
COL VAR RANGE/VALUES
_________ __________ __________________________

1-2 Age group 1 = 25-34


(years) 2 = 35-44
3 = 45-54
4 = 55-64
5 = 65-74
6 = 75+
3-4 Alcohol (ALC) 1 = 0-39
(gms/day) 2 = 40-79
3 = 80-119
4 = 120+
5-6 Tobacco (TOB) 1 = 0- 9
(gms/day) 2 = 10-19
3 = 20-29
4 = 30+
7-9 Cases Number of esphogeal cancer cases
10-12 Controls Number of population controls
___________________________________________________________
Records with 0 cases and 0 controls have been deleted.
2

Recall that the goal of the study is to characterize the cancer risk associated
with both alcohol and tobacco consumption. In many applications age is a
potential confounder.
Ingat bahwa tujuan dari penelitian ini adalah untuk mengkarakterisasi risiko kanker yang
berhubungan dengan kedua alkohol dan konsumsi tembakau. Dalam banyak aplikasi usia
adalah potensi perancu
Note: Be careful to drop any cases with missing values (coded 99 for TOB)
Catatan: Hati-hati untuk menjatuhkan kasus apapun dengan nilai-nilai yang hilang (kode
99 untuk TOB)
Note: Use the variables named “Tobacco Amount” = TOB, and “Total Alcohol” = ALC.
Catatan: Gunakan variabel bernama " Jumlah Tembakau " = TOB, dan "Jumlah Alkohol"
= ALC
We fit the logistic regression model that uses dummy variables for the age categories and
ALC and TOB as continuous variables entered as linear terms. That is,
Kami sesuai dengan model regresi logistik yang menggunakan variabel dummy untuk
kategori usia dan ALC dan TOB sebagai variabel kontinu dimasukkan sebagai persyaratan
linear. Itu adalah,
6
logit  ( X )   0    j AGE( j )   7 ALC  8TOB
j 2

Here is the stata output


Berikut adalah output stata
. xi: logistic case i.agegp tob alc
i.agegp _Iagegp_1-6 (naturally coded; _Iagegp_1 omitted)

Logistic regression Number of obs = 976


LR chi2(7) = 294.47
Prob > chi2 = 0.0000
Log likelihood = -347.74036 Pseudo R2 = 0.2975

------------------------------------------------------------------------------
case | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_Iagegp_2 | 5.851322 6.433949 1.61 0.108 .6781047 50.49069
_Iagegp_3 | 34.90621 36.8794 3.36 0.001 4.401332 276.8351
_Iagegp_4 | 59.30331 62.43568 3.88 0.000 7.53212 466.918
_Iagegp_5 | 101.4181 107.7435 4.35 0.000 12.64226 813.5914
_Iagegp_6 | 105.0871 116.9321 4.18 0.000 11.86871 930.4551
tob | 1.041306 .0082032 5.14 0.000 1.025352 1.057509
alc | 1.026306 .0026633 10.01 0.000 1.021099 1.031539
------------------------------------------------------------------------------

Questions 1:
Pertanyaan 1 :
Give interpretations for the estimates 7 and 8 (ie. convert to odds ratio summaries for fixed
comparisons of each exposure) (don't forget to mention what is “controlled”).
3

Berikan interpretasi untuk perkiraan 7 and 8 (yaitu. mengkonversi ke ringkasan odds rasio
sebagai perbandingan tetap setiap paparan) (jangan lupa untuk menyebutkan apa yang
"dikendalikan")

Answer 1:
Jawaban 1:
The interpretation of the ALC Odds Ratio or ALC coefficient is the change (increase since Odds
ratio greater than one or the coefficient if positive) in the odds of disease for a one unit = 40
g/day increase in alcohol consumption where other factors (age, tobacco) remain constant.
From this we see that a 40g/day increase (approx 4 drink/day) corresponds to an odds ratio
of 1.04. (4% increase)
Penafsiran Odds Ratio ALC atau koefisien ALC adalah perubahan (kenaikan sejak Odds rasio
lebih dari satu atau koefisien jika positif) dalam kemungkinan penyakit untuk satu unit = 40
g/hari peningkatan di konsumsi alkohol di mana faktor-faktor lain (usia, tembakau) tetap
konstan. Dari sini kita melihat bahwa 40g/hari kenaikan (kira-kira 4 minuman/hari) sesuai
dengan odds rasio 1,04. (Kenaikan 4%)
Similarly the TOB coefficient estimates the change (increase) in the odds of disease associated
with a one unit = 10g/day increase in tobacco consumption, holding age and alcohol
consumption constant. (5)
Demikian pula koefisien TOB memperkirakan perubahan (kenaikan) kemungkinan penyakit
yang berhubungan dengan satu unit = 10g/hari peningkatan konsumsi tembakau, memegang
usia dan konsumsi alkohol konstan

2. Read following table carefully!


Baca tabel berikut dengan seksama!
4

Questions 2:
Pertanyaan 2:
a. What is the difference in birth weight and its 95% confidence intervals between treatment
and control groups? Is it statistically significant? Interpret!
Apa perbedaan berat badan lahir dan interval kepercayaannya 95% antara pengobatan
dan kelompok kontrol? Apakah secara statistik signifikan? Tafsirkan!
b. What is the difference in fat mass and its 95% confidence intervals between treatment
and control groups? Is it statistically significant? Interpret!
Apa perbedaan massa lemak dan interval kepercayaannya 95% antara pengobatan dan
kelompok kontrol? Apakah secara statistik signifikan? Tafsirkan!
Answer 2:
Jawaban 2:
2.a.
Command stata : ttesti n1 mean1 sd1 n2 mean2 sd2
. ttesti 485 3302 502.4 473 3408 589.4

Two-sample t test with equal variances


------------------------------------------------------------------------------
| Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
x | 485 3302 22.81281 502.4 3257.176 3346.824
y | 473 3408 27.10064 589.4 3354.747 3461.253
---------+--------------------------------------------------------------------
combined | 958 3354.336 17.74917 549.3648 3319.504 3389.168
---------+--------------------------------------------------------------------
diff | -106 35.35386 -175.3801 -36.61988
------------------------------------------------------------------------------
diff = mean(x) - mean(y) t = -2.9983
Ho: diff = 0 degrees of freedom = 956

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0


Pr(T < t) = 0.0014 Pr(|T| > |t|) = 0.0028 Pr(T > t) = 0.9986

So the difference in birth weight is 106, the result is statistically significant since the 95% confident
interval range are 3319.504 - 3389.168, and it also can be proofed with the p-value (p=0.0028). Birth
weight in treatment group is bigger than in control group. We can conclude that babies were born to
pregnant women who were given treatment will have a greater birth weight.(5)
Jadi perbedaan berat badan lahir adalah 106, hasilnya adalah signifikan secara statistik sejak
kepercayaan 95% dengan rentang interval waktu 3.319,504 - 3.389,168, dan juga dapat dibuktikan
dengan p-value (p = 0,0028). Berat lahir pada kelompok pengobatan lebih besar dibandingkan dengan
kelompok kontrol. Kita dapat menyimpulkan bahwa bayi yang lahir dari ibu hamil yang diberi
pengobatan akan memiliki berat lahir yang lebih besar
5

2.b.
Command stata : ttesti n1 mean1 sd1 n2 mean2 sd2
. ttesti 485 427 197.9 473 464.3 222.3

Two-sample t test with equal variances


------------------------------------------------------------------------------
| Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
x | 485 427 8.986176 197.9 409.3433 444.6567
y | 473 464.3 10.22136 222.3 444.215 484.385
---------+--------------------------------------------------------------------
combined | 958 445.4164 6.817669 211.0176 432.0371 458.7957
---------+--------------------------------------------------------------------
diff | -37.3 13.5901 -63.96987 -10.63013
------------------------------------------------------------------------------
diff = mean(x) - mean(y) t = -2.7446
Ho: diff = 0 degrees of freedom = 956

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0


Pr(T < t) = 0.0031 Pr(|T| > |t|) = 0.0062 Pr(T > t) = 0.9969

So the difference in fat mass is 37.3, the result is statistically significant since the 95%
confident interval ranges are -63.96987-(-10.63013). Fat mass in treatment group is bigger
in treatment group than in control group. We can conclude that babies were born to pregnant
women who were given treatment will have a greater fat mass. (5)
Jadi perbedaan massa lemak adalah 37,3, hasilnya adalah signifikan secara statistik sejak
kepercayaan 95% dengan rentang interval waktu -63,96987 - (-10,63013). Massa lemak pada
kelompok perlakuan lebih besar pada kelompok pengobatan dibandingkan dengan kelompok
kontrol. Kita dapat menyimpulkan bahwa bayi yang lahir dari ibu hamil yang diberi pengobatan
akan memiliki massa lemak yang lebih besar.

3. Read following table


Baca tabel berikut!
Blood Pressure Category
Gender Optimal Normal Pre-Htn Htn Total
Male 20 15 15 30 80
Female 5 15 25 25 70
Total 25 30 40 55 150

Note: Pre-Htn is pre hypertension


Htn is hypertension

Questions 3:
3.a. What is the probability of selecting a male with optimal blood pressure?
Apa probabilitas memilih laki-laki dengan tekanan darah yang optimal?
3.b. What is the probability of selecting a patient with pre hypertension or hypertension?
Apa probabilitas memilih pasien dengan pre hipertensi atau hipertensi?
6

Answer 3:
Jawaban 3:
3.a. Probability of selecting a male with optimal blood pressure
Probabilitas memilih laki-laki dengan tekanan darah yang optimal
𝑂𝑝𝑡𝑖𝑚𝑎𝑙 𝑚𝑎𝑙𝑒 20
𝑃𝑟 = = 150 = 0,1333 (2)
𝑇𝑜𝑡𝑎𝑙

3.b. Probability of selecting a patient with pre hypertension or hypertension?


Probabilitas memilih pasien dengan pre hipertensi atau hipertensi
𝑇𝑜𝑡𝑎𝑙 𝑃𝑟𝑒 𝐻𝑡𝑛+𝐻𝑡𝑛 40+55
𝑃𝑟 = = = 0,6333 (2)
𝑇𝑜𝑡𝑎𝑙 150

4. The following data from Weiner et al (1979) gives, for a sample of 1465 the number of
diseased coronary arteries as determined by a coronary angiogram.
Berikut data dari Weiner et al (1979) memberikan, untuk sampel dari 1.465 jumlah arteri
koroner yang sakit seperti yang ditentukan oleh angiogram koroner

Number of vessels
diseased
Chest pain 1 2 3
Definite angina 66 135 419
Probable angina 179 139 276
Nonischemic 197 39 15

Questions 4:
Pertanyaan 4
We wish to test the hypothesis Ho: Chest pain is independent of Number of vessels diseased
Kami ingin menguji hipotesis Ho: Nyeri dada adalah independen dari Jumlah penyakit
pembuluh
a) Compute the expected number of observations in each cell under the null hypothesis
Hitunglah jumlah yang diharapkan dari pengamatan di setiap sel di bawah hipotesis nol
b) Compute the chi-squared statistic. How many degrees of freedom does it have?
Hitunglah statistik chi-squared. Berapa banyak derajat kebebasan yang dimilikinya?
c) Suppose you test the null hypothesis at  = .05. What is your conclusion?
Misalkan Anda menguji hipotesis nol pada  = 0,05. Apa kesimpulan Anda?
7

Answer 4:
Jawaban 4
4.a.
Command stata : tabi row1col1 row1col2 row1col3\row2col1 row2col2 row2col3\
row3col1 row3col2 row3col3,exp
. tabi 66 135 419\179 139 276\197 39 15,exp

+--------------------+
| Key |
|--------------------|
| frequency |
| expected frequency |
+--------------------+

| col
row | 1 2 3 | Total
-----------+---------------------------------+----------
1 | 66 135 419 | 620
| 187.1 132.5 300.5 | 620.0
-----------+---------------------------------+----------
2 | 179 139 276 | 594
| 179.2 126.9 287.9 | 594.0
-----------+---------------------------------+----------
3 | 197 39 15 | 251
| 75.7 53.6 121.6 | 251.0
-----------+---------------------------------+----------
Total | 442 313 710 | 1,465
| 442.0 313.0 710.0 | 1,465.0

The expected number in each cell are 187.1, 132.5, 300.5, 179.2, 126.9, 287.9, 75.7, 53.6
and 121.6 (5)
Jumlah tersebut diharapkan setiap sel yang 187.1, 132.5, 300.5, 179.2, 126.9, 287.9, 75.7,
53.6 dan 121.6

4.b. Degree of freedom based on Pearson chi- square test, with stata command :
Derajat kebebasan berdasarkan Pearson chi square test, dengan perintah stata:
Command stata : tabi row1col1 row1col2 row1col3\row2col1 row2col2 row2col3\
row3col1 row3col2 row3col3,chi
. tabi 66 135 419\179 139 276\197 39 15,chi

| col
row | 1 2 3 | Total
-----------+---------------------------------+----------
1 | 66 135 419 | 620
2 | 179 139 276 | 594
3 | 197 39 15 | 251
-----------+---------------------------------+----------
Total | 442 313 710 | 1,465

Pearson chi2(4) = 418.4753 Pr = 0.000


8

chi2(4) = 418.4753 or here is the formula if we compute manually :


2
(𝑓𝑜𝑏𝑠−𝑓𝑒 )
𝜒2 = ∑ [ ]=
𝑓𝑒

= (66-187.1)2/187.1 + (135-132.5)2/132.5 + (419-300.5)2/300.5 + (179-179.2)2/179.2 +


(139-126.9)2/126.9 + (276-287.9)2/287.9 + (197-75.7)2/75.7 + (39-53.6)2/53.6 + (15-
121.6)2/121.6
= 418.5 (5)
4.c. Compute the p-value (Pr = 0.000) and compare  = .05 with or
use chi-square table with 4 degree of freedom and  = .05 i.e. 9.4873 compare with 418.4753
Penggunaan chi-square tabel dengan 4 derajat kebebasan dan  = 0,05 yaitu 9,4873
dibandingkan dengan 418,4753
We reject the null hypothesis, we conclude that chest pain is depend on number of vessels
diseased (5)
Kami menolak hipotesis nol, kami menyimpulkan bahwa nyeri dada adalah tergantung pada
sejumlah penyakit pembuluh

5. A new company has a new home HIV test that they hope to market in a population where
the sero-prevalence is 10%. They tested 100 known HIV positive and 100 known HIV
negative subjects to assess the performance of their home kit. The following results were
obtained :
Sebuah perusahaan baru memiliki tes HIV rumah baru yang mereka berharap untuk pasar
dalam suatu populasi di mana seroprevalensi adalah 10%. Mereka diuji 100 dikenal subjek
negatif HIV positif dan 100 dikenal HIV untuk menilai kinerja dari kit rumah mereka. Hasil
sebagai berikut diperoleh :

Test + Test - Total


HIV + 93 7 100
HIV - 21 79 100

Questions 5:
a) What is the sensitivity of the test?
Apakah sensitivitas dari test?
b) What is the specificity of the test?
Apakah spesifitas dari test?
c) What is the probability that a person randomly selected from the target population who
tests positive is actually HIV positive? (this is called the predictive value of a positive test)
Berapa probabilitas bahwa seseorang dipilih secara acak dari populasi sasaran yang dites
positif sebenarnya positif HIV? (Ini disebut nilai prediktif positif)
9

Answer 4:
Command stata : diagti row1col1 row2col1 row1col2 row2col2,prev (10%)
. diagti 93 7 21 79,prev(10%)

True |
disease | Test result
status | Neg. Pos. | Total
-----------+----------------------+----------
Normal | 79 21 | 100
Abnormal | 7 93 | 100
-----------+----------------------+----------
Total | 86 114 | 200

[95% Confidence Interval]


---------------------------------------------------------------------------
Prevalence Pr(A) 10.0% ----- (given) -----
---------------------------------------------------------------------------
Sensitivity Pr(+|A) 93.0% 86.1% 97.1%
Specificity Pr(-|N) 79.0% 69.7% 86.5%
ROC area (Sens. + Spec.)/2 0.86 0.81 0.91
---------------------------------------------------------------------------
Likelihood ratio (+) Pr(+|A)/Pr(+|N) 4.43 3.02 6.50
Likelihood ratio (-) Pr(-|A)/Pr(-|N) 0.09 0.04 0.18
Odds ratio LR(+)/LR(-) 49.98 20.46 121.52
Positive predictive value Pr(A|+) 33.0% 25.1% 41.9% (lr)
Negative predictive value Pr(N|-) 99.0% 98.0% 99.5% (lr)
---------------------------------------------------------------------------
Pre-test odds prev/(1-prev) 0.11 ----- (given) -----
Post-test odds (+) Pr(A|+)/(1-Pr(A|+)) 0.49 0.34 0.72 (lr)
Post-test odds (-) Pr(A|-)/(1-Pr(A|-)) 0.010 0.020 0.005 (lr)
---------------------------------------------------------------------------

(lr) Values and confidence intervals are based on likelihood


ratios, assuming that the prevalence is known exactly.

HIV + HIV - Total


93 21 114
Tes +
(a) (b) (a+b)
7 79 86
Tes -
(c) (d) (c+d)
100 100
Total 200
(a+c) (b+d)

5.a. Sensitivity of the test is 93/100 = 0.93 (2)


𝑎 93
𝑆𝑒𝑛𝑠𝑖𝑡𝑖𝑣𝑖𝑡𝑦 = = = 0,93 ~93%
𝑎+𝑐 93 + 7
5.b. Specificity of the test is 79/100 = 0.79 (2)
𝑑 79
𝑆𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑡𝑦 = = = 0,79 ~ 79%
𝑏+𝑑 21 + 79
10

Test + Test - Total


93 7 100
HIV +
(a) (b) (a+b)
21 79 100
HIV -
(c) (d) (c+d)
114 86
Total 200
(a+c) (b+d)

5.a. Sensitivity of the test is 93/100 = 0.93 (2)


𝑎 93
𝑆𝑒𝑛𝑠𝑖𝑡𝑖𝑣𝑖𝑡𝑦 = = = 0,93 ~ 93%
𝑎+𝑏 93 + 7
5.b. Specificity of the test is 79/100 = 0.79 (2)
𝑑 79
𝑆𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑡𝑦 = = = 0,79 ~ 79%
𝑐+𝑑 21 + 79
5.c. PPV (2)
𝑁𝑖𝑙𝑎𝑖 𝑝𝑜𝑠𝑖𝑡𝑖𝑓 𝑦𝑎𝑛𝑔 𝑠𝑒𝑏𝑒𝑛𝑎𝑟𝑛𝑦𝑎
𝑃𝑃𝑉 =
𝑁𝑖𝑙𝑎𝑖 𝑝𝑜𝑠𝑖𝑡𝑖𝑓 𝑠𝑒𝑏𝑒𝑛𝑎𝑟𝑛𝑦𝑎 + 𝑁𝑖𝑙𝑎𝑖 𝑝𝑜𝑠𝑖𝑡𝑖𝑓 𝑝𝑎𝑙𝑠𝑢

𝐽𝑢𝑚𝑙𝑎ℎ 𝑡𝑒𝑟𝑗𝑎𝑑𝑖𝑛𝑦𝑎 𝑝𝑒𝑛𝑦𝑎𝑘𝑖𝑡


𝑃𝑟𝑒𝑣𝑎𝑙𝑒𝑛𝑠𝑖 =
𝐽𝑢𝑚𝑙𝑎ℎ 𝑃𝑜𝑝𝑢𝑙𝑎𝑠𝑖

𝑆𝑒𝑛𝑠𝑖𝑡𝑖𝑣𝑖𝑡𝑦 ∗ 𝑃𝑟𝑒𝑣𝑎𝑙𝑒𝑛𝑐𝑒
𝑃𝑃𝑉 =
(𝑆𝑒𝑛𝑠𝑖𝑡𝑖𝑣𝑖𝑡𝑦 ∗ 𝑃𝑟𝑒𝑣𝑎𝑙𝑒𝑛𝑐𝑒) + (1 − 𝑃𝑟𝑒𝑣𝑎𝑙𝑒𝑛𝑐𝑒 ∗ 1 − 𝑆𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑡𝑦)

0,93 ∗ 0,1
𝑃𝑃𝑉 = = 0,33
(0,93 ∗ 0,1) + (1 − 0,1 ∗ 1 − 0,79)

(1 − 𝑃𝑟𝑒𝑣𝑎𝑙𝑒𝑛𝑐𝑒) ∗ 𝑆𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑡𝑦
𝑁𝑃𝑉 =
((1 − 𝑃𝑟𝑒𝑣𝑎𝑙𝑒𝑛𝑐𝑒) ∗ 𝑆𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑡𝑦) + (𝑃𝑟𝑒𝑣𝑎𝑙𝑒𝑛𝑐𝑒 ∗ 1 − 𝑆𝑒𝑛𝑠𝑖𝑡𝑖𝑣𝑖𝑡𝑦)

(1 − 0,1) ∗ 0,79
𝑁𝑃𝑉 = = 0,99
((1 − 0,1) ∗ 0,79) + (0,1 ∗ 1 − 0,93)

6. The following figure is from a study of exercise endurance (duration on an exercise test)
in a group of 13 children with cystic fibrosis before and after an intervention program. For
example, subject 1 improved by 3 minutes (7.5 - 4.5).
Gambar berikut adalah dari studi ketahanan latihan (durasi pada tes latihan) dalam
kelompok 13 anak-anak dengan fibrosis kistik sebelum dan setelah program intervensi.
Misalnya, subjek 1 ditingkatkan dengan 3 menit (7.5 – 4.5)
11

Questions 6:
a) Using your best estimate of values from the graph, calculate the mean change in duration
for the 13 patients.
Menggunakan estimasi terbaik dari nilai-nilai dari grafik, menghitung perubahan berarti
dalam durasi selama 13 pasien
b) Calculate the standard deviation of change in duration for the 13 patients.
Hitung standar deviasi dari perubahan durasi selama 13 pasien
c) The standard error of a mean is the standard deviation divided by the square root of the
sample size (here, n=13). Calculate the standard error for the mean change in duration.
Standard error dari mean adalah standar deviasi dibagi dengan akar kuadrat dari ukuran
sampel (di sini, n = 13). Menghitung standard error untuk perubahan berarti dalam durasi
d) The mean here follows a t-distribution with 12 degrees of freedom (13-1). The critical
value for achieving a significance level of .05 (two-sided) for a T-distribution with 12
degrees of freedom is 2.18. Use this information to calculate the 95% confidence interval
for the mean change in duration.
Mean sini mengikuti t-distribusi dengan 12 derajat kebebasan (13-1). Nilai kritis untuk
mencapai tingkat signifikansi 0,05 (dua sisi) untuk T-distribusi dengan 12 derajat
kebebasan 2.18. Gunakan informasi ini untuk menghitung selang kepercayaan 95% untuk
perubahan berarti dalam durasi
e) Use a paired ttest to test the null hypothesis that the intervention program does not affect
exercise test duration (e.g., H0: mean change = 0). Use a two-sided significance level of
.05 (critical value = 2.18).
Menggunakan tes t berpasangan untuk menguji hipotesis nol bahwa program intervensi
tidak mempengaruhi durasi latihan tes (misalnya, H0: berarti perubahan = 0). Gunakan
tingkat signifikansi dua sisi dari 0,05 (nilai kritis = 2.18)
f) Are you convinced that the intervention program works? Why or why not?
Apakah Anda yakin bahwa program intervensi bekerja? Mengapa atau mengapa tidak?
g) If the change in exercise duration was not normally distributed, what statistical test would
you use instead of the paired ttest?
Jika perubahan durasi latihan tidak terdistribusi normal, apa uji statistik yang akan Anda
gunakan bukan uji t berpasangan?
12

Answers 6:
before after
4.5 7.5
7 7.5
10.5 10.5
7.5 8
6.5 8
6.5 6.5
6 7.5
8.5 9
7 7.5
5.5 6.5
8 8.5
7.5 7.5
3.5 4
(5)

. ttest after= before

Paired t test
------------------------------------------------------------------------------
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
after | 13 7.576923 .4154321 1.497862 6.671774 8.482072
before | 13 6.807692 .4920472 1.774101 5.735614 7.879771
---------+--------------------------------------------------------------------
diff | 13 .7692308 .2307692 .8320503 .2664278 1.272034
------------------------------------------------------------------------------
mean(diff) = mean(after - before) t = 3.3333
Ho: mean(diff) = 0 degrees of freedom = 12

Ha: mean(diff) < 0 Ha: mean(diff) != 0 Ha: mean(diff) > 0


Pr(T < t) = 0.9970 Pr(|T| > |t|) = 0.0060 Pr(T > t) = 0.0030

6.a. (4)
Diff=after-before
Meandiff = 0.7692308
6.b. (4)
Standar Deviasidiff = 0.8320503
6.c. (2)
Standar Error = 0.2307692
6.d. (3)
Meandiff  t(12,0.95)*SE = 0.7692308  2.18* 0.2307692 = (0.2664278 1.272034)
6.e. (3)
t = meandiff/SE = 0.7692308/0.2307692 = 3.3333 > t(12,0.95) = 2.18  Reject H0
6.f. (5)
Yes. After an intervention program, exercise endurance duration on an exercise test improved
by 0.8 minutes
Iya. Setelah program intervensi, latihan durasi ketahanan pada tes latihan ditingkatkan
dengan 0,8 menit
6.g Wilcoxon signed-rank (2)
13

7. The following data were collected to examine possible associations between being breast-
fed as an infant and being overweight or obese as an adult. Researchers asked 1486
mothers of 18-year old men about the total duration that they had breast-fed their sons
and then took weight and height measurements of the sons. The data are presented
below:
Data berikut dikumpulkan untuk menguji hubungan yang mungkin antara menjadi ASI
sebagai bayi dan kelebihan berat badan atau obesitas sebagai orang dewasa. Peneliti
meminta 1.486 ibu dari laki-laki berusia 18 tahun tentang total durasi bahwa mereka telah
diberi ASI anak-anak mereka dan kemudian mengambil berat badan dan tinggi
pengukuran dari anak-anak. Data yang disajikan di bawah ini:
Anthropometry and body composition of 18-year old men according to total duration of
breast-feeding. Values are number (percent) and means (SDs).
Antropometri dan komposisi tubuh dari orang tua 18 tahun sesuai dengan total durasi
menyusui. Nilai adalah jumlah (persen) dan sarana (SDs)

Duration of total breast feeding (months)


Outcomes <1 1-6 6-12 ≥12
Number overweight (%) 69 (14.1) 130 (24.7) 50 (33.3) 44 (13.7)
Number obese (%) 47 ( 9.6) 69 (13.1) 31 (20.7) 27 (8.4)
BMI, kg/m2 (SD) 22.5 (3.8) 22.7 (3.6) 22.9 (3.2) 23.0 (3.5)
Total Number of participants 489 526 150 321

Question 7:
Pertanyaan 7:
a. Which statistical test would you use to determine whether or not breast-feeding duration
is related to overweight at 18? State your hypothesis!
Yang uji statistik yang akan Anda gunakan untuk menentukan apakah atau tidak menyusui
durasi berhubungan dengan kelebihan berat badan pada 18? Menyatakan hipotesis Anda!
b. Which statistical test would you use to determine whether or not breast-feeding duration
is related to obesity at 18? State your hypothesis!
Yang uji statistik yang akan Anda gunakan untuk menentukan apakah atau tidak durasi
menyusui berhubungan dengan obesitas pada 18? Menyatakan hipotesis Anda!
c. Which statistical test would you use to determine whether or not breast-feeding duration
is related to BMI at 18 (assume that BMI is normally distributed)? State your hypothesis!
Yang uji statistik yang akan Anda gunakan untuk menentukan apakah atau tidak durasi
menyusui berkaitan dengan BMI di 18 (menganggap bahwa BMI biasanya didistribusikan)?
Menyatakan hipotesis Anda!
14

Answers 7:
7.a. (3)
Pearson Chi-Square test with 3 df
H0: Percentage an infant being overweight at 18 have same on all total duration of breast
feeding groups (breast-feeding duration is not related to overweight at 18)
Persentase bayi yang kelebihan berat badan pada 18 memiliki yang sama pada semua
total durasi menyusui kelompok (durasi menyusui tidak terkait dengan kelebihan berat
badan pada 18)
H1: Breast-feeding duration is related to overweight at 18
Durasi menyusui berhubungan dengan kelebihan berat badan pada 18

7.b. (3)
Pearson Chi-Square test with 3 df
H0: Percentage an infant being obese at 18 have same on all total duration of breast feeding
groups (breast-feeding duration is not related to obese at 18)
Persentase bayi mengalami obesitas pada usia 18 memiliki yang sama pada semua total
durasi kelompok menyusui (durasi menyusui tidak berhubungan dengan obesitas pada
18)
H1: Breast-feeding duration is related to obese at 18
Durasi menyusui berhubungan dengan obesitas pada 18

7.c. (3)
Oneway ANOVA
H0: Mean of BMI at 18 have same on all total duration of breast feeding groups (breast-
feeding duration is not related to BMI at 18)
Berarti BMI pada 18 telah sama pada semua total durasi kelompok menyusui (durasi
menyusui tidak berhubungan dengan BMI di 18)
H1: Breast-feeding duration is related to BMI at 18
Durasi menyusui berkaitan dengan BMI di 18

8. Read the following article by: Elizabeth R. Bertone-Johnson, Brian W. Whitcomb, Janet
W. Rich-Edwards, Susan E. Hankinson, and JoAnn E. Manson published in Am J Epidemiol.
2015; 182(12):1000–1009 entitled:
Baca artikel berikut oleh: Elizabeth R. Bertone-Johnson, Brian W. Whitcomb, Janet W.
Rich-Edwards, Susan E. Hankinson, dan JoAnn E. Manson diterbitkan dalam Am J
Epidemiol. 2015; 182 (12): 1000-1009 berjudul:
“Premenstrual Syndrome and Subsequent Risk of Hypertension in a Prospective Study”
(Article can be downloaded from GAMEL).
Question 8:
Pertanyaan 8:
a. What is population and sample size of this study?
Apa populasi dan sampel ukuran penelitian ini?
15

b. What are variables in this study? What are dependent and independent variables in this
report? Are there any confounding factors?
Apa variabel dalam penelitian ini? Apa dependen dan independen variabel dalam laporan
ini? Apakah ada faktor pengganggu?
c. Please identify all variables in the table 1 of this study; define those variables (operational
definition of each variable), type measurement also scales of each variables from all the
variables in this study. Present your answers in tabular format.
Silahkan mengidentifikasi semua variabel pada tabel 1 penelitian ini; mendefinisikan
variabel (definisi operasional dari masing-masing variabel), jenis pengukuran juga berskala
masing-masing variabel dari semua variabel dalam penelitian ini. Silahkan jawaban Anda
dalam format tabel
d. Show the statistical analysis that support following statement of authors in the abstract:
Tampilkan analisis statistik yang mendukung pernyataan penulis berikut di abstrak:
“The risk associated with PMS was not modified by use of oral contraceptives or
antidepressants but was attenuated among women with high intakes of thiamine and
riboflavin (P < 0.05)”.

Answers 8:
Jawaban 8:
8.a. (2)
The populations is younger women and sample size are 1,257 women with clinically significant
PMS (1991–2005) and 2,463 agematched comparison women with few menstrual symptoms
Populasi adalah wanita yang lebih muda dan ukuran sampel yang 1.257 wanita dengan PMS
yang signifikan secara klinis (1991-2005) dan 2463 usia dicocokkan wanita dibandingkan
dengan beberapa gejala menstruasi

8.b. (6)
Dependent variable : Hypertension as,
Variabel dependen (terikat) : Hypertension
Independent variable : PMS as,
Variabel independen (bebas) : PMS,
Confounding factors : Age, smoking, body mass index, and other risk factors for hypertension
as
Faktor pengganggu : Usia, merokok, indeks massa tubuh, dan risiko lainnya faktor untuk
hipertensi
16

8.c. (15)

No. Name of Operational Definition Scale of


Variable Measurement
1 Hypertension Had received a clinician-made diagnosis of Dichotomous (yes
high blood pressure in the previous 2 years. or no)
Telah menerima diagnosis dokter-make dari
tekanan darah tinggi dalam 2 tahun
sebelumnya
2 Time period Time period (person-months) accrued until Continuous
the diagnosis of hypertension, death, loss to (months)
follow-up, or the end of follow-up in June,
2011 periode waktu (orang-bulan) masih
harus dibayar sampai diagnosis hipertensi,
kematian, mangkir-up, atau akhir tindak
lanjut pada bulan Juni 2011
3 PMS Premenstrual syndrome (PMS) status at Dichotomous (yes
baseline: to identify women who met the or no)
criteria for moderate to severe PMS, including
1) the occurrence of at least 1physical and 1
affective menstrual symptom; 2) overall
symptom severity of moderate or severe or
symptom impact on life activities and social
relationships rated as moderate or severe; 3)
symptoms beginning within 14 days before
menses onset; 4) symptoms ending within 4
days ofmenses onset; and 5) symptoms
absent in the week after menses ends
sindrom pramenstruasi (PMS) status di awal:
untuk mengidentifikasi wanita yang
memenuhi kriteria untuk moderat untuk PMS
parah, termasuk 1) terjadinya minimal 1 fisik
dan 1 gejala menstruasi afektif; 2) keparahan
gejala keseluruhan dampak sedang atau
berat atau gejala pada kegiatan kehidupan
dan hubungan sosial dinilai sebagai sedang
atau berat; 3) gejala dimulai dalam waktu 14
hari sebelum menstruasi onset; 4) gejala
berakhir dalam waktu 4 hari dari menstruasi
onset; dan 5) gejala absen dalam seminggu
setelah menstruasi berakhir
4 Age Age in years Umur dalam tahun Continuous
(years)
5 Body mass index calculate body mass index; weight in kg/ Continuous
height in m ) menghitung indeks massa (kg/m2)
2

tubuh; Berat kg/tinggi dalam m2)


17

No. Name of Operational Definition Scale of


Variable Measurement
6 Physical activity physical activity level (metabolic equivalent of Continuous
task-hours per week) tingkat aktivitas fisik (hr/week)
(metabolisme setara dengan tugas-jam per
minggu)
7 Smoking Status Cigarette smoking (cumulative pack-years) Continuous (pack/
Status Merokok Merokok (kumulatif paket-tahun) years)
8 History of Family history of hypertension (yes or no) Dichotomous (yes
hypertension Riwayat keluarga hipertensi (ya atau tidak) or no)
Sejarah
hipertensi
9 Postmenopausal postmenopausal hormone use (never, 1–71 Ordinal
hormone use months, or ≥72 months) Penggunaan
Penggunaan hormon pascamenopause (tidak pernah, 1-71
hormon bulan, atau ≥72 bulan)
pascamenopause
10 Dietary Dietary Approaches to Stop Hypertension diet Ordinal
Approaches to score (quintiles)
Stop
Hypertension
diet Pendekatan
Diet untuk
Menghentikan
Diet Hipertensi
11 Race Race/ethnicity (white or other) Dichotomous
12 Income Annual household income Ordinal
Pendapatan (<$50,000, $50,000–$99,000, or ≥$100,000)
13 Alcohol daily alcohol consumption (0, 0.1–4.9, 5.0– Ordinal
consumption 9.9, 10.0–14.9, or ≥15 g)
Konsumsi alkohol

8.d. (5)
Using Cox proportional hazard regression models to calculate hazard ratios for measurement
effect with 95% confidence intervals
Menggunakan Cox model regresi proporsional hazard untuk menghitung rasio hazard untuk
efek pengukuran dengan interval kepercayaan 95%

Panduan memberi nilai


No soal Skor/ nilai
1. a 5
2
 a 5
 b 5
18

3
 a 2
 b 2
4
 a 5
 b 5
 c 5
5
 a 2
 b 2
 c 2
6
 a 4
 b 4
 c 2
 d 3
 e 3
 f 5
2
 g
7
 a 3
 b 3
 c 3
8
 a 2
 b 6
 c 15
 d 5
Total 100

Вам также может понравиться