Вы находитесь на странице: 1из 6

Mann WhitneyU Test of Significance

This example deals with two sets of sample data from two contrasting urban areas, area X and area
Y, with the aim of comparing them and demonstrating differences. There are eight pairs of data in
this example.

Tests of significance are used to tell us whether the differences between the two sets of sample data
are truly significant or whether these differences could have occurred by chance. Tests of
significance tell us the probability level that differences between the two areas, X and Y are due to
chance.

First, examine the two data sets to decide whether differences appear to exist which warrant further
investigation.

The sample sets are:

Area X: 7; 3; 6; 2; 4; 3; 5; 5

Area Y: 3; 5; 6; 4; 6; 5; 7; 5

Area Mean Median Mode


X 4.38 4.5 5
Y 5.13 5.0 5

The difference between the means for the two sets of data warrants further investigation, to test the
statistical significance of the difference.

THE MANN-WHITNEY U TEST

Stage 1: Call one sample A and the other B.

Stage 2: Place all the values together in rank order (i.e. from lowest to highest). If there are two
samples of the same value, the 'A' sample is placed first in the rank.

Stage 3: Inspect each 'B' sample in turn and count the number of 'A's which precede (come before)
it. Add up the total to get a U value.

Stage 4: Repeat stage 3, but this time inspect each A in turn and count the number of B's which
precede it. Add up the total to get a second U value.

Stage 5: Take the smaller of the two U values and look up the probability value in the table below.
This gives the percentage probability that the difference between the two sets of data could have
occurred by chance.

Example: Is there a significant difference in the quality of the architecture between El Raval (site
3); and El Raval (site 4)?

Stage 1:

Site 3: (Sample A) 7; 3; 6; 2; 4; 3; 5; 5

Site 4: (Sample B) 3; 5; 6; 4; 6; 5; 7; 5

Stage 2:

A A A B A B A A B B B A B B A B
2 3 3 3 4 4 5 5 5 5 5 6 6 6 7 7
Stage 3: U= 3+4+6+6+6+7+7+8 = 47

Stage 4: U= 0+0+0+1+2+2+5+7 = 17

Stage 5: U= 17

The critical value from the table = 6.5

The probability that the quality of the architecture measured in Site 4 is better than Site 3 just by
chance is 6.5 per cent.

If you find that there is a significant probability that the differences could have occurred by chance,
this can mean:

1. Either the difference is not significant and there is little point in looking further for explanations
of it, OR

2. Your sample is too small. If you had taken a larger sample, you might well find that the result of
the test of significance changes: the difference between the two areas becomes more certain.

It is not possible to tell which of these conclusions is the correct one from the result of the test
itself. Statistics are only a tool and can never replace good geographical thinking.


1 2 3 4 5 6 7 8
u
0 11.1 2.2 0.6 0.2 0.1 0.0 0.0 0.0
1 22.2 4.4 1.2 0.4 0.2 0.1 0.0 0.0
2 33.3 8.9 2.4 0.8 0.3 0.1 0.1 0.0
3 44.4 13.3 4.2 1.4 0.5 0.2 0.1 0.1
4 55.6 20.0 6.7 2.4 0.9 0.4 0.2 0.1
5 26.7 9.7 3.6 1.5 0.6 0.3 0.1
6 35.6 13.9 5.5 2.3 1.0 0.5 0.2
7 44.4 18.8 7.7 3.3 1.5 0.7 0.3
8 55.6 24.8 10.7 4.7 2.1 1.0 0.5
9 31.5 14.1 6.4 3.0 1.4 0.7
10 38.7 18.4 8.5 4.1 2.0 1.0
11 46.1 23.0 11.1 5.4 2.7 1.4
12 53.9 28.5 14.2 7.1 3.6 1.9
13 34.1 17.7 9.1 4.7 2.5
14 40.4 21.7 11.4 6.0 3.2
15 46.7 26.2 14.1 7.6 4.1
16 53.3 31.1 17.2 9.5 5.2
17 36.2 20.7 11.6 6.5
18 41.6 24.5 14.0 8.0
19 47.2 28.6 16.8 9.7
Mann WhitneyU Uji Signifikansi
Contoh ini berkaitan dengan dua set data sampel dari dua daerah perkotaan kontras, daerah Y X dan daerah,
dengan tujuan membandingkan mereka dan menunjukkan perbedaan. Ada delapan pasang data dalam contoh
ini.
Pengujian signifikansi yang digunakan untuk memberitahu kami apakah perbedaan antara dua set data sampel
yang benar-benar signifikan atau apakah perbedaan ini bisa terjadi secara kebetulan. Pengujian signifikansi
memberitahu kita tingkat probabilitas bahwa perbedaan antara kedua daerah, X dan Y adalah karena
kebetulan.
Pertama, memeriksa dua data set untuk memutuskan apakah perbedaan muncul ada yang memerlukan
penyelidikan lebih lanjut.
Set sampel:
Daerah X: 7, 3, 6, 2, 4, 3, 5, 5
Daerah Y: 3, 5, 6, 4, 6, 5, 7, 5
Berarti wilayah Modus Median
X 4.38 5 4.5
Y 5.13 5.0 5
Perbedaan antara sarana untuk dua set data yang waran penyelidikan lebih lanjut, untuk menguji signifikansi
statistik perbedaan.

THE MANN-WHITNEY U UJI


Tahap 1: Panggil satu sampel A dan B. lainnya
Tahap 2: Tempatkan semua nilai bersama dalam urutan peringkat (yaitu dari terendah hingga tertinggi). Jika
ada dua sampel dari nilai yang sama, 'A' sampel ditempatkan pertama di peringkat tersebut.
Tahap 3: Periksa setiap 'B' sampel pada gilirannya dan menghitung jumlah 'A yang mendahului (datang
sebelum) itu. Menjumlahkan total untuk mendapatkan nilai U.
Tahap 4: Ulangi tahap 3, tapi kali ini memeriksa setiap A pada gilirannya dan menghitung sejumlah B yang
mendahuluinya. Menjumlahkan total untuk mendapatkan nilai U kedua.
Tahap 5: Ambil lebih kecil dari dua nilai U dan mencari nilai probabilitas dalam tabel di bawah ini. Hal ini
memberikan kemungkinan bahwa persentase perbedaan antara dua set data bisa terjadi secara kebetulan.
Contoh: Apakah ada perbedaan yang signifikan dalam kualitas arsitektur antara El Raval (situs 3), dan El Raval
(situs 4)?
Tahap 1:
Site 3: (Contoh A) 7, 3, 6, 2, 4, 3, 5, 5
Site 4: (Contoh B) 3, 5, 6, 4, 6, 5, 7, 5
Tahap 2:
AAABABAABBBABBAB
2333445555566677

Tahap 3: U = 3 +4 +6 +6 +6 +7 +7 +8 = 47
Tahap 4: U = 0 +0 +0 +1 +2 +2 +5 +7 = 17
Tahap 5: U = 17
Nilai kritis dari tabel = 6,5
Probabilitas bahwa kualitas arsitektur diukur dalam Site 4 lebih baik dari Situs 3 hanya kebetulan adalah 6,5
persen.
Jika Anda menemukan bahwa ada kemungkinan yang signifikan bahwa perbedaan bisa saja terjadi secara
kebetulan, ini dapat berarti:
1. Entah perbedaan tersebut tidak signifikan dan ada gunanya mencari penjelasan lebih lanjut untuk itu, OR
2. Sampel Anda terlalu kecil. Jika Anda telah mengambil sampel yang lebih besar, Anda mungkin menemukan
bahwa hasil dari uji perubahan signifikansi: perbedaan antara dua daerah menjadi lebih pasti.
Hal ini tidak mungkin untuk membedakan mana kesimpulan ini adalah yang benar dari hasil tes itu sendiri.
Statistik hanya alat dan tidak pernah dapat menggantikan pemikiran geografis yang baik.
Mann-Whitney U-Test
aka Mann-Whitney-Wilcoxon (MWW)

or Wilcoxon Rank-Sum Test


Non-parametric tests are basically used in order to overcome the underlying assumption of normality in
parametric tests. Quite general assumptions regarding the population are used in these tests.

by Amit Choudhury (2009)

A case in point is the Mann-Whitney U-test (Also known as the Mann-Whitney-Wilcoxon (MWW) or
Wilcoxon Rank-Sum Test). Unlike its parametric counterpart, the t-test for two samples, this test does
not assume that the difference between the samples is normally distributed, or that the variances of the
two populations are equal. Thus when the validity of the assumptions of t-test are questionable, the
Mann-Whitney U-Test comes into play and hence has wider applicability.

The Method

The Mann-Whitney U-test is used to test whether two independent samples of observations are drawn
from the same or identical distributions. An advantage with this test is that the two samples under
consideration may not necessarily have the same number of observations.

This test is based on the idea that the particular pattern exhibited when 'm' number of X random
variables and 'n' number of Y random variables are arranged together in increasing order of magnitude
provides information about the relationship between their parent populations.

The Mann-Whitney test criterion is based on the magnitude of the Y's in relation to the X's, i.e. the
position of Y's in the combined ordered sequence. A sample pattern of arrangement where most of the
Y's are greater than most of the X's or vice versa would be evidence against random mixing. This
would tend to discredit the null hypothesis of identical distribution.

Assumptions

The test has two important assumptions. First the two samples under consideration are random, and are
independent of each other, as are the observations within each sample. Second the observations are
numeric or ordinal (arranged in ranks).

How to Calculate the Mann-Whitney U

In order to calculate the U statistics, the combined set of data is first arranged in ascending order with
tied scores receiving a rank equal to the average position of those scores in the ordered sequence.

Let T denote the sum of ranks for the first sample. The Mann-Whitney test statistic is then calculated
using U = n1 n2 + {n1 (n1 + 1)/2} - T , where n1 and n2 are the sizes of the first and second samples
respectively.

An Example

An example can clarify better. Consider the following samples.

Sample A

Observation 25 25 19 21 22 19 15

Rank 15.5 15.5 9.5 13 14 9.5 3.5

Sample B
Observation 18 14 13 15 17 19 18 20 19

Rank 6.5 2 1 3.5 5 9.5 6.5 12 9.5

Here, T = 80.5, n1 = 7, n2 = 9.Hence, U = (7 * 9) + [{7 * (7+1)}/2] - 80.5 = 10.5.

We next compare the value of calculated U with the value given in the Tables of Critical Values for the
Mann-Whitney U-test, where the critical values are provided for given n1 and n2 , and accordingly
accept or reject the null hypothesis. Even though the distribution of U is known, the normal distribution
provides a good approximation in case of large samples.

Hypothesis On Equality of Medians

Often this statistic is used to compare a hypothesis regarding equality of medians. The logic is simple -
since the U statistic tests if two samples are drawn from identical populations, equality of median
follow.

As a Counterpart of T-Test

The Mann-Whitney U test is truly the non parametric counterpart of the two sample t-test. To see this,
one needs to recall that the t-test tests for equality of means when the underlying assumptions of
normality and equality of variance are satisfied. Thus the t-test tests if the two samples have been
drawn from identical normal population. The Mann-Whitney U test is its generalization.

Read more: http://www.experiment-resources.com/mann-whitney-u-test.html#ixzz29Iftsrei

Non-parametrik tes pada dasarnya digunakan untuk mengatasi asumsi yang mendasari normalitas dalam tes
parametrik. Asumsi yang cukup umum mengenai penduduk yang digunakan dalam tes ini.

Sebuah kasus di titik adalah Mann-Whitney U-test (Juga dikenal sebagai Uji Mann-Whitney-Wilcoxon (MWW)
atau Wilcoxon Rank-Sum). Tidak seperti rekan nya parametrik, t-test untuk dua sampel, tes ini tidak
mengasumsikan bahwa perbedaan antara sampel biasanya didistribusikan, atau bahwa varians dari dua
populasi adalah sama. Jadi ketika validitas asumsi t-test dipertanyakan, Mann-Whitney U-Test datang ke dalam
bermain dan karenanya memiliki penerapan yang lebih luas.

Metode
The Mann-Whitney U-test digunakan untuk menguji apakah dua sampel independen pengamatan diambil dari
distribusi yang sama atau identik. Keuntungan dengan tes ini adalah bahwa dua sampel yang dipertimbangkan
belum tentu memiliki jumlah yang sama dari pengamatan.
Tes ini didasarkan pada gagasan bahwa pola tertentu dipamerkan ketika nomor 'm' variabel acak X dan nomor
'n' variabel Y acak disusun bersama-sama dalam meningkatkan urutan besarnya memberikan informasi tentang
hubungan antara populasi induknya.
The Mann-Whitney tes kriteria didasarkan pada besarnya itu Y dalam kaitannya dengan X, yaitu posisi yang Y di
urutan memerintahkan gabungan. Pola sampel pengaturan di mana sebagian besar Y yang lebih besar dari
sebagian besar X atau sebaliknya akan menjadi bukti terhadap pencampuran acak. Hal i ini akan cenderung
mendiskreditkan hipotesis nol distribusi identik.

asumsi
Tes ini memiliki dua asumsi penting. Pertama dua sampel yang dipertimbangkan adalah acak, dan independen
satu sama lain, seperti pengamatan dalam setiap sampel. Kedua pengamatan yang numerik atau ordinal
(diatur dalam jajaran).
Cara Menghitung Mann-Whitney U
Dalam rangka untuk menghitung statistik U, set gabungan dari data pertama kali disusun dalam urutan dengan
skor terikat menerima peringkat sama dengan posisi rata-rata dari mereka nilai dalam urutan memerintahkan.
Biarkan T menunjukkan jumlah peringkat untuk sampel pertama. Uji statistik Mann-Whitney kemudian
dihitung dengan menggunakan U = n1 n2 + {n1 (n1 + 1) / 2} - T, di mana n1 dan n2 adalah ukuran dari sampel
pertama dan kedua masing-masing.
Contoh sebuah
Sebuah contoh dapat memperjelas lebih baik. Perhatikan contoh berikut.
Contoh A
Pengamatan 25 25 19 21 22 19 15
Urutkan 15,5 15,5 9,5 13 14 9,5 3,5

sampel B
Pengamatan 18 14 13 15 17 19 18 20 19
Peringkat 2 6,5 1 3,5 5 9,5 6,5 12 9,5
Di sini, T = 80,5, n1 = 7, n2 = 9.Hence, U = (7 * 9) + [{7 * (7 +1)} / 2] - 80,5 = 10,5.
Kami selanjutnya membandingkan nilai U dihitung dengan nilai yang diberikan dalam Tabel Nilai
Kritis untuk Mann-Whitney U-test, di mana nilai-nilai penting yang disediakan untuk n1 diberikan dan
n2, dan karenanya menerima atau menolak hipotesis nol. Meskipun distribusi U diketahui, distribusi
normal memberikan pendekatan yang baik dalam kasus sampel besar.
Hipotesis Pada Kesetaraan median
Seringkali statistik ini digunakan untuk membandingkan hipotesis mengenai kesetaraan median.
Logikanya sederhana - karena tes statistik U jika dua sampel diambil dari populasi yang sama,
kesetaraan tindak median.
Sebagai Counterpart T-Test
Uji Mann-Whitney U adalah benar-benar mitra non parametrik dari sampel dua t-test. Untuk melihat
ini, kita perlu mengingat bahwa t-test tes untuk kesetaraan berarti ketika asumsi yang mendasari
normalitas dan kesamaan varians puas. Dengan demikian t-test tes jika dua sampel telah diambil dari
populasi normal identik. Uji Mann-Whitney U adalah generalisasi.

Вам также может понравиться