Академический Документы
Профессиональный Документы
Культура Документы
Data diatas memiliki artibut outlook, temp, humidity dan wind dan class nya decision yang bernilai yes dan
no. data tersebut memiliki 14 kasus yang terdiri 9 yes dan 5 no. Pertama kita hitung entropy decision nya.
Entropy(Decision) = – p(No) . log2p(No) – p(Yes) . log2p(Yes)
Entropy(Decision) = 0.940
kemudian kita hitung entropy untuk masing-masing nilai atribut outlook sebagai berikut:
• outlook = sunny
Ada 2 kasus dengan decision = yes dan 3 kasus dengan decision = no saat outlook = sunny, dengan demikian
kita hitung entropy nya.
Entropy(Decision|Outlook=Sunny) = 0.971
• outlook = overcast
Ada 4 kasus dengan decision = yes dan 0 kasus dengan decision = no saat outlook = sunny, dengan demikian
kita hitung entropy nya.
Entropy(Decision|Outlook=Overcast) = 0
• outlook = rain
Ada 3 kasus dengan decision = yes dan 2 kasus dengan decision = no saat outlook = sunny, dengan demikian
kita hitung entropy nya.
Entropy(Decision|Outlook=Rain) = 0.971
Dengan metode yang sama, kita hitung information gain untuk atribut lainnya.
Pada outlook sunny ada 5 kasus dan memiliki nilai 2 yes dan nilai 3 no. Karena itu atribut dengan nilai
information gain terbesar dipilih menjadi internal node. kita mulai dulu dari artibut temp.
Ada 0 kasus dengan decision = yes dan 3 kasus dengan decision = no saat outlook = sunny, dengan demikian
kita hitung entropy nya.
Entropy(Outlook=Sunny | temp=hot) = 0
• outlook = sunny | temp=mild
Ada 1 kasus dengan decision = yes dan 1 kasus dengan decision = no saat outlook = sunny, dengan demikian
kita hitung entropy nya.
Entropy(Outlook=Sunny | temp=mild) = 1
Ada 1 kasus dengan decision = yes dan 0 kasus dengan decision = no saat outlook = sunny, dengan demikian
kita hitung entropy nya.
Entropy(Outlook=Sunny | temp=cool) = 0
Dengan metode yang sama, kita hitung information gain untuk atribut lainnya.
Karena humidity memiliki gain tertinggi maka dipilih menjadi internal node.
Pada humidity high hanya memiliki 3 kasus dan semuanya memiliki nilai no (Sum(Total) / Sum(no) = 3/3 = 1)
dan tidak ada nilai yes. Dengan demikian humidity high langsung menjadi leaf node.
Pada humidity normal hanya memiliki 2 kasus dan semuanya memiliki nilai yes (Sum(Total) / Sum(yes) = 2/2
= 1) dan tidak ada nilai no. Dengan demikian humidity high langsung menjadi leaf node.
Kita lanjut pada outlook rain, ada 5 kasus dan memiliki nilai 3 yes dan nilai 2 no. Karena itu atribut dengan
nilai information gain terbesar dipilih menjadi internal node.
Didapatkan bahwa gain paling tinggi adalah wind. Maka wind dipilih menjadi internal node.
Pada wind strong hanya memiliki 2 kasus dan semuanya memiliki nilai no (Sum(Total) / Sum(n0) =2/2 = 1)
dan tidak ada nilai yes. Dengan demikian wind strong langsung menjadi leaf node.