Сергей Николенко
Random facts:
• 19 июня 240 г. до н.э. Эратосфен Киренский очень точно измерил длину земного
меридиана
• 19 июня 1846 г. в Нью-Джерси прошёл первый в истории бейсбольный матч
• 19 июня 1862 г. рабовладение было запрещено на всей территории США, а 19 июня 1865
г. — и в Техасе
• 19 июня 1917 г. Георг V по случаю Первой мировой войны переименовал правящую в
Великобритании Саксон-Кобург-Готскую династию в Виндзорскую
Деревья принятия решений
Weak learners: decision trees
3
Weak learners: decision trees
3
Weak learners: decision trees
3
Weak learners: decision trees
3
Weak learners: decision trees
3
Weak learners: decision trees
3
Weak learners: decision trees
3
Weak learners: decision trees
𝐾
𝑄(X𝜏 ) = ∑ 𝑝𝜏,𝑘 ln 𝑝𝜏,𝑘 .
𝑘=1
3
Weak learners: decision trees
3
Пример
4
Пример
4
Пример
• Обрезанное дерево:
4
Градиентный бустинг
Градиентный бустинг
𝑁 𝐾
Obj = ∑ 𝑙(𝑦𝑖 , 𝑦𝑖̂ ) + ∑ Ω(𝑓𝑘 ).
𝑖=1 𝑘=1
6
Градиентный бустинг
(0)
𝑦𝑖̂ = 0,
(1) (0)
𝑦𝑖̂ = 𝑓1 (𝑥𝑖 ) = 𝑦𝑖̂ + 𝑓1 (𝑥𝑖 ),
(2) (1)
𝑦𝑖̂ = 𝑓1 (𝑥𝑖 ) + 𝑓2 (𝑥𝑖 ) = 𝑦𝑖̂ + 𝑓1 (𝑥2 ),
…,
6
Градиентный бустинг
(𝑡) (𝑡−1)
𝑦𝑖̂ = 𝑦𝑖̂ + 𝑓𝑡 (𝑥𝑖 ), так что
𝑁
(𝑡) (𝑡−1)
Obj = ∑ 𝑙 (𝑦𝑖 , 𝑦𝑖̂ + 𝑓𝑡 (𝑥𝑖 )) + Ω(𝑓𝑡 ) + Const.
𝑖=1
𝑁
(𝑡) (𝑡−1)
Obj = ∑ (2(𝑦𝑖̂ − 𝑦𝑖 )𝑓𝑡 (𝑥𝑖 ) + 𝑓𝑡 (𝑥𝑖 )2 ) + Ω(𝑓𝑡 ) + Const.
𝑖=1
6
Градиентный бустинг
• Чтобы оптимизировать
𝑁
(𝑡) (𝑡−1)
Obj = ∑ 𝑙(𝑦𝑖 , 𝑦𝑖̂ + 𝑓𝑡 (𝑥𝑖 )) + Ω(𝑓𝑡 ) + Const,
𝑖=1
𝜕𝑙(𝑦𝑖 , 𝑦(𝑡−1)
̂ ) 𝜕 2 𝑙(𝑦𝑖 , 𝑦(𝑡−1)
̂ )
𝑔𝑖 = , ℎ𝑖 = 2
,
𝜕 𝑦(𝑡−1)
̂ 𝜕(𝑦(𝑡−1)
̂ )
тогда
𝑁
(𝑡) (𝑡−1) 1
Obj ≈ ∑ (𝑙(𝑦𝑖 , 𝑦𝑖̂ ) + 𝑔𝑖 𝑓𝑡 (𝑥𝑖 ) + ℎ𝑖 𝑓𝑡2 (𝑥𝑖 ))+Ω(𝑓𝑡 )+Const.
𝑖=1
2
• Итак,
𝑁
(𝑡) (𝑡−1) 1
Obj ≈ ∑ (𝑙(𝑦𝑖 , 𝑦𝑖̂ ) + 𝑔𝑖 𝑓𝑡 (𝑥𝑖 ) + ℎ𝑖 𝑓𝑡2 (𝑥𝑖 ))+Ω(𝑓𝑡 )+Const.
𝑖=1
2
• Уберём константы:
𝑁
(𝑡) 1
Obj ≈ ∑ (𝑔𝑖 𝑓𝑡 (𝑥𝑖 ) + ℎ𝑖 𝑓𝑡2 (𝑥𝑖 )) + Ω(𝑓𝑡 ).
𝑖=1
2
6
Градиентный бустинг
𝐺𝑗 (𝑡) 1 𝑇 𝐺2𝑗
𝑤𝑗∗ = − , Obj ≈− ∑ + 𝛾𝑇 .
𝐻𝑗 + 𝜆 2 𝑗=1 𝐻𝑗 + 𝜆
6
Градиентный бустинг
6
Градиентный бустинг
6
Градиентный бустинг
6
MatrixNet
7
CatBoost
𝑁
∑𝑗=1 [𝑥𝑖𝑗 = 𝑥𝑖𝑘 ] ⋅ 𝑦𝑗
𝑥𝑘𝑖̂ = 𝑁
.
∑𝑗=1 [𝑥𝑖𝑗 = 𝑥𝑖𝑘 ]
8
CatBoost
𝔼 [𝑥𝑖̂ ∣ 𝑦 = 𝑣] = 𝔼 [𝑥𝑖𝑘̂ ∣ 𝑦𝑘 = 𝑣] .
8
CatBoost
∑𝑥 [𝑥𝑖𝑗 = 𝑥𝑖𝑘 ] ⋅ 𝑦𝑗 + 𝑎𝑃
𝑗 ∈𝐷𝑘
𝑥𝑖𝑘̂ = ,
∑𝑥 [𝑥𝑖𝑗 = 𝑥𝑖𝑘 ] + 𝑎
𝑗 ∈𝐷𝑘
8
Спасибо!
Спасибо за внимание!