Open tm4roon opened 4 years ago
勾配ブースティング木(GBDT: Gradient Boosting Decision Tree)をベースとしたアルゴリズム(ツール)。
分類タスク時も回帰木を利用し、予測値を予測確率として算出する。過学習を抑制するために、目的関数における正則化項に加えて、shrinkageやsubsamplingを行っている。
また、計算時間を抑えるために分割点探索時には、Approximate algorithmを利用する (分割候補点をパーセンタイルで取る)。大規模なデータを利用する場合には、このパーセンタイルを求めるのに時間が掛かってしまうため、Weighted Quantile Sketchにより高速化を行っている。
さらに、欠損値やスパースなデータにも対応できるように、Sparsity-aware Split Findingを行っている。欠損データを右寄せと左寄せの両方を試し、最適な分割を探索する。
XGBoost: A Scalable Tree Boosting System
勾配ブースティング木(GBDT: Gradient Boosting Decision Tree)をベースとしたアルゴリズム(ツール)。
分類タスク時も回帰木を利用し、予測値を予測確率として算出する。過学習を抑制するために、目的関数における正則化項に加えて、shrinkageやsubsamplingを行っている。
また、計算時間を抑えるために分割点探索時には、Approximate algorithmを利用する (分割候補点をパーセンタイルで取る)。大規模なデータを利用する場合には、このパーセンタイルを求めるのに時間が掛かってしまうため、Weighted Quantile Sketchにより高速化を行っている。
さらに、欠損値やスパースなデータにも対応できるように、Sparsity-aware Split Findingを行っている。欠損データを右寄せと左寄せの両方を試し、最適な分割を探索する。
文献情報