nogawanogawa / paper_memo

4 stars 0 forks source link

Greykite: Deploying Flexible Forecasting at Scale at LinkedIn #69

Closed nogawanogawa closed 1 year ago

nogawanogawa commented 1 year ago

論文URL

https://dl.acm.org/doi/10.1145/3534678.3539165

著者

Reza Hosseini, Albert Chen, Kaixu Yang, Sayan Patra, Yi Su

会議

kdd 2022

背景

linkedinでは、施策やリソースの検討のため、時系列モデルを使用している。 既存のツールでは、学習に時間がかかったり、ドメイン知識を柔軟に取り込んだり、結果を解釈したりするのを簡単に行うことが難しい。

目的

簡単に使える高速かつ柔軟にカスタム可能で、解釈可能な時系列モデリングの使用

アプローチ

image

ひとことメモ

使ってみた記事

nogawanogawa commented 1 year ago

背景

linkedinでは、パフォーマンス管理やリソース管理のため、時系列モデルを使用している。 既存のツールでは、学習に時間がかかったり、ドメイン知識を柔軟に取り込んだり、結果を解釈したりするのを簡単に行うことが難しい。

nogawanogawa commented 1 year ago

目的

簡単に使える高速かつ柔軟にカスタム可能で、解釈可能な時系列モデリングの使用

アプローチ

nogawanogawa commented 1 year ago

Silverkite

Greykiteで使用しているSilverkiteでは大きく2段階の処理で構成されている。

  1. 条件付き平均のモデリング
    1. 特徴量抽出
    2. 基底関数に変換(スケーリング等)
    3. 変化点検出
    4. 共変量にアルゴリズムの適用
  2. ボラティリティ/不確実性モデル
    1. 条件付き平均モデリングが残差に適用

条件付きモデリング

目的変数Yの条件付き平均は下記の式で表現される

image

これらを使用してモデルに投入することで、時系列モデリングを行う。 (デフォルト:ridge回帰らしい?)

ボラティリティ/不確実性モデル

ボラティリティ/不確実性モデルは条件付き平均モデルとは別に適用される。 条件付き平均モデルと実測値との乖離ををもとにモデルの予測区間を予測するらしい。 (あんまわかってない)

nogawanogawa commented 1 year ago

モデリング例

全体像

image

まず季節性と相互作用に関する分析を行う。

image

次にトレンド、周期性の抽出と、それらの変化点検値を"自動で"行う。

image

これらを用いてモデリングを行い、結果を出力する

image

image

これらの出力によって解釈を用意にしている。

nogawanogawa commented 1 year ago

評価

image

1つのケースを除いてMASEは良くなってそう。

image

実行時間的にも、学習は早そう。推論はSARIMAのケースを除外してみれば良さそうに見える。

nogawanogawa commented 1 year ago

実務への適用

Performance Management

LinkedIn Premium の異常を検出し、影響の重大性を評価するのに役立った例

image

収益予測に役立った例

image

Resource Management

インフラのキャパシティプランニングにも使用している

image