hkefka385 / paper_reading

3 stars 1 forks source link

How to Learn from Others: Transfer Machine Learning with Additive Regression Models to Improve Sales Forecasting #43

Open hkefka385 opened 4 years ago

hkefka385 commented 4 years ago

0. 論文

Journal/Conference: Arxive 2020 Title: How to Learn from Others: Transfer Machine Learning with Additive Regression Models to Improve Sales Forecasting Authors: Robin Hirt, Niklas Kühl, Yusuf Peker, Gerhard Satzger URL: https://arxiv.org/abs/2005.10698

1. どんなもの?

1変量時系列の転移学習の可能性を検討

2. 先行研究と比べてどこがすごい?

3. 技術や手法のキモはどこ?

4. どうやって有効だと検証した?

2つのチェーン点 × 3店舗のデータを用いて転移学習 (zero-shot/adaptaion)を行い売上の予測が可能かどうかを検討した

5. 議論はある?

6.次に読むべき論文は?

議論されている事例がこのデータに特化した部分であり,あまり時系列全般の情報は得られなかったのでは? 転移学習の可能性を示唆できたものの,どういった場合に時系列モデルの転移学習が上手くいくか?などの点を考える必要は今後ともありそう

メモ

Abst 時系列モデルのTransfer

1 Introduction 時系列予測の問題 ・モデル学習に時間が必要 ・重要な学習データを使えない → Transfer Modelの適用 時系列 + ゼロショット学習の例 (ただし分類問題?) K. Hopf, M. Sodenkamp, S. Riechel, and T. Staake, “Predictive Cus- tomer Data Analytics—The Value of Public Statistical Data and the Geographic Model Transferability,” in ICIS 2017: Transforming Society with Digital Innovation, 2017.

2 Research Questions RQ1:1変量時系列予測問題について取り扱う RQ2:同じ業種の別の店舗データの転移は可能なのか? (zero-shot問題) RQ3:適応させたモデルのパフォーマンスを検証

3 Related Work & contribution to theory Transfer MLの3つの問題:what, how and when to transfer. →本研究では,予測モデルがwhenうまく機能するかに着目 (+ how)

提案モデルの貢献 ・2つのチェーン点と3つの支店 ・転移を用いたモデル

4 USE Case: sales forecasting restaurant chains 店舗データを用いて4つのシナリオを設定 RQ1の問題のために2016年を(まで)をtrainingとして2017年をテストとして設定 (1a. 1b) 2: 2016年までのデータで学習してZero-shotの転移学習 3: 2015年までのデータで学習して2016年をTargetとして適応学習

5 SALES FORECASTING WITH ISOLATED MACHINE LEARNING 1a: 各支店ごとにモデルを学習 1b前支店のすべてのデータを利用して学習 A Method 使用モデルはAdditive regression model (Prophetライブラリの使用) → 式3でモデルを調整 異なるレベルの周期性のモデル化→フーリエ級数を用いることでモデル化可能? S. J. Taylor and B. Letham, “Forecasting at Scale,” The American Statistician, pp. 0–0, 2017. A. C. Harvey and N. Shephard, “Structural Time Series Models,” in Handbook of Statistics, 1993, vol. 11, no. 1989, pp. 261–302.

B Results: isolated ML

6 Sales forecasting with transfer ML

現在の研究の状態では、我々は2つのブランチ間のデータ交換しか考慮していないため、「システム」全体のブランチ間で利用可能なすべてのデータの可能性を十分に活用していません。様々な支店間でモデルを移動させ、それによって売上予測モデルをさらに一般化し、強化するという選択肢があるかも