Open zerebom opened 1 year ago
Amazonの強化学習に関するブログ。
DQNを訓練するときには通常の深層学習の訓練時と同じオプティマイザを使うことが多いが、これらのオプティマイザは強化学習の複雑性を十分考慮できていない。なので強化学習モデルの訓練時に最適なオプティマイザを提案した、というブログになっっている。
パラメータ更新の際に、現在のイテレーションでの予測結果と1つ前のイテレーションでの予測結果の両方を使う。
このような更新によって、モデルパラメータの更新はこれまでより遅く、スムーズになる。しかしモデルの性能は従来のモデルよりも良くなる。
https://www.kaggle.com/competitions/otto-recommender-system の上位解法について話したい
SmartNewsでのPush通知の頻度最適化の話。
レーベンシュタイン距離など、文字列同士の類似度を計算するライブラリ。Levensheinライブラリより120倍早い。配列(複数文字列)同士の計算も簡単にできる。小文字可・英数字の抽出なども前処理も高速
ELTのTransferは、いくつかの層に分けるアイディアが一般的。mart層をSSoTとして、複数の用途に利用するというアイディアが起点だが、mart層が保守されつづけないと、これは達成できない。
この対策として、個々のドメインに閉じたパイプラインを作るという方法もあるが、似たようなテーブルが乱立するという欠点がある。これを改善して、ドメイン内部の汎用的なテーブルを外部に公開するというアプローチを提案。例えばdbtにはexposure機能があり、外部公開するテーブルを定義できる。
22位でした. CFのPreference Scoreの作り込みとクエリの仕方、1stの多様性等が大事だった
Why
推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!
発信のため、ここは public にしてあります。外部からの参加をご希望の方は樋口(https://twitter.com/zerebom_3) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!
What
Wantedly では隔週木曜日に
といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。
話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!
prev: #181