wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
297 stars 2 forks source link

[2022/02/08]推薦・機械学習勉強会 #183

Open zerebom opened 1 year ago

zerebom commented 1 year ago

Why

推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!

発信のため、ここは public にしてあります。外部からの参加をご希望の方は樋口(https://twitter.com/zerebom_3) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!

What

Wantedly では隔週木曜日に

といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!

prev: #181

Hayashi-Yudai commented 1 year ago

In reinforcement learning, slower networks can learn faster

Amazonの強化学習に関するブログ。

DQNを訓練するときには通常の深層学習の訓練時と同じオプティマイザを使うことが多いが、これらのオプティマイザは強化学習の複雑性を十分考慮できていない。なので強化学習モデルの訓練時に最適なオプティマイザを提案した、というブログになっっている。

パラメータ更新の際に、現在のイテレーションでの予測結果と1つ前のイテレーションでの予測結果の両方を使う。

このような更新によって、モデルパラメータの更新はこれまでより遅く、スムーズになる。しかしモデルの性能は従来のモデルよりも良くなる。

image
hakubishin3 commented 1 year ago

OTTO – Multi-Objective Recommender System

https://www.kaggle.com/competitions/otto-recommender-system の上位解法について話したい

nogawanogawa commented 1 year ago

Optimizing push frequency for new users

SmartNewsでのPush通知の頻度最適化の話。

zerebom commented 1 year ago

Pythonで文字列の類似度を120倍高速に計算するRapidFuzzを勧めたい

レーベンシュタイン距離など、文字列同士の類似度を計算するライブラリ。Levensheinライブラリより120倍早い。配列(複数文字列)同士の計算も簡単にできる。小文字可・英数字の抽出なども前処理も高速

小さな分析チームで始めるマイクロデータメッシュ

ELTのTransferは、いくつかの層に分けるアイディアが一般的。mart層をSSoTとして、複数の用途に利用するというアイディアが起点だが、mart層が保守されつづけないと、これは達成できない。

この対策として、個々のドメインに閉じたパイプラインを作るという方法もあるが、似たようなテーブルが乱立するという欠点がある。これを改善して、ドメイン内部の汎用的なテーブルを外部に公開するというアプローチを提案。例えばdbtにはexposure機能があり、外部公開するテーブルを定義できる。

【Kaggle】OTTOコンペ参加記(22th/2587th)🥈

22位でした. CFのPreference Scoreの作り込みとクエリの仕方、1stの多様性等が大事だった