Open yu-ya4 opened 3 years ago
https://www.m3tech.blog/entry/sdcg
セッション単位で検索結果を評価するための指標 sDCG について実例込みで紹介されている. ユーザの行動に3つの仮定を置くことでクエリ修正による再検索をシンプルな形で評価できるようになっているのが面白いなって思ったけど, 普段使ってるnDCGとかもユーザの行動に仮定を置いているわけであんまり意識してないまま使うのよくないなーって思いました.
https://github.com/DeNA/HandyRL
Pytorch ベースのライブラリ. 中身をちゃんと見れていないけど, 強化学習を使うときのベースラインとして使えそうな設計になっているみたいで, Kaggle とかで機会あれば使いたい https://twitter.com/cute_na_piglets/status/1367476122661756928 .
https://web.ec.tuwien.ac.at/webtour21/?page_id=27
ワークショップの時間: 3/12 19:00 - 23:00 (JST)
https://twitter.com/kaggle_araisan/status/1369615450594668544
Self-supervised Contrastive Learning を使った画像の特徴量抽出について紹介している. コンペ中なので Twitter のリンクを貼るだけに留める (これならセーフ...?)
https://engineering.atspotify.com/2021/03/10/spotifys-new-experimentation-coordination-strategy/
Spotify の オンラインテスト用プラットフォームの話. 正直あんまよくわかっていない.
非排他的にならざるを得ない何百もの実験を効率的に回すために「Backet Reuse」を導入. ユーザをバケットにハッシュ化して, バケットを全ての実験のサンプリングで利用可能な状態にする (サンプリングはバケット単位で, 処理の割り当てはユーザ単位で) . 非排他的な対照実験でバケットを再利用している場合, Treatment Effect の推定量はこのバケットサンプリングの影響を受けない(なので, 普通に t 検定するだけでいいらしい)
『Evaluation of Neural Architectures Trained with Square Loss vs Cross-Entropy in Classification Tasks』 https://arxiv.org/abs/2006.07322
https://ai-scholar.tech/articles/deep-learning/closs-square
『Dynamic Data Testing』 https://medium.com/anomalo-hq/dynamic-data-testing-f831435dba90
https://twitter.com/icoxfog417/status/1365930959305019394
組織のビジネス上の意思決定やプロダクトの変更などの内部要因や、ユーザの行動やマーケットの変化などの外部要因など様々なものからデータは影響を受ける。一方で、データは様々な重要な意思決定やプロダクトの価値提供に利用するため、できるだけ正しい状態を担保したい。データはソフトウェアとは性質が大きく異なるので、データならではのテストを行う必要がある。
データのテスト手法を以下のように分類して解説。実践したい。。。!
実践したい。。。!
https://twitter.com/ImAI_Eruel/status/1368766314194497539
『Attention is Not All You Need: Pure Attention Loses Rank Doubly Exponentially with Depth』 https://arxiv.org/abs/2103.03404
何もワカラン。読んでない。
関係ない小ネタだけど面白かったので紹介。笑
『任意の自然数nについて2^n>n』の証明選手権 https://twitter.com/mathlava/status/1369233140783357953
2 が 3 よりも小さいことの証明。 https://twitter.com/ayoiyouyoeyo/status/1369268616391061505
行列の積 https://twitter.com/potetoichiro/status/1366881305472868355
https://www.machinelearningplus.com/plots/top-50-matplotlib-visualizations-the-master-plots-python/ matplotlibとseabornによる情報を伝えるためのグラフについての記事。グラフの完成度が高く、code snipetもついてきて参考になる。細かなテクニックが紹介されていて面白い
encircling
: グラフ上の範囲を指定してPolygonを描く。stripplot
: 同じ範囲にデータが被ってしまう時に、少しずらして描く。joyplot
というパッケージがある。 カテゴリごとに、複数の分布を簡単に可視化することができる。statsmodels.tsa.seasonal.seasonal_decompose
と組み合わせて、数行で時系列plotを行っている。https://www.m3tech.blog/entry/2020/03/03/180000 「Bayesian Personalized Ranking for Novelty Enhancement」について日本語でまとめていて、実際にシュミレーションを行っている記事。
『会社訪問アプリ「Wantedly Visit」のデータで見る相互推薦システム』 https://speakerdeck.com/yuya4/deim2021-rrs-wantedly-visit
2021年3月2日 DEIM2021 (https://db-event.jpn.org/deim2021/) における技術報告の資料です。
[F21] 情報検索・情報推薦④ 3月2日 10:00 ~ 11:40 https://cms.deim-forum.org/deim2021/program/?oral#/F21
会社訪問アプリ「Wantedly Visit」の実データを用いて、相互推薦システムの既存手法の評価実験を行った上で、出てきた課題に対する改善手法を提案して評価実験を行いその有用性を検証しました
Why
推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!
発信のため、ここは public にしてあります。外部からの参加をご希望の方は松村(https://twitter.com/yu__ya4) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!
What
Wantedly では隔週木曜日に
といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。
話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!
prev: #88