wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
306 stars 2 forks source link

[2021/02/10]推薦・機械学習勉強会 #86

Open yu-ya4 opened 3 years ago

yu-ya4 commented 3 years ago

Why

推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!

発信のため、ここは public にしてあります。外部からの参加をご希望の方は松村(https://twitter.com/yu__ya4) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!

What

Wantedly では隔週木曜日に

といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!

prev: #85

zerebom commented 3 years ago

精度向上のために機械学習プロダクト全体をフルスクラッチで書き直した話

https://yag-ays.github.io/article/refactor-them-all/ Ubieのyagさんの業務での体験。

OCR→NLPタスクを解くシステムの開発にて、既存のシステムが

という状態だったため、フルスクラッチで再開発した。

というアプローチで対応した。

感想

自分も研究でVoxelデータのデバッグの辛さや、過去のスパゲッティコードに悩まされていたのですごく共感できました。 本記事で言及されている、ドメイン知識を詰めたデータクラスを作る作業は自分もやったのですが、 コードの見通しを良くするのにかなりコスパのよい手法だったと思ってます。

インスタグラムの投稿減少とEC事業強化

投稿減少→閲覧時間減少→収入減少になため、他のサービスで収益追加を狙っていそう。 ファッション系は他の人の投稿から商品の質などの確認が出来るので相性が良さそう。

『ウェブ最適化ではじめる機械学習』を出版しました。

https://tjo.hatenablog.com/entry/2020/12/15/220000 https://tushuhei.com/blog/introduction-to-machine-learning-with-web-optimization/

A/BテストなどWeb最適化をベイズなど統計モデルで評価する本。 Numpy PyMC3によるコード例があるのが良さそう。輪読に向いている👀 ?

yu-ya4 commented 3 years ago

Gunosy の推薦アルゴリズムについてのブログ

『グノシーのパーソナライズアルゴリズムを刷新した話 (モデル編)』 https://data.gunosy.io/entry/news-recommendation-model

けっこう具体的にアルゴリズムの説明していてすごいなと思った。

CTRをベースにしたパーソナライズアルゴリズムであるため、CTRが高くなってしまう扇情的な記事がリスト上部に並びやすくなる

こちらは推薦システムあるあるだなと思ったので、いろんな話聞きたい部分。

https://twitter.com/yu__ya4/status/1358673597095575559

求人情報(テキスト)からMLで年収予測

『求人のレベル判定に関する実験まとめ』

https://ai-lab.lapras.com/deep-learning/%e6%b1%82%e4%ba%ba%e3%81%ae%e3%83%ac%e3%83%99%e3%83%ab%e5%88%a4%e5%ae%9a%e3%81%ab%e9%96%a2%e3%81%99%e3%82%8b%e5%ae%9f%e9%a8%93%e3%81%be%e3%81%a8%e3%82%81/

求人の「必須条件」「歓迎条件」からナイーブにやって精度6割?とのこと。こういう実験的なのでリリース出すの楽しそう。考察とかモデル改善の軌跡とかけっこうしっかりやっていて読んでて面白い記事。各年収帯に特徴的な単語とかはぱっと見て面白かった。

自分の Netflix の視聴履歴を BigQuery で分析してみたよ

『Using BigQuery Arrays to Analyze my Netflix Viewing History』

https://towardsdatascience.com/using-bigquery-arrays-to-analyze-my-netflix-viewing-history-c93935185ac

ここから申請したら Netflix の自分の視聴データをもらえるらしい。

ZOZO研究所でこれまでやってきたことまとめ

『【イベントレポート】ZOZO研究所成果共有会まとめ』 https://technote.zozo.com/n/nc5afd38c78c9

ちゃんとプロダクトでの活用を考えた上で研究開発して実際にプロダクトインしていて素敵だなと思った。

いろんなマーケ施策がまとめられてるやつ

『メルカリが検索に「売り切れ品」を置く理由、初期のLINEが友だち追加を「電話番号マッチング」に絞った理由など、アプリのマーケティング施策まとめ30』 https://markelabo.com/n/n90b7898231e8

メルカリの話は推薦体験としても有名なやつ。他のやつもプロダクト関わる上で知っておいて損ないと思う。シュッと読めるのでおすすめ。

推薦システム難しいシリーズ(?)

レビュー文に書いてある内容とレビューにつけてる評価の☆が一致しない問題。この例では、☆4つけてるのに文章中では「☆5とさせていただきます!」って書いてて笑った。笑

https://twitter.com/tkEzaki/status/1359354371092320259

ただ、つけられた☆の数とレビュー文章は対応する想定で分析とかしたりすると思うので、数値評価と文章が明らかに違うものが存在するのは難しい話だなと思った。

hakubishin3 commented 3 years ago

Booking.com Challenge

u++, yu-ya4, hakubishin3 のチームで参加して 6 位でした.

https://www.bookingchallenge.com/final-leaderboard-results?utm_campaign=Weekly%20Kaggle%20News&utm_medium=email&utm_source=Revue%20newsletter