wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
297 stars 2 forks source link

[2021/11/18]推薦・機械学習勉強会 #120

Open yu-ya4 opened 2 years ago

yu-ya4 commented 2 years ago

Why

推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!

発信のため、ここは public にしてあります。外部からの参加をご希望の方は松村(https://twitter.com/yu__ya4) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!

What

Wantedly では隔週木曜日に

といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!

prev: #117

zerebom commented 2 years ago

クックパッドマートの多種多様な商品名から、扱いやすい「食材キーワード」を予測する

クックパッドマートで出品者から登録される商品名や商品説明から、食材キーワード候補を予測するモデルの紹介記事。 ex) メークイーン、じゃが芋、馬鈴薯 → ジャガイモ

データセットのサイズの割に食材キーワードの種類数が多い、商品名に商品キーワードと近い言葉が含まれているため、食材キーワードをラベルとせず、商品名・キーワードの距離を学習するモデルにした。

メリット

デメリット

ROC 曲線とAUC を用いて2値分類機械学習モデルの性能を計測・チューニングする

roc曲線の詳細な解説。true/negative itemの予測値の分布とroc曲線の対応関係がいくつも載っていてわかりやすいです。

RecBole を用いてクックパッドマートのデータに対する50以上のレコメンドモデルの実験をしてみた

50以上の推薦モデルを統一インターフェースから学習・推論できるRecBoleを使って、クックパッドのデータセットを学習・予測した記事。 RecBoleの形式にデータを整えるのはちょっとめんどくさそうだけど、同じ実装で複数モデルを一度に評価できるのは相当便利そうです👀 。

nogawanogawa commented 2 years ago

ニュース記事の品質と広告効果の関係についてCIKM2021で発表を行いました

今回の論文の知見は、品質の高い記事をユーザーに優先的に配信することが、ユーザーの広告消費を促進した点です。

今まで、品質の高い記事を提示することは、基本的に記事のクリック率などが低下し、サービスへの導入メリットが薄いと考えられていました。そのため、記事品質を担保するような仕組みを推薦システムに組むことができていませんでした。しかし、広告の消費においてはポジティブな側面がある、ということを初めて明らかにし、その貢献が学会にも認められ short-paper として受理されました。

データ分析と機械学習開発の協業によるスタンプ推薦ロジックの継続的改善

売上が良くても、さらにimpressionとの比率から良し悪しを判断しているのは面白いと思った。 何より動画が公開されていてありがたいと思った。

yu-ya4 commented 2 years ago

ウォンテッドリーにおける推薦システム開発

静岡大学の授業で話す機会をいただいたので、ウォンテッドリーにおいてどのように推薦システムを開発しているのかについて事例とともに紹介した。キラキラした事例紹介ではなく、泥臭い問題解決のフローについて紹介して学生の方々にリアルな現場を感じてもらった。

『ウォンテッドリーにおける推薦システム開発事例』 https://speakerdeck.com/yuya4/recsys-in-wantedly-2021

LINE におけるDSとMLエンジニアが協力して進めるプロダクト開発事例

『データ分析と機械学習開発の協業によるスタンプ推薦ロジックの継続的改善 - 2021』

https://www.youtube.com/watch?v=2CXnZl3JPGI https://linedevday.linecorp.com/2021/ja/sessions/79/

最強の検索エンジン

https://twitter.com/youdotcom/status/1458522632219856899

https://www.producthunt.com/stories/there-s-no-better-time-to-start-a-new-search-engine-by-richard-socher

It keeps the bulk of search traffic to itself — nearly 65% of searches worldwide (on desktop and mobile combined) in the fourth quarter of 2020 were "zero-click," ending without that traffic going to another website, according to a SimilarWeb study.

検索結果の65%がユーザにクリックされていない("zero-click")現状を変えるために最強の検索エンジン "YOU"を作るぜ。

https://you.com/

Cursor_と_You_com recommender_system_-_You_com

Bot は「いいえって漢字あるんですか?」と回答できない

https://twitter.com/unnonouno/status/1459721747482042368