[2024/06/26]推薦・機械学習勉強会 - Githubissues

wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖

https://www.wantedly.com/projects/391912

297 stars 2 forks source link

[2024/06/26]推薦・機械学習勉強会 #253

Open Hayashi-Yudai opened 4 days ago

Hayashi-Yudai commented 4 days ago

Why

推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう！

発信のため、ここは public にしてあります。外部からの参加をご希望の方は合田/hakubishin3、角川/nogawanogawa、林/python_walker まで DM を送るか、Wantedly Visit の募集（https://www.wantedly.com/projects/391912）よりご連絡ください！

What

Wantedly では隔週水曜日に

推薦の評価指標について議論したい
〇〇っていうライブラリ / フレームワークを導入してみたい
他社の基盤事例をみんなにシェアして自社の基盤開発に活かしたい
もっと推薦を良くするためにどんなものが必要か議論したい

といった話をする「推薦・機械学習勉強会」を開催しています。この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう！会の間に話した内容もここにメモしましょう！

prev: https://github.com/wantedly/machine-learning-round-table/issues/251

takaki-otake commented 3 days ago

Netflix PRS 2024 - Applying LLMs to Recommendation Experiences

Netflix Research 主催のワークショップ Netflix PRS 2024 における eugeneyan さん（Amazon の Senior Applied Scientist）の発表。LLMの推薦システムへの応用を念頭に、LLMを利用したプロダクト開発の知見をまとめている。

課題と知見集

How to evaluate for specific tasks?

Lesson 1.1: Simplify the problem (and thus evaluation)
Lesson 1.2: Model-based evaluation scales better
Lesson 1.3: Reference-free evals double as guardrails

How to scale for consumer apps?

Lesson 2.1: Consider using a cache safely
Lesson 2.2: Consider smaller, simpler models
Lesson 2.3: Do you want throughput or latency?

How to ensure reliability?

Lesson 3.1: You need (reliable) evals
Lesson 3.2: You need guardrails to exclude defects
Lesson 3.3: Keep it simple (and deterministic)

メルカリが生成AIを活用して日本のC2C ECの未来を定義する方法【Fully Connected San Francisco 2024】

MercariAI Assist の裏側
- 東工大の岡崎研が公開しているSwallow-7b-instruct-hf をベースに QLoRA で fine-tune
- GPT-3.5 Turbo比で性能が1.3倍 & コストが1/14に
類義語辞書拡張
Purchase nDCG

hakubishin3 commented 3 days ago

データサイエンス組織のマネージャーを終えたので、これまでを振り返り、キャリアについて考える話

ABEJAでDSマネージャーをしていたpaoさんの振り返り記事。これまでマネージャーとして取り組んできたこと、マネージャーを経験して得られたことや気付き、そしてマネージャー / スペシャリストのキャリアパスについての考察が書かれている。

【宣伝】Recommendation Industry Talks #3

企業における推薦システムの活用事例や課題を題材にした会です。イベントの参加者を募集中です！

nogawanogawa commented 3 days ago

ChatGPTとPydanticでかんたん契約書解析

GPT-4oを使って契約書の画像データを構造化されたテーブルデータにした記事。 GPTの応答が期待通りになっていない場合にも、Pydanticを使ってvalidation結果を踏まえてリトライしてる。（便利そう）

BigQuery で LangChain を使用する検索拡張生成のスタートガイド

データは基本てきに全てBQにおいた状態でもRAGをすることができるらしい。 RAGをちゃんと作ろうとするとベクトル・テキスト・その他データの置き場を考える必要があるが、これなら基本的に全てBQでできる。

「BQに入れられてる情報ならSQL書けばいい」という話はあるが、ベクトル検索 + データストアという意味では便利なのかもと思う

Claude3とAzure AI Document Intelligenceを使ってドキュメント読み取りの精度をあげてみた

Claude3にパワーポイントのスクリーンショットを画像として読ませることで、人間が読むような形のテキストに起こせることを確認しました。また、読み込める文字のサイズについても調べた結果、文字サイズがある程度大きくないと読み取れないことがわかりました。

そうなんだ、知らなかった…

Hayashi-Yudai commented 3 days ago

ベイジアンABテストってありなの? / Is Bayesian AB Testing Truly Effective?

ABテストの結果を分析するときに、頻度論ベースの手法でやりづらい部分がどこにあって、それをベイズを使うことによってどこまで解消できるかがまとめられているスライド。

ベイジアンABテストの利点
- 介入群がどの程度優れているのかを定量化できる
- 複数回の分析を行っても問題ない
ベイジアンABテストの欠点
- 事前分布の設定をどうすればいいか非自明
- 分析が複雑になる

chimuichimu commented 3 days ago

Video annotator: a framework for efficiently building video classifiers using vision-language models and active learning

Netflix の動画分類の事例。Human-in-the-loop の仕組みや vision-language モデルの利用により、classifier モデルを効率的に学習するフレームワークを紹介している。

KKaichi commented 3 days ago

Netflix PRS 2024 - Applying LLMs to Recommendation Experiences

ネタ被りしてしまったので割愛

How to Write Design Docs for Machine Learning Systems

githubのテンプレートリンク：https://github.com/eugeneyan/ml-design-docs 日本語訳？: https://zenn.dev/kaichi_nihira/articles/7048eabf9962e2