wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
297 stars 2 forks source link

[2022/11/30]推薦・機械学習勉強会 #173

Open zerebom opened 1 year ago

zerebom commented 1 year ago

Why

推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!

発信のため、ここは public にしてあります。外部からの参加をご希望の方は樋口(https://twitter.com/zerebom_3) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!

What

Wantedly では隔週木曜日に

といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!

prev: #171

Hayashi-Yudai commented 1 year ago

SkyPilot: ML and Data Science on any cloud with massive cost savings

UC BerkeleyのSky Computing Labが開発して今月リリースされた、機械学習ジョブを走らせるフレームワーク

便利そうな点をまとめると

image
resources:
  accelerators: V100:4

setup: |
  git clone https://github.com/huggingface/transformers/
  cd transformers && pip install .
  cd examples/pytorch/text-classification
  pip install -r requirements.txt \
    torch==1.12.1+cu113 --extra-index-url https://download.pytorch.org/whl/cu113

run: |
  cd transformers/examples/pytorch/text-classification
  python run_glue.py \
    --model_name_or_path bert-base-cased \
    --dataset_name imdb  \
    --do_train \
    --max_seq_length 128 \
    --per_device_train_batch_size 32 \
    --learning_rate 2e-5 \
    --max_steps 50 \
    --output_dir /tmp/imdb/ --overwrite_output_dir \
    --fp16

https://miro.medium.com/max/1400/1*3F_b_cKO_g-DZLtESN6t7g.webp

nogawanogawa commented 1 year ago

Reciprocal Recommender Systems: Analysis of State-of-Art Literature, Challenges and Opportunities on Social Recommendation

浅く広く知りたいときに読もうと思った。

類似商品レコメンド機能、その後

メルカリShopsでの類似商品レコメンド機能の紹介。 商品名+商品詳細+カテゴリー名の文字列をWord2Vecを用いてベクトル化、近似近傍探索している模様。

類似商品の検索は今年の3月から運用されており、今回のブログではさらにその改善を行っている。 具体的には

  1. 類似商品を直近のCVRに基づいてリランキング
  2. w2vの再学習
    • 特にリリース周りが大変
  3. Streaming Indexingの利用
    • ニアリアルタイムでインデクシングが可能に

等を行ったことの紹介記事。

zerebom commented 1 year ago

Simple Data Analytics Leads impact

内容

感想

新しいデータ基盤アーキテクチャである「データレイクハウス」について調べてみた

hakubishin3 commented 1 year ago

Kaggle「Feedback Prize - English Language Learning」でソロ4位でした

コンペ詳細: https://www.kaggle.com/competitions/feedback-prize-english-language-learning

image

コンペの概要とソリューションについて紹介する予定

https://twitter.com/jy_msc/status/1597759398247817216