wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
297 stars 2 forks source link

[2021/03/25]推薦・機械学習勉強会 #92

Open yu-ya4 opened 3 years ago

yu-ya4 commented 3 years ago

Why

推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!

発信のため、ここは public にしてあります。外部からの参加をご希望の方は松村(https://twitter.com/yu__ya4) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!

What

Wantedly では隔週木曜日に

といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!

prev: #90

hakubishin3 commented 3 years ago

Python: LightGBM の決定木を可視化して分岐を追ってみる

https://blog.amedama.jp/entry/lgbm-tree-plot

LightGBM が構築する決定木の可視化について紹介している.

Top Data Science Platforms in 2021 Other than Kaggle

https://becominghuman.ai/top-data-science-platforms-in-2021-other-than-kaggle-a1b4609c06b0

Kaggle 以外のデータ分析プラットフォームを紹介している. ほとんど知らなかったです.

RecSys Challenge 2021 が開催された

http://www.recsyschallenge.com/2021/

去年と同じく Twitter 主催のコンペだが, いくつか変更点が存在する.

This image will be run on the e2-highmem-16 instances on GCP (see here for details). You submission will have a 64 GB memory limit and 24 hours time limit to score the entire test set (~10 million rows).

形態素解析器 Sudachi の v0.5.2 がリリース 🎉

https://twitter.com/sorami/status/1371287545623896067

括弧内の文字が直前の漢字の読み仮名とみなされるようになった.

機械学習モデルの後方互換性

https://twitter.com/keonabut/status/1371292800956833795 https://speakerdeck.com/konabuta/microsoft-false-responsible-ai-hefalsequ-rizu-mi-2020-11-10?slide=11

モデル再学習など, 新しい機械学習モデルの導入による予期せぬエラーを減らすために, 互換性を考慮する. 古いモデルと新しいモデルの精度を比較するだけでは不十分で, 互換性の定量化や互換性を考慮したモデル学習について紹介している.

yu-ya4 commented 3 years ago

IR Reading 2021春(オンライン) 開催案内

https://sigir.jp/post/2021-04-24-irreading_2021spring/

今年は発表するぞっ

WSDM 2021, CHIIR 2021, ECIR 2021, TheWebConf 2021 など直近の情報検索系国際会議の論文を読む会を2021年4月24日にオンライン開催予定です.参加申し込み (発表・聴講) 締め切りは4月10日となっております.奮ってご参加ください!

https://twitter.com/acmsigirtokyo/status/1372614837386158082

ボスの授業

最強DB講義 #5-2 Web情報検索 (田中克己教授) https://dblectures.connpass.com/event/207933/

@yu-ya4 の元ボスのWeb情報検索についての授業があるらしい。 4/21 です。みなさまぜひ。

「Google AI倫理」騒動の発端となった論文について

酒井先生が内容に言及していらっしゃるので、とりあえずそれだけでも。 https://twitter.com/tetsuyasakai/status/1370984030691225600

A/Bテスト完全に理解できそうな本が出版された

https://twitter.com/yu__ya4/status/1374358921817690113

『A/Bテスト実践ガイド』 https://www.amazon.co.jp/dp/4048930796

まじで完全に理解したい。。。

ZOZOTOWN 大幅リニューアル

https://zozo.jp/ https://corp.zozo.com/news/20210318-13369/

コスメとかラグジュアリーとかを新たに扱うように。既存のファッションについてのデータなどをどう活かしていくのか注目。

TikTok 婚活?

『Meet the people using TikTok to find dates』 https://www.cnet.com/news/meet-the-people-using-tiktok-to-find-dates/

Some people are replacing Tinder with TikTok, to great effect.

検索難しいシリーズ

https://twitter.com/nishio/status/1372233076235898880

Google が検索結果の質を担保するためにアルゴリズム改善を頑張ると、陰謀論みたいな特定のコンテンツが出なくなる。結果として、陰謀論支持者からしたら情報操作されているように感じることとなる。

AB テスト運用をめっちゃいい感じにした ABEMA さんの取り組み

『ABEMAにおけるA/Bテスト運用への取り組み』 https://developers.cyberagent.co.jp/blog/archives/29088/

以下の課題に対して

  1. A/Bテストの結果が見やすい形でまとまっておらず、組織としてナレッジが蓄積できていない
  2. 分析者によって検証方法にばらつきがあり、レポートの品質が担保できていない
  3. 検証のたびに分析者がアサインされ、スケールしにくい構造になっている

以下を理想状態と定義し、それを実現するための取り組みの紹介。

全社的にA/Bテストが適切な手法で実施され,データで意思決定がなされる状態

  1. 過去,現在,未来の全てのA/Bテストの概要・結果が誰でも把握できる状態
  2. 分析者に依存せず、適切な方法でA/Bテストが実施されている状態
  3. 分析者の作業工数が削減され,施策実行者が分析者と並走してテストを実行できる状態

『Five Ways Netflix Used Psychology to Become the World’s Biggest Streaming Platform』 https://medium.com/choice-hacking/five-ways-netflix-used-psychology-to-become-the-worlds-biggest-streaming-platform-e63a7b139973

パーソナライゼーションにおけるカクテルパーティー効果

ソーシャルプルーフ

hiroto0227 commented 3 years ago

Visualizing Data Timeliness at Airbnb

https://medium.com/airbnb-engineering/visualizing-data-timeliness-at-airbnb-ee638fdf4710