wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
297 stars 2 forks source link

[2020/10/29]推薦・機械学習勉強会 #72

Open yu-ya4 opened 3 years ago

yu-ya4 commented 3 years ago

Why

推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!

発信のため、ここは public にしてあります。外部からの参加をご希望の方は松村(https://twitter.com/yu__ya4) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!

What

Wantedly では隔週木曜日に

といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!

prev: #70

yu-ya4 commented 3 years ago

RecSys2020 論文読み会開催した & 発表した

https://connpass.com/event/189192/

オンラインイベントは主催も発表もたいへんだなとおもいました(小並)

資料は全部イベントページにあっぷされているので皆さん見てください!

Team Wantely()

『What Twitter learned from the Recsys 2020 Challenge』 https://towardsdatascience.com/what-twitter-learned-from-the-recsys-2020-challenge-d3ae2f7ccf0f

RecSys Challenge2020 の 運営企業の Twitter による振り返り記事。 社名は間違えないで欲しかった。

We try to make general conclusions about the choices that helped the winners achieve their results

  • most important features
  • extremely fast experimentation speed for feature selection and model training
  • adversarial validation [1] for generalisation
  • use of content features
  • use of decision trees over neural networks

target encoding is king.

ワカル

宇宙探査のキャリアに備えられる教材ができたらしい

https://techcommunity.microsoft.com/t5/azure-developer-community-blog/check-out-new-data-science-learn-modules-inspired-by-the-netflix/ba-p/1806363

https://docs.microsoft.com/ja-jp/learn/topics/nasa

マイクロソフトとNetflixが共同で作成した、NASA のDS業務をベースとした学習コンテンツがリリース。

けっこう単純な pandas の扱い方(でも宇宙のストーリーには乗っていておもろい)から、隕石の分類やロケット打ち上げの遅延予測みたいな ML 系の教材まであって良い。

KDD2020 の推薦システムのチュートリアル

https://sites.google.com/view/kdd20-marketplace-autorecsys/

推薦システムの盛り上がり💪 「Part A: Recommendations in a Marketplace」と「Part B: Automated Recommender System」の2本立てで、前者は Multi-sided marketplaces がテーマとなっていて面白いなと思った。複数のステークホルダーがいるときの objective(s) の最適化難しいよね。

Jun Ernesto Okumura さんの一連の tweet にちょっとだけ内容が。👀

https://twitter.com/pacocat/status/1297737429881729024

世界最大のアダルトサイトPornhubは「2020年大統領選討論会」の影響をどのように受けたのか?

https://gigazine.net/news/20201025-pornhub-trump-biden-presidential-debate/

普通におもろい。

Pornhubの報告は、2020年9月29日に実施された第1回討論会がPornhubのトラフィックに与えた影響に関する分析です。報告によると、アメリカからPonrhubに流れ込むトラフィックは、第1回討論会中に通常時のマイナス18.5%を記録。討論終了後にトラフィックは急速に回復し、東部標準時の23時には通常時のプラス5.2%に達しました。

しかし、Pornhubは興味深いポイントとして、「各州では反応が異なった」という点を指摘。ミシガン州やペンシルバニア州などは第1回討論会のさなかにトラフィックが20%以上も減少した一方、ニューメキシコ州やバージニア州でのトラフィック減少は10%程度にとどまったと報告しました。全体的には、西部・南部ではトラフィックの減少率は低かったものの、北部・東部では減少率は高かったという傾向がみられました。

Pornhub のデータ分析チーム興味ある。👀

Amazonが同社以外の店舗における購入データを消費者から買い取るプログラムを開始

https://jp.techcrunch.com/2020/10/21/2020-10-20-amazon-launches-a-program-to-pay-consumers-for-their-data-on-non-amazon-purchases/

プログラムの参加者は食料品店、デパート、ドラッグストア、映画館、テーマパーク、レストランなどの娯楽施設(営業している場合)など、アマゾン以外の店舗で買い物をした際のレシートを1カ月に10件送付することが求められる。

サービス外のデータも集め始めた。すごい。でも逆にこれが当たり前になったら、自社で大きなプラットフォームもっていなくてもできることが広がったり、コールドスタート問題にも対処できたりみたいな世界がくる?

じゃらんのレビュー文から作成された NLI 及び極性情報データセットが公開

https://github.com/megagonlabs/jrte-corpus

こういう動きすごい。

Hypothesis: 部屋から海が見える。 (You can see the ocean from your room.)
Premise   : 部屋はオーシャンビューで景色がよかったです。 (The room had an ocean view and a nice view.)
Label     : Entailment
Text            : 朝食が美味しいです。 (The breakfast is delicious.)
Sentiment       : Positive
Hotel reputation: True

多言語対応 T5

mT5: A massively multilingual pre-trained text-to-text transformer https://arxiv.org/abs/2010.11934

mBERT よりぜんぜん強いらしい(全然読んでない)

DeNA における機械学習/AI チームの10年間の軌跡

『機械学習/AI活用した体験・サービス提供の挑戦10年』 https://twitter.com/hamadakoichi/status/1319132053560987648

10年間の"機械学習/AI活用した体験・サービス提供"の実際の取組みの各フェーズで生じた ①課題、②課題解消の取組み、等、紹介しています。み

実務で機械学習10年してるってフレーズがすでにすごい。14歳のときに、数理手法を駆使して課題解決して世の中よくしたいって言ってるのすごすぎてよくわからん。

推薦システム難しいシリーズ

https://twitter.com/justicesquad_I/status/1319128412296888320

地獄を見せようとしてくる Netflix

hakubishin3 commented 3 years ago

Recommendations AI の活用で PC パッケージの売上を約 2 倍に拡大 | Google Cloud Blog

僕の仕事も奪って欲しい https://cloud.google.com/blog/ja/topics/customers/exnoa-dmm-games-recommendations-ai?fbclid=IwAR37jUBjuqTFRUI-69ktEivLY5NPIkdPMem2SoUeHYo7sdVM3FqziBmbjk4

RecSysの動画が (workshop以外) 公開

https://www.youtube.com/playlist?list=PLaZufLfJumb-cVIEsyg4CFocuq4WsvjED

Grand MasterがKaggleの実務への有用性を話している

https://twitter.com/JFPuget/status/1320370798889230336

情報検索 :検索エンジンの実装と評価 10/30発売

https://www.amazon.co.jp/dp/4627817614/ref=cm_sw_r_tw_dp_x_Z9oKFbBVZHQZ2

khfukuda commented 3 years ago

Learning Quadrupedal Locomotion over Challenging Terrain

https://twitter.com/__tmats__/status/1319300960229883905