wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
308 stars 2 forks source link

[2020/07/22]推薦・機械学習勉強会 #60

Open yu-ya4 opened 4 years ago

yu-ya4 commented 4 years ago

Why

推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!

発信のため、ここは public にしてあります。外部からの参加をご希望の方は松村(https://twitter.com/yu__ya4) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!

What

Wantedly では隔週木曜日に

といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!

prev: #57

hakubishin3 commented 4 years ago

Approaching (Almost) Any Machine Learning Problem 読んだ


通称4GM本. Kaggleに勝つための本というよりは機械学習によるモデリングのために必要な要素全般(メトリック, データ加工, 特徴量エンジニアリング, モデリング, 検証)をコードを使って丁寧に説明している本. Kaggle本と内容がそこそこ被っている(明確に被ってないのはimage / text classification ?? 他にも細かいところがちょいちょいと). Kaggle本の補足として読むか, もしくはKaggle本の前に読む みたいな使い方が良いと思った.

GPT-3の衝撃


シリコンバレーで話題騒然となっているGPT-3についての記事. OpenAIが出しているapiを利用したGPT-3の応用例をいくつか紹介している. 議論の箇所が面白かった. 後以下のコメント

FP16でも16GBメモリのGPUを22枚必要とするモデルサイズを考えると利用料は安くないはずです. http://deeplearning.hatenablog.com/entry/gpt3

サーブの制球力を定量的に評価してみよう


テニスのサービスの良さを定量的に評価しようとした話. SVMを使って決定境界を取得して良いエリアと悪いエリアを可視化し定性評価しているところが面白かった. https://speakerdeck.com/akinohiakatsuki/sabufalsezhi-qiu-li-woding-liang-de-niping-jia-sitemiyou-tenisufalsehanasi

COCO-FUNIT: Few-Shot Unsupervised Image Translation with a Content Conditioned Style Encoder


https://twitter.com/ksaitoboston1/status/1284375747839361024

yu-ya4 commented 4 years ago

これから推薦システムを作る方向けの推薦システム入門

https://note.com/masa_kazama/n/n586d0e2d49d2

Ubie の Kazama-san の note 推薦システムの概要からはじまり、具体的な事例とともにいろいろな形の推薦システムについて説明している。 いろいろな参考となる資料へのリンクがまとめってるのが個人的にはいいなと思った。

データが必要なサービスを、無理やり作る方法を紹介します(例:マンガ検索「MNM」)

https://kensuu.com/n/n58dfb5fc02e7

「近いマンガ」がわかるマンガ新検索サービス(https://alu.jp/MangaNearestMap/)を機械学習を利用してつくった話。一時期 Twitter でバズってた 「 #私を構成する5つのマンガ 」のデータを利用した。Kasama-san が中身を作ったらしい。いけめん!

「データがないからサービスが作れない」⇔「サービスがないからデータを集められない」 という鶏卵問題をきれいに解決した例。めっちゃ好き。サービスとは別枠で、Twitter のトレンドにのるような企画をやってデータを集める。

バイラル係数が高くなるよう実験繰り返してる。最終、2日で150万人が訪問して65万人がやってくれたらしい。

機械学習の世界的コンペ RecSys Challenge 2020 で 3 位に入賞した「Team Wantedly」に話を聞きました。

@hakubishin3 @agatan @yu-ya4 で Podcast に出演して RecSys Chalenge についてしゃべった。25分あっという間に過ぎた。

https://anchor.fm/pod-de-engineer/episodes/RecSys-Challenge-2020--3-Team-Wantedly-with-agatan--hakubishin3--yu__ya4-egn6mv/a-a2mntae

RecSys2020 Tutorials

https://recsys.acm.org/recsys20/tutorials/

去年とはまた毛色が違う感じで今年も面白そう。 Feature Eng., Bayesian, Bias & Fairness, Adversarial Learning, Bandits, Conversational

『仕事ではじめる検索システム』の機運を感じる

https://github.com/mocobeta/building-search-system-book

検索エンジン界隈で有名な Uchida-san の何気ない一言から何かが始まってそう。読みたい。

Top 25 Data Science YouTube Channels you should subscribe to in 2020

https://towardsdatascience.com/top-20-youtube-channels-for-data-science-in-2020-2ef4fb0d3d5

データ系 YouTuber まとめ。

Spotify、日本などでポッドキャストのランキング表示開始

https://www.itmedia.co.jp/mobile/articles/2007/15/news071.html

スウェーデンSpotifyは7月14日(現地時間)、日本を含む一部地域の公式アプリでPodcast(ポッドキャスト)のランキングを表示できるようにしたと発表した。  再生回数のランキング「トップポッドキャスト」と再生回数の増加率でランキングする「急上昇ポッドキャスト」を地域別に表示する。  アプリの[Search]タブ→[ポッドキャスト]→[ポッドキャスト人気ランキング]で表示できる。

なんかまた論文出るのかな?(もう出てる?) 音楽との差異が面白そう。あと、音楽の視聴情報を使ったクロスドメインの推薦とか。

Animal Crossing New Horizons NookPlaza Catalog

https://www.kaggle.com/jessicali9530/animal-crossing-new-horizons-nookplaza-dataset

「あつ森」の dataset が Kaggle に公開されたらしい。

いろいろなアイテムの情報が集められている。虫や魚の売却価格や出現場所、天気などのデータもある。

公式が公開したわけじゃなくて、有志でアイテムデータを集めるサイトがあってそこからのデータっぽい? Nook Plaza

ZOZOTOWNの事業を支えるBigQueryの話

https://speakerdeck.com/shiozaki/bigquery-behind-zozotown

ZOZO のサービスを支えるデータ基盤について説明。BigQuery 神。みんな大好き Looker も使ってる。

リアルタイムデータ基盤についても構築中!

推薦って難しいなって思ったシリーズ

https://twitter.com/ez1xh/status/1282428198014181376

「お風呂に合う曲を流して」-> 「ミオヤマザキ 『溺死』」