Open yu-ya4 opened 4 years ago
通称4GM本. Kaggleに勝つための本というよりは機械学習によるモデリングのために必要な要素全般(メトリック, データ加工, 特徴量エンジニアリング, モデリング, 検証)をコードを使って丁寧に説明している本. Kaggle本と内容がそこそこ被っている(明確に被ってないのはimage / text classification ?? 他にも細かいところがちょいちょいと). Kaggle本の補足として読むか, もしくはKaggle本の前に読む みたいな使い方が良いと思った.
シリコンバレーで話題騒然となっているGPT-3についての記事. OpenAIが出しているapiを利用したGPT-3の応用例をいくつか紹介している. 議論の箇所が面白かった. 後以下のコメント
FP16でも16GBメモリのGPUを22枚必要とするモデルサイズを考えると利用料は安くないはずです. http://deeplearning.hatenablog.com/entry/gpt3
テニスのサービスの良さを定量的に評価しようとした話. SVMを使って決定境界を取得して良いエリアと悪いエリアを可視化し定性評価しているところが面白かった. https://speakerdeck.com/akinohiakatsuki/sabufalsezhi-qiu-li-woding-liang-de-niping-jia-sitemiyou-tenisufalsehanasi
https://twitter.com/ksaitoboston1/status/1284375747839361024
https://note.com/masa_kazama/n/n586d0e2d49d2
Ubie の Kazama-san の note 推薦システムの概要からはじまり、具体的な事例とともにいろいろな形の推薦システムについて説明している。 いろいろな参考となる資料へのリンクがまとめってるのが個人的にはいいなと思った。
https://kensuu.com/n/n58dfb5fc02e7
「近いマンガ」がわかるマンガ新検索サービス(https://alu.jp/MangaNearestMap/)を機械学習を利用してつくった話。一時期 Twitter でバズってた 「 #私を構成する5つのマンガ 」のデータを利用した。Kasama-san が中身を作ったらしい。いけめん!
「データがないからサービスが作れない」⇔「サービスがないからデータを集められない」 という鶏卵問題をきれいに解決した例。めっちゃ好き。サービスとは別枠で、Twitter のトレンドにのるような企画をやってデータを集める。
バイラル係数が高くなるよう実験繰り返してる。最終、2日で150万人が訪問して65万人がやってくれたらしい。
@hakubishin3 @agatan @yu-ya4 で Podcast に出演して RecSys Chalenge についてしゃべった。25分あっという間に過ぎた。
https://recsys.acm.org/recsys20/tutorials/
去年とはまた毛色が違う感じで今年も面白そう。 Feature Eng., Bayesian, Bias & Fairness, Adversarial Learning, Bandits, Conversational
https://github.com/mocobeta/building-search-system-book
検索エンジン界隈で有名な Uchida-san の何気ない一言から何かが始まってそう。読みたい。
https://towardsdatascience.com/top-20-youtube-channels-for-data-science-in-2020-2ef4fb0d3d5
データ系 YouTuber まとめ。
https://www.itmedia.co.jp/mobile/articles/2007/15/news071.html
スウェーデンSpotifyは7月14日(現地時間)、日本を含む一部地域の公式アプリでPodcast(ポッドキャスト)のランキングを表示できるようにしたと発表した。 再生回数のランキング「トップポッドキャスト」と再生回数の増加率でランキングする「急上昇ポッドキャスト」を地域別に表示する。 アプリの[Search]タブ→[ポッドキャスト]→[ポッドキャスト人気ランキング]で表示できる。
なんかまた論文出るのかな?(もう出てる?) 音楽との差異が面白そう。あと、音楽の視聴情報を使ったクロスドメインの推薦とか。
https://www.kaggle.com/jessicali9530/animal-crossing-new-horizons-nookplaza-dataset
「あつ森」の dataset が Kaggle に公開されたらしい。
いろいろなアイテムの情報が集められている。虫や魚の売却価格や出現場所、天気などのデータもある。
公式が公開したわけじゃなくて、有志でアイテムデータを集めるサイトがあってそこからのデータっぽい? Nook Plaza
https://speakerdeck.com/shiozaki/bigquery-behind-zozotown
ZOZO のサービスを支えるデータ基盤について説明。BigQuery 神。みんな大好き Looker も使ってる。
リアルタイムデータ基盤についても構築中!
https://twitter.com/ez1xh/status/1282428198014181376
「お風呂に合う曲を流して」-> 「ミオヤマザキ 『溺死』」
Why
推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!
発信のため、ここは public にしてあります。外部からの参加をご希望の方は松村(https://twitter.com/yu__ya4) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!
What
Wantedly では隔週木曜日に
といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。
話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!
prev: #57