wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
297 stars 2 forks source link

[2021/07/01]推薦・機械学習勉強会 #106

Open yu-ya4 opened 3 years ago

yu-ya4 commented 3 years ago

Why

推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!

発信のため、ここは public にしてあります。外部からの参加をご希望の方は松村(https://twitter.com/yu__ya4) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!

What

Wantedly では隔週木曜日に

といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!

prev: #104

hakubishin3 commented 3 years ago

推薦システム初心者におすすめの手法「行列分解」とは? ~特異値分解からCB2CF法によるコールドスタート問題解決まで~

無人島に1つだけ持っていくなら?ランキング第1位の行列分解のチュートリアル. SVDから始まり, WMF, CB2CF という順番で具体例を踏まえて解説されている.

ここで紹介したもの以外にもいくつかアルゴリズムが存在し、非負値行列分解(Nonnegative matrix factorization)は特によく用いられるが、多くの場合 WMF よりも精度が劣る。

いつか比較してみたいと思った.

機械学習とビジネスを橋渡しするものこそ評価指標であり, ”全てのビジネスは条件付期待値の最大化問題として書ける”仮説についての一考察

機械学習の価値はビジネスモデル次第であり, そのビジネスモデルで価値を最大化するためには評価指標が重要であるという主張について簡単な例と考察付きで紹介されている. 設計は大変だがその分ご利益があると思っていて, 効果の見積もりや期待値調整, モデリングなどでウンウン悩まずに済むので便利だと思う.

「マンガアプリ」失敗の本質, 急成長中の漫画アプリ『ピッコマ』が目指す「紙とデジタルが共存する生態系」

マンガアプリの課金モデルの考察の記事とピッコマでのデータ活用の記事を読んだので, 気になったところをまとめた.

競合サービスと比べて作品数の少ないピッコマだが, データとアルゴリズムを活用した推薦に加えて, 作品をコントローラブルに運営するための「専用チケット」の存在によって, ユーザと作品のマッチングをうまく促進している.

#11 [初心者歓迎! / 画像編] atmaCup

atmaCup初(??)の画像コンペ 2021-07-09 〜 2021-07-22 と約 2 週間の開催予定.

zerebom commented 3 years ago

GBDTのハイパーパラメータの意味を図で理解しつつチューニングを学ぶ

GBDTのハイパーパラメータを図を使って解説した記事。

解説しているパラメータの網羅性が高い上に、 用途毎のパラメータの変更方針と対応した図がまとめてあって非常に実用的です。 定期的に見返したいと思いました👀

【パーソナライズ最前線】メルカリの開発は、次のフェーズに来た

メルカリのエンジニアマネージャーに対するインタビュー記事。

世界の人口79億人が使うようなプロダクトにするためには、 アーリアダプター以降が使いやすいように”パーソナライゼーション”機能が重要と答えている。

パーソナライゼーションに関する過去の取り組み、開発の進め方、開発体制についても記載されている。

「本当は欲しいのに、お客さまが認識していないもの」が、自動的に表示されている。そんなホーム画面を作りたいのです。

nogawanogawa commented 3 years ago

【論文メモ: Google Drive Recommendation】Improving Recommendation Quality in Google Drive

身近な推薦の題材だったので、ちょっとした紹介。(KDD2020) アイテムのフィルタリングからランキングまで、改善していった経緯の話。

全体の流れとしては下記のような流れになっているらしいです。

ざっくりやったことは下記の5点。

【論文メモ: Latent Cross】Latent Cross: Making Use of Context in Recurrent Recommender Systems

上の論文の深堀りの意味で、ちょっと古め(WSDM2018)の論文の紹介。 NNで推薦を行う際に、ユーザーのコンテキスト情報をどうやって取り扱うかについて、Latent Crossという手法を導入。

コンテキスト情報としては、

などがあるようでした。

yu-ya4 commented 3 years ago

機械学習が導き出した意思決定の理由の可視化

『意思決定の理由の可視化が可能なグラフ構造の学習アルゴリズムの紹介』 https://techblog.zozo.com/entry/explainable-recommendation-kgat

  • 機械学習から得られた意思決定の理由を明確にすることの必要性が増している
    • 「XAI」と呼ばれる研究領域が注目されている
  • Attentionを用いて推薦理由を可視化・解釈可能な、Knowledge Graph Attention Networkという手法を紹介する
  • ZOZOTOWNに蓄積されているデータにKnowledge Graph Attention Networkを適用してみた結果の一部を紹介する

ブログかと思ったら論文だった。めちゃくちゃ完成度高い。

CAMPFIRE の統計データの一部がパブリックに

『クラウドファンディング「CAMPFIRE」をデータで見る統計ページ公開』 https://prtimes.jp/main/html/rd/p/000000359.000019299.html

https://camp-fire.jp/stats

このページはCAMPFIREのデータを取得し、統計データとして四半期に一度まとめています。サービス全体の基本情報に加え、これからクラウドファンディングを検討している方に有用なデータも公開しています。

以前紹介したクリスプサラダワークスの例とかもだけど、この辺のデータをパブリックにする流れが出てきたりするのかしら。😺