Open yu-ya4 opened 3 years ago
無人島に1つだけ持っていくなら?ランキング第1位の行列分解のチュートリアル.
SVDから始まり, WMF, CB2CF という順番で具体例を踏まえて解説されている.
ここで紹介したもの以外にもいくつかアルゴリズムが存在し、非負値行列分解(Nonnegative matrix factorization)は特によく用いられるが、多くの場合 WMF よりも精度が劣る。
いつか比較してみたいと思った.
機械学習の価値はビジネスモデル次第であり, そのビジネスモデルで価値を最大化するためには評価指標が重要であるという主張について簡単な例と考察付きで紹介されている. 設計は大変だがその分ご利益があると思っていて, 効果の見積もりや期待値調整, モデリングなどでウンウン悩まずに済むので便利だと思う.
マンガアプリの課金モデルの考察の記事とピッコマでのデータ活用の記事を読んだので, 気になったところをまとめた.
競合サービスと比べて作品数の少ないピッコマだが, データとアルゴリズムを活用した推薦に加えて, 作品をコントローラブルに運営するための「専用チケット」の存在によって, ユーザと作品のマッチングをうまく促進している.
専用チケットがなく、コインしかなければ、コインを送っても、私たちが運営したい作品に使われない可能性が高い。どんなところでも使えるコインでは作品の運営ができないと思っています。
ピッコマが「作品専用チケット」を巧みに運用することで、(1)ユーザーの離脱を防ぎ、(2)潜在的読者と作品を出会わせる(マッチングする)ため、切り札として利用している
プラットフォームビジネスの大前提は、供給側(Supply side)の品揃えの豊富さ(作品数の多さ)です。その一方で、作品数の多い(約43万点)LINEマンガを、作品数の少ない(約6万点)ピッコマが追い上げています。
「ピッコマは(個人化)レコメンドのために何を分析しているかというと、一部のトラフィック、10%の読者のみに、様々な作品を露出し、その10%のユーザーから閲覧転換率(のデータ)を得ています。最初から全体に見せない理由は、トラフィックがムダになるからです。10%の人のみで検証して、その中で一番閲覧転換率が高かったものを、残りの90%の読者にお勧めするというロジックになっています。」
「このように、ピッコマでは2年間、AIの専門チームを稼働しながら、最先端の技術を開発し、使っているのですが、その素晴らしい研究結果も、プラットフォーム全体の60~70%だけに適用しています。なぜなら、すべてをデータに依存すると、偏った作品ばかり読むリスクがあるからです。」
atmaCup初(??)の画像コンペ 2021-07-09 〜 2021-07-22 と約 2 週間の開催予定.
GBDTのハイパーパラメータを図を使って解説した記事。
解説しているパラメータの網羅性が高い上に、 用途毎のパラメータの変更方針と対応した図がまとめてあって非常に実用的です。 定期的に見返したいと思いました👀
メルカリのエンジニアマネージャーに対するインタビュー記事。
世界の人口79億人が使うようなプロダクトにするためには、 アーリアダプター以降が使いやすいように”パーソナライゼーション”機能が重要と答えている。
パーソナライゼーションに関する過去の取り組み、開発の進め方、開発体制についても記載されている。
「本当は欲しいのに、お客さまが認識していないもの」が、自動的に表示されている。そんなホーム画面を作りたいのです。
身近な推薦の題材だったので、ちょっとした紹介。(KDD2020) アイテムのフィルタリングからランキングまで、改善していった経緯の話。
全体の流れとしては下記のような流れになっているらしいです。
ざっくりやったことは下記の5点。
上の論文の深堀りの意味で、ちょっと古め(WSDM2018)の論文の紹介。 NNで推薦を行う際に、ユーザーのコンテキスト情報をどうやって取り扱うかについて、Latent Crossという手法を導入。
コンテキスト情報としては、
などがあるようでした。
『意思決定の理由の可視化が可能なグラフ構造の学習アルゴリズムの紹介』 https://techblog.zozo.com/entry/explainable-recommendation-kgat
- 機械学習から得られた意思決定の理由を明確にすることの必要性が増している
- 「XAI」と呼ばれる研究領域が注目されている
- Attentionを用いて推薦理由を可視化・解釈可能な、Knowledge Graph Attention Networkという手法を紹介する
- ZOZOTOWNに蓄積されているデータにKnowledge Graph Attention Networkを適用してみた結果の一部を紹介する
ブログかと思ったら論文だった。めちゃくちゃ完成度高い。
『クラウドファンディング「CAMPFIRE」をデータで見る統計ページ公開』 https://prtimes.jp/main/html/rd/p/000000359.000019299.html
このページはCAMPFIREのデータを取得し、統計データとして四半期に一度まとめています。サービス全体の基本情報に加え、これからクラウドファンディングを検討している方に有用なデータも公開しています。
以前紹介したクリスプサラダワークスの例とかもだけど、この辺のデータをパブリックにする流れが出てきたりするのかしら。😺
Why
推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!
発信のため、ここは public にしてあります。外部からの参加をご希望の方は松村(https://twitter.com/yu__ya4) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!
What
Wantedly では隔週木曜日に
といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。
話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!
prev: #104