wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
306 stars 2 forks source link

[2020/12/10]推薦・機械学習勉強会 #79

Open yu-ya4 opened 3 years ago

yu-ya4 commented 3 years ago

Why

推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!

発信のため、ここは public にしてあります。外部からの参加をご希望の方は松村(https://twitter.com/yu__ya4) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!

What

Wantedly では隔週木曜日に

といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!

prev: #76

konumaru commented 3 years ago

ABテストの後解析を活用した自動セグメンテーションの手法を試した

https://speakerdeck.com/konumaru/main-600d5109-9ab8-4338-aa7e-3f2f47d67a9a

SotaMatsuzawa commented 3 years ago

GCNを用いた推薦システムの仕組み


https://logmi.jp/tech/articles/321723

hakubishin3 commented 3 years ago

いい感じのパイプライン

https://github.com/Megvii-BaseDetection/cvpods

前処理を全部 BQ にしたら query が2400行になったけど爆速でした。

https://note.com/aicia_solid/n/n506fbeeb0ae0

超爆速なcuDFとPandasを比較した

https://acro-engineer.hatenablog.com/entry/2020/12/10/120000

Netflix Japan のオススメアニメ推薦

https://twitter.com/NetflixJP_Anime/status/1332700782433423362

yu-ya4 commented 3 years ago

回答(検索)から回遊(推薦)へ

https://twitter.com/architectizm/status/1331379969193172992

https://tiktok-for-business.co.jp/archives/5108/

TicTok のビズ向けの資料(広告出稿してもらうためのやつ)。アンケートの内容は若干恣意的な気もしないでもないが、言っていることは面白いし納得感もある。

「無目的」だからこそ思わぬ発見があり、衝動的にアクション(広告で言えば購買)を促せる。目的を持った「検索」だとそもそもユーザからの期待が高いんだろうなぁと。「無目的」な中たまたま発見したものだからこそ価値を感じる?セレンディピティの重要性はどんどん高まっていそう。

これまでも存在したネットサーフィンや本屋に行ってみる、とかも回遊的アクションに分類されるが、TikTok は完全にそこを押し出しているのですごい(「目的を持たない回遊こそ、TikTok の真骨頂。」らしい)。一方で、 Twitter でフォローしていない情報出されるのはイラッとするので難しいなと思った。

「広告も Skipできるからこそ、見る。」って概念もおもろい。ほんまか?

そもそも人々は自分で能動的に「検索」するのをめんどくさいと感じるようになっていってる。うまいこと検索クエリを工夫しなくてもいい感じで検索できる技術(文章をそのままクエリとして検索エンジン突っ込む的な話とか、クエリ推薦とか、クエリ修正とか)もどんどん発展しているが、まあ何もしないで価値ある情報を手に入れられる方が良いのだろう。

Apple が独自検索エンジンを開発中。。。?

『Why an Apple search engine has a real shot at competing with Google』 https://www.fastcompany.com/90583870/apple-search-engine-google-competition

Bing is by no means a success story, despite what Microsoft’s PR team claims

Bing かわいそうw

Bing が負けた理由は、Google と同じ土俵(広告収益モデル)で戦おうとしたから。Apple は広告は排除して、めちゃくちゃプライバシー重視するからうちのデバイスとかサブスク使って〜方式で攻めるみたい?

Apple ユーザに広告でリーチできんくなるとしたら厳しそう。相対的にお金も持ってるだろうし。

政府が後押しする AI 婚活

https://twitter.com/YahooNewsTopics/status/1335845060038955009

政府は来年度から、少子化対策の一環として、人工知能(AI)を活用した自治体の婚活支援事業を後押しする。年齢や年収などの希望条件に合わなくても、相性の良い見合い相手をAIで選び出すことで、婚姻数を増やし、少子化を食い止める狙い。

https://news.yahoo.co.jp/articles/78dd17187e3606f50a44c728516505004fab6a81

これに対し、AIを活用したシステムでは、趣味や価値観などの質問への回答やシステム内の検索傾向などを基に、希望条件と合致していなくても「自分に好意を抱く可能性のある人」を割り出し、提案することが可能だという。

fairness どうだろ。おもろそうなので匿名で関わらして欲しい。

大学の B3 の授業で Kaggle を題材にしてるらしい

https://twitter.com/mamoruk/status/1335411507815825408

そういえば今年から開講の B3「情報科学ゼミナール」では、Kaggle の Google Quest Q&A Labeling をやってもらっているのだが、BERT/RoBERTa/BART を試したり、入力を工夫したり、前処理や後処理をしたり、色々やっているようであった。しかし人数が多いとバッティング回避が難しいな……。

Buttcher本アドベントカレンダー(みんなえらい。。。)

可視化や統計における闇の魔術w

『可視化や統計でデータに『恣意的なストーリーを語らせる』16の闇の魔術【bad charts】』 https://qiita.com/Ringa_hyj/items/a938ec99d0fde052837e

闇の魔術に対する防衛術 Advent Calendar 2020(https://qiita.com/advent-calendar/2020/yaminomajutu) というアドベントカレンダーの記事。

みんな大好き 3D円グラフとか、割合だけじゃなくてサンプル数も気にしようねって話とか、グラフのスケールいじいじする話とか。

Netflix による Twitter での推薦マーケティング

https://twitter.com/NetflixJP_Anime/status/1332700782433423362

「思い出のアニメ」を3つ選ぶなら あなたはどのアニメを選びますか——?

わたしのアニメ歴3選 で   ツイートすると…  

おすすめアニメをリプライでお届け

@yu-ya4 は、

を選んで、

『進撃の巨人』The Final Season が推薦された。

他の人の結果とか見てる限り、そんなちゃんと推薦してない?

(https://twitter.com/NetflixJP_Anime/status/1332888833822658562 は、ごちうさシリーズを3作選んで、『DEVILMAN crybaby』を推薦されてて笑った)

何にせよ、推薦システムを直接活用してマーケに活かしてていいなと思った。

『データサイエンティストの育て方』発売

https://twitter.com/kaibundo_pub/status/1332137685339631621

データ分析部署やAI部門のマネジメントに必要な心構えを説いた、類書なき一冊です。データサイエンスがもたらす新しい社会についてもわかりやすく説明しています。

目次がひどいw データサイエンティスト=希少生物なので、死なせないように慎重に飼育しなければならないらしい。(読む)

目次 第1章 今はどういう時代なのか 第2章 データサイエンティストは希少生物である  1 データサイエンスという仕事   ⑴ 何が問題なのか   ⑵ データサイエンティストという職業  2 データサイエンティストとはどういう生き物なのか   ⑴ フィールドワークから   ⑵ 生き物としての特徴  3 希少生物の飼育係として   ⑴ マネージャー=飼育係の仕事   ⑵ 希少生物を死なせないという使命   ⑶ 生物多様性の保護   ⑷ パフォーマンスを出させるために 第3章 データサイエンティストが生きる環境を整える   ⑴ 棲処:働きやすい環境とは?   ⑵ 食べ物:活動(仕事)の原動力   ⑶ 繁殖:育成に必要なもの   ■ インタビュー① データアーティスト・山本社長   ■ インタビュー② DeNA・山田部長   ■ インタビュー③ 分析屋・廣川社長 第4章 これからどうなっていくのか

hoge

https://twitter.com/icoxfog417/status/1335035099373432833

機械学習と人の推薦差異について調べた研究。実用性/機能性重視の場合機械学習、体験/感覚重視の場合人の推薦が好まれる結果。しかし被験者に逆の推薦を活用するよう促すと差異が減少した(つまり、推薦の特徴を知ったうえで活用されるようになった)。

単純に推薦アルゴリズムを改善するのでなく、利用者の思い込み(チャットボットだからまともに答えられないんだろうなとか)を取り除くことで、推薦の利用のされ方が変わり得ることを示している。とても面白い記事。

『When Do We Trust AI’s Recommendations More Than People’s?』 https://hbr.org/2020/10/when-do-we-trust-ais-recommendations-more-than-peoples

(ちゃんと読んでない)

zerebom commented 3 years ago

hydra+Pytorch-lightning+wandbで作るNNプロジェクト

明日Kaggle Advent Calenderに投稿するブログを書きました。 (まだ書きかけで恐縮ですが...)

ブログ[WIP]: 明日貼ります

レポジトリ[WIP]: https://github.com/zerebom/hydra-pl-wandb-sample-project