wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
306 stars 2 forks source link

[2020/04/16] 推薦・機械学習勉強会 #45

Open yu-ya4 opened 4 years ago

yu-ya4 commented 4 years ago

Why

この会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!

発信のため、ここは public にしてあります。外部からの参加をご希望の方は松村(https://twitter.com/yu__ya4) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!

What

Wantedly では隔週木曜日に

といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!

prev: #43

yu-ya4 commented 4 years ago

@yu-ya4 の 2週間の Twitter のいいねから抜粋

分散表現特化の解説本

良書らしい。👀

分散表現特化の解説本。単語/文の表現、BERTに代表される文脈考慮の表現はもちろん、グラフベースの分散表現も解説されている。近年問題とされているバイアスの問題にも触れられており、かなりの良書だと思う。

https://twitter.com/icoxfog417/status/1246229055218700289

Correlation does not imply causation.

好き。笑

mask and bubble tea

https://twitter.com/dr_strlv/status/1246989055771832320

言語処理100本ノック2020

https://twitter.com/chokkanorg/status/1247312205671874561

やったほうがいいのは知ってる。

Coursera が5月末まで100のコースを無償化

データサイエンスでは統計のコースが対象

コンピュータ・サイエンスのカテゴリではアルゴリズムとデータ構造周りが充実してそう。

オライリー Pythonではじめる教師なし学習

読みたい。👀

顧客目線でデータ分析するのが大切だよって経験談

日経の連載記事。いきなり生データだけを使った分析をせずに、まずはユーザの理解をしよう。そのためにはまず自分がユーザになろう。その結果得た定性的な切り口を持ってデータ分析をするといいよね、って感じの話。

いくつか具体例もあってわかりやすくて面白かった。

Netflix の確率、統計学に焦点を当てたドキュメンタリー

大数の法則→p値→標本抽出→ベイズ推定→機械学習をドキュメンタリータッチで描いてる。

https://twitter.com/ponsa__ku/status/1249891029160833029

進化し続ける確率の科学に光を当てたドキュメンタリー。いかに予測が我々の生活を左右しているか、また、統計学とアルゴリズムの信頼性について探っていく。

観たい。

kmotohas commented 4 years ago

Chest CT Findings in Cases from the Cruise Ship “Diamond Princess” with Coronavirus Disease 2019 (COVID-19) https://pubs.rsna.org/doi/10.1148/ryct.2020200110

ダイアモンドプリンセス号でのCOVID-19患者104名のうち、肺CTスキャン画像に異常があった人の割合は61%とのこと。 自覚症状ある人に絞ると79%で、自覚症状なくても54%がCTに異常あり。 PCR検査に時間がかかるならディープラーニングの画像診断もかなり有望そう。 image

ASSISTIVE DIAGNOSIS AI TOOLS https://axial.ai/ Lung Infection Quantification of COVID-19 in CT Images with Deep Learning https://arxiv.org/abs/2003.04655

https://global.infervision.com/

KengoTeshima commented 4 years ago

Airbnbの検索推薦取り組みについて

arxiv

Airbnbの検索順位を決める要因について

hakubishin3 commented 4 years ago

Performance is not all you need -CV分野における論文への要求-

https://www.slideshare.net/cvpaperchallenge/performance-is-not-all-you-need-cv

agatan commented 4 years ago

ACL 2020 で COVID-19 に関する workshop があるらしいのだけど、さくっとそこそこ良い検索エンジンを作るみたいなのがあって面白そう。

BM25 で retrieve → T5 で rerank → BioBERT でハイライト

yu-ya4 commented 4 years ago

ヤフーの推薦システム事例

deim で聞いたやつの一部。

コールドスタート問題に注目。使ったことのないサービスでもヤフー内の他のサービスの行動履歴を基にいい感じの推薦を可能にする。 サービス横断してユーザの情報を利用して推薦を実現。かっこいい。こんなんやってみたい。

あるユーザーが「九州 旅行」、「九州 お寺」といったキーワードで検索していたり、Yahoo!天気で来週末の九州地方の天気を確認したりしているといったデータが得られているとします。このようなデータから「このユーザーは来週末に九州のお寺へ参拝に行こうとしているかもしれない」という仮説が立てられます。

一方で、過去に同じような検索やサービス利用をしたユーザーのなかで、Yahoo!トラベルにて九州の国内ツアーを利用したというデータが一定量得られているとします。すると、Yahoo!トラベルでの国内ツアーの予約の情報と、ユーザーのYahoo!検索、Yahoo!天気といった他サービスでの利用傾向を紐づけることが可能です。

yu-ya4 commented 4 years ago

目の前のユーザの予測だけでなく、長い目線での利益を手に入れようって話。

CLTV(Customer Life Time Value) を予測しようってモチベーションの論文