wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
297 stars 2 forks source link

[2021/05/20]推薦・機械学習勉強会 #100

Open yu-ya4 opened 3 years ago

yu-ya4 commented 3 years ago

Why

推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!

発信のため、ここは public にしてあります。外部からの参加をご希望の方は松村(https://twitter.com/yu__ya4) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!

What

Wantedly では隔週木曜日に

といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!

prev: #98

zerebom commented 3 years ago

Vertex AI

I/O 2021 で発表された、Google謹製 AIプラットフォーム。 MLOpsに組み込みやすく、コード量を80%削減しつつ、スケーラブルに利用できる。 https://cloud.google.com/vertex-ai?hl=ja

Vertex AI AutoML ForecastingでDNNの強力な多変量時系列予測を自動モデリングしてしまおう

Vertexで時系列予測を行った記事 記事リンク

多変量、かつTransformerや畳み込みを使った最新の手法で時系列モデリングをする(さらに全自動で!)というものがVertex AI AutoML Forecastingです。

Announcing ScaNN: Efficient Vector Similarity Search

NNベースの近似最近傍法 https://ai.googleblog.com/2020/07/announcing-scann-efficient-vector.html

Vertex AIから利用可能 https://cloud.google.com/vertex-ai/docs/matching-engine/overview

example.ipynbも用意されてる https://github.com/google-research/google-research/blob/master/scann/docs/example.ipynb

Annoyの数十倍早い image

ref: https://github.com/spotify/annoy

hakubishin3 commented 3 years ago

ForestInference がすごいらしい

yu-ya4 commented 3 years ago

BERT でデータ蒸留してラベル偏りを改善した取り組み

『ポジティブ?ネガティブ?ツイートの感情分析にBERTを活用した事例紹介 〜 学習データのラベル偏りに対する取り組み』 https://techblog.yahoo.co.jp/entry/2021051730150930/

ツイートの感情分析。ラベル付け難しくて人手で頑張っても使えるものが少ない and ラベルに偏りが生まれる。学習量水増ししてラベルの偏りを解消するために BERT つかって蒸留。増やして偏りを消した学習データセットでモデリング、サービスで利用。(サービスで利用するモデルは推論速度やメモリの制約から軽量なものを利用)

ZOZOTOWN における推薦システムの解説記事

『ディープラーニングを活用したレコメンドエンジン改善への取り組み』 https://techblog.zozo.com/entry/deep-learning-recommendation-improvement

ZOZOTOWNではレコメンドを活用するシーンが多く存在します。類似アイテムの推薦にはKnowledge Aware Recommendation。ユーザの短期のクリック予測にはSequential Recommendation。クーポン配信にはGraph Recommendation。各機能との相性を考慮し、最適なレコメンドアルゴリズムを選択する必要があります。

ZOZO さんって推薦にがっつり力入れ始めたん最近(この2,3年?)な気がするんだけど、進化のスピードえぐすぎん?

アノテーションでお小遣い稼ぎ♪

『APTO、AI学習データ(アノテーションデータ)作成を手伝うことでポイントが貰えるポイ活アプリ「harBest(ハーベスト)」をリリース』 https://prtimes.jp/main/html/rd/p/000000012.000053927.html

品質けっこう不安だけどその辺の担保とかどうするんだろ。なににせよ、使えるデータが増える世界はいいですな。

貴族の遊び

『NVIDIA、超ハイスペックPC向け「ビー玉転がしゲーム」を配信。1億ポリゴン以上の負荷に耐えられる最高級のグラフィックカードが必須』 https://news.denfaminicogamer.jp/news/210518q

「ビデオメモリ11GB以上が必要で、ほぼGeForce 3090必須のビー玉転がし」

まじで知らなかった

『ファストファッション「SHEIN」がアマゾンを抜き米国で最もインストールされたショッピングアプリに』 https://jp.techcrunch.com/2021/05/19/2021-05-18-shein-overtakes-amazon/

違いは、SHEINが独自の生産チェーンを持ち、デザインからプロトタイプ開発、調達、そして生産に至るまで全工程をコントロールしていることだ。その各段階は高度にデジタル化され、他の工程と連結しているため、特定の地域やユーザーの嗜好性に向けて特製した何百種類もの新製品を「日産」というペースで量産できる。

SHEINは販売チャネルも自社のものであるため、ユーザーデータも自ら保有している。そこが、顧客の取得をAmazonに依存し、ユーザーデータを自分では活用できないありきたりの消費者ブランドとの違いだ

面白い。ここからテックでも目立ってくるのかしら。👀