wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
297 stars 2 forks source link

[2022/08/25]推薦・機械学習勉強会 #157

Open zerebom opened 1 year ago

zerebom commented 1 year ago

Why

推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!

発信のため、ここは public にしてあります。外部からの参加をご希望の方は樋口(https://twitter.com/zerebom_3) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!

What

Wantedly では隔週木曜日に

といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!

prev: #155

sugakoji commented 1 year ago

Stability AI社がStable diffusionのオープンソース化

拡散モデル

いままでtext-to-imageのモデルのDALLE2やMidjourneyは使うことはできたが、中身は公開されてなかった。しかし、Stable Diffusionはモデルと重みを公開している。

LAION-5Bという50億以上の画像とテキストのペアのデータセットの一部を使ってトレーニングされているらしい

簡単にcolabなどでも試せる。npakaさんという方のnote

個人の所感だと、DALLE2, Midjourneyと比べてStable Diffusionが特別優れているというわけではなさそう

良い画像を生成するために、必要な単語や表現を人間側が学習して使わなきゃいけないのは、共通っぽい

(Stable Diffusion、一般的なクエリでもNot Safe For Work扱いになったりするのが気になった)

Midjourneyのbetaコマンドの公開と停止

midjourneyに--betaというオプションをつけて、画像を生成することができる。

--betaなしと比べて、性能が上がっているようにみえる。

stable diffusionのコードを取り込んだみたいな噂があるが真偽不明。

現在は公開停止中

結構印象が違う画像が生成された。

2次元のイラストなどは、betaのほうが得意そう

zerebom commented 1 year ago

見えないアルゴリズムを攻略せよ、インフルエンサーたちの戦い

インフルエンサーとプラットフォームのアルゴリズムの関係、説明性について論じた記事。 概要

感想

魔術としての「プロンプト」 プロンプトエンジニアリングの可能性

pandas1.5.0のリリースノートを読んだ

ref: https://pandas.pydata.org/pandas-docs/version/1.5/whatsnew/v1.5.0.html ref: https://medium.com/virtuslab/pandas-stubs-how-we-enhanced-pandas-with-type-annotations-1f69ecf1519e

Hayashi-Yudai commented 1 year ago

Causal inference when treatments are continuous variables

介入を表す変数がカテゴリ変数でなく連続値の場合に因果推論をend-to-endに行って良い結果が得られたという話

image

介入と出力の関係を示す応答関数が線形の場合にはMSEを27 %, 非線形の場合には 38 %減少させることができた。

nogawanogawa commented 1 year ago

KDD2022 で気になった研究

08/14 - 08/18 にKDD2022が開催。まだ全然論文とか見れていないが、面白そうな論文をピックアップしてくださっている方がいらっしゃった。

2022年のPFNの機械学習基盤

PFN社のオンプレ機械学習環境が今どうなっているかの紹介。 オンプレのサーバーで機械学習環境を作っているのが、ただただすごいと思った。

等を意識して運用している模様。特にリサーチャー・エンジニアとスキルが異なる人が使用する環境を作るのはめちゃくちゃ大変そう。ヘテロジニアスな分散処理とか、やるだけでもめっちゃ大変そう。すごい。