Open nogawanogawa opened 1 year ago
CAさんのインターン生の成果ブログ。
実際に運用する際には、【オンライン性能モニタリング】パイプラインにより運用中のモデルのオンライン性能をモニタリングし、再学習やモデル改善の必要性を考えます。再学習やモデル改善の際は、【特徴量管理】パイプラインでFeature Storeに登録した特徴量を使い、【実験管理】パイプラインで実験管理することで、より良いモデルを効率よく作成できるようになります。
これインターンでやるんですね、すごい…
メルカリさんの商品推薦の事例の紹介。
embeddingの作成アルゴリズムには、word2vec -> implicit -> NNと変遷させていった模様
最終的には、テキストとカテゴリを分けたNNでembeddingを作成したそうです。
LinkedInで実在しない人間のプロフィールが増えていて困っているから機械学習で判別できるようにしたというブログ記事。判別にはプロフィール画像を使っている。
これまでも人の写真が与えられたときにそれが生成AIによって出力されたものかどうかを判定するNNベースの手法はいくつかあった。しかしLlinkedInは生成AIによって出力された画像には一定のパターンがあることに注目して、PCAベースの手法を提案している。この手法により、GAN系のモデルで生成された画像はNNベースの手法と同等またはそれ以上の性能が出たらしいが、Stable Diffusionではあまりうまく行かなかったらしい。
ちゃんと読めていない。
Tensorflow Datasetに AvroTensorDataset
というクラスを新たに生やした(?)というブログ。
AvroRecordDataset
は用意されていた(?)がパフォーマンスが微妙AvroTensorDataset
を開発
Why
推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!
発信のため、ここは public にしてあります。外部からの参加をご希望の方は樋口(https://twitter.com/zerebom_3) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!
What
Wantedly では隔週水曜日に
といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。
話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!
prev: https://github.com/wantedly/machine-learning-round-table/issues/199