wantedly / machine-learning-round-table

Gather around the table, and have a discussion to catch up the latest trend of machine learning 🤖
https://www.wantedly.com/projects/391912
306 stars 2 forks source link

[2022/02/22]推薦・機械学習勉強会 #185

Open zerebom opened 1 year ago

zerebom commented 1 year ago

Why

推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!

発信のため、ここは public にしてあります。外部からの参加をご希望の方は樋口(https://twitter.com/zerebom_3) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!

What

Wantedly では隔週木曜日に

といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。

話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!

prev: #183

Hayashi-Yudai commented 1 year ago

How Federated Learning Protects Privacy

連合学習がどのように動作して個人情報を守っているのかが簡単に説明されているブログ記事。

hakubishin3 commented 1 year ago

Prompt Engineering に関するドキュメント

データ活用が事業貢献していることを示すための取り組み

nogawanogawa commented 1 year ago

教師データがないPoCにおける定量評価のポイント

教師データが無い時の取り組み方についての紹介

BERTopic で文書のクラスタリングを試す

BERTopicというOSSの紹介記事

文書の埋め込み → Sentence-BERT を利用。今後も言語モデルの発展に伴って付け替え可能。 文書のクラスタリング → UMAP で次元削減した後、 HDBSCAN でクラスタリング。次元削減手法やクラスタリング手法も付け替え可能。 トピック表現 → クラスタ単位の TF-IDF を提案し、重要度を可視化できるように。

zerebom commented 1 year ago

GitHub Nextのツール群を調べてみた

生産的なエンジニアチーム構築のために新しいアプローチを提供するGitHub Nextチームのツールにどんな物があるかを調べてみた。

開発者としてツールを使うだけでなく、AIを生産性向上の手段に組み込むにはどんなアイディアがあるのか、という観点で見ても面白い。

Copilot Labs

https://githubnext.com/projects/copilot-labs

GitHub Copilotのexperimentalバージョン。 vscodeのextensionとして利用できる。explain, language translation, brushes, test generationの項目がある。コード範囲を選択してボタン押すだけでドキュメントやTypeHintを追加してくれる。触った感じ純正なので、インタラクションもキビキビしており、日常的に使いたいと思った。 ただ、精度はexperimentalということもあって微妙なときもある。

GitHub Copilot CLI

うろ覚えなCLIコマンドをCopilotに対話的に聞けるツール。??git? ,gh? の3つが提供されている。gitコマンド、githubコマンドはカスタマイズされてて強力に支援できる。

GitHub Copilot Radar

開発者がハイライトしたコードと、関連度が高いコードを示してくれるツール。従来の静的解析だけでは飛べなかったコードジャンプが可能になるイメージ。

Hey, GitHub!

音声認識でコードを書いてくれるツール

AI for Pull Requests

issueをたて(ex. tensorflowをpytorchに書き換える)て、スラッシュでコマンドを指定すると、issueの内容を解析し、どのような方法で改善するかを提案してくれる。suggestコマンドで、実現のためのPRも作成してくれる。

GitHub Blocks

GithubのRepositoryにインタラクティブなブロックを設置できるようになるツール。例えば、csvを見やすいdatabase形式にしたり、visualizeしてくれる。comunityの活発度の可視化などにも対応。

image image

FlexGen

巨大言語モデルをRTX3090等の個人用マシンで動かせるツール。GPU, CPU, ディスクのメモリと計算の集約と、重みの圧縮により達成できる。今後はchatツール用にlatencyの改善やm1,2macへの対応などが予定されている。