Open zerebom opened 1 year ago
連合学習がどのように動作して個人情報を守っているのかが簡単に説明されているブログ記事。
教師データが無い時の取り組み方についての紹介
BERTopicというOSSの紹介記事
文書の埋め込み → Sentence-BERT を利用。今後も言語モデルの発展に伴って付け替え可能。 文書のクラスタリング → UMAP で次元削減した後、 HDBSCAN でクラスタリング。次元削減手法やクラスタリング手法も付け替え可能。 トピック表現 → クラスタ単位の TF-IDF を提案し、重要度を可視化できるように。
生産的なエンジニアチーム構築のために新しいアプローチを提供するGitHub Nextチームのツールにどんな物があるかを調べてみた。
開発者としてツールを使うだけでなく、AIを生産性向上の手段に組み込むにはどんなアイディアがあるのか、という観点で見ても面白い。
https://githubnext.com/projects/copilot-labs
GitHub Copilotのexperimentalバージョン。 vscodeのextensionとして利用できる。explain, language translation, brushes, test generationの項目がある。コード範囲を選択してボタン押すだけでドキュメントやTypeHintを追加してくれる。触った感じ純正なので、インタラクションもキビキビしており、日常的に使いたいと思った。 ただ、精度はexperimentalということもあって微妙なときもある。
うろ覚えなCLIコマンドをCopilotに対話的に聞けるツール。??
, git?
,gh?
の3つが提供されている。gitコマンド、githubコマンドはカスタマイズされてて強力に支援できる。
開発者がハイライトしたコードと、関連度が高いコードを示してくれるツール。従来の静的解析だけでは飛べなかったコードジャンプが可能になるイメージ。
音声認識でコードを書いてくれるツール
issueをたて(ex. tensorflowをpytorchに書き換える)て、スラッシュでコマンドを指定すると、issueの内容を解析し、どのような方法で改善するかを提案してくれる。suggestコマンドで、実現のためのPRも作成してくれる。
GithubのRepositoryにインタラクティブなブロックを設置できるようになるツール。例えば、csvを見やすいdatabase形式にしたり、visualizeしてくれる。comunityの活発度の可視化などにも対応。
巨大言語モデルをRTX3090等の個人用マシンで動かせるツール。GPU, CPU, ディスクのメモリと計算の集約と、重みの圧縮により達成できる。今後はchatツール用にlatencyの改善やm1,2macへの対応などが予定されている。
Why
推薦・機械学習勉強会は、推薦や機械学習、その周辺技術を通じてサービスを改善することにモチベーションのある人達の集まりです。ニュースやブログから論文まで、気になったものについてお互い共有しましょう!
発信のため、ここは public にしてあります。外部からの参加をご希望の方は樋口(https://twitter.com/zerebom_3) まで DM を送るか、Wantedly Visit の募集(https://www.wantedly.com/projects/391912) よりご連絡ください!
What
Wantedly では隔週木曜日に
といった話をする「推薦・機械学習勉強会」を開催しています。 この ISSUE はその会で話すネタを共有するための場所です。
話したいことがある人はここにコメントしましょう! 会の間に話した内容もここにメモしましょう!
prev: #183