fulfulggg / Information-gathering

Fusion of Python and GIMP
MIT License
0 stars 0 forks source link

CodexGraph: コードグラフデータベースを用いた大規模言語モデルとコードレポジトリの橋渡し #14

Open fulfulggg opened 1 month ago

fulfulggg commented 1 month ago

タイトル: CodexGraph: コードグラフデータベースを用いた大規模言語モデルとコードレポジトリの橋渡し

リンク: https://arxiv.org/abs/2408.03910

概要:

大規模言語モデル(LLM)は、HumanEvalやMBPPのような単独のコードタスクでは優れていますが、コードリポジトリ全体を扱うとなると困難に直面します。この課題により、リポジトリ規模でのLLMとコードベースの相互作用を強化する研究が進められています。 現在の解決策は、類似性ベースの検索や手動ツール、APIに依存していますが、それぞれに大きな欠点があります。 類似性ベースの検索は複雑なタスクでは再現率が低いことが多く、手動ツールやAPIは特定のタスクに特化しており、専門知識が必要となるため、多様なコードタスクや実際のアプリケーションへの汎用性が制限されます。 これらの制限を軽減するために、コードリポジトリから抽出されたグラフデータベースインターフェースとLLMエージェントを統合した\frameworkを導入します。 グラフデータベースの構造的特性とグラフクエリ言語の柔軟性を活用することで、\frameworkはLLMエージェントがクエリを構築して実行できるようにし、正確でコード構造を認識したコンテキスト検索とコードナビゲーションを可能にします。 \frameworkを評価するために、CrossCodeEval、SWE-bench、EvoCodeBenchの3つのベンチマークを使用します。 さらに、現実世界のコーディングアプリケーションを5つ開発しました。 \frameworkは、統一されたグラフデータベーススキーマにより、学術環境と現実世界の両方で競争力のあるパフォーマンスと可能性を示し、ソフトウェアエンジニアリングにおける汎用性と有効性を示しています。 アプリケーションのデモ:https://github.com/modelscope/modelscope-agent/tree/master/apps/codexgraph_agent.

fulfulggg commented 1 month ago

@yukihiko-fuyuki が以下のラベルを提案し、適用しました:

以下の新しいラベルが作成され、適用されました:

fulfulggg commented 1 month ago

論文要約

CodexGraph: コードグラフデータベースを用いた大規模言語モデルとコードレポジトリの橋渡し

論文要約