llm-jp / experiments

Issue-Only Pretrain Task Management Repository
0 stars 0 forks source link

[マルチモーダルWG] - PDFからテキスト抽出 #52

Closed ZhishenYang closed 1 month ago

ZhishenYang commented 1 month ago

Overview PDFからテキスト抽出

Details PDFからテキスト抽出

数パラグラフ以内で実験に関する詳細を説明してください。 関連するリンクがあれば適宜してください。

Resources 計算機 クラスタ: llm-jp-nvlink ノード種別: gpu ノード台数: 16 コード リポジトリ: FIXME https://github.com/{org}/{repo} コミット: FIXME xxxxxx 評価データ: llm-jp-nvlink:/model/sip3/comprehensive/pdf/.zip 出力データ: 保存先: llm-jp-nvlink:/model/tkana/sip3/comprehensive/ W&B ログ: 開始日: 2024/10/09 終了予定日: 2024/10/15