fulfulggg / Information-gathering

Fusion of Python and GIMP
MIT License
0 stars 0 forks source link

テキスト事前サンプリングによるプロンプト最適化を用いたテキスト画像生成 #712

Open fulfulggg opened 5 hours ago

fulfulggg commented 5 hours ago

タイトル: テキスト事前サンプリングによるプロンプト最適化を用いたテキスト画像生成

リンク: https://arxiv.org/abs/2411.08127

概要:

TIPO (テキスト事前サンプリングによるプロンプト最適化を用いたテキスト画像変換) は、言語モデル (LM) によるテキスト画像変換 (T2I) 生成を自動プロンプトエンジニアリングで強化する革新的なフレームワークです。ユーザーが入力したプロンプトを洗練し拡張することで、TIPO はシンプルな入力と高品質な画像生成に必要な詳細なプロンプトのギャップを埋めます。大規模言語モデル (LLM) や強化学習 (RL) に依存する従来の手法とは異なり、TIPO は学習済みプロンプトデータセットの分布を用いてユーザー入力プロンプトを調整するため、軽量なモデルで複雑なランタイムコストを排除します。この事前サンプリング手法により、モデルの学習分布に基づいた効率的かつスケーラブルなプロンプト最適化が可能になります。実験結果では、TIPO が美的スコアの向上、画像の破損の減少、生成画像とデータセット分布の整合性の向上に効果的であることが示されました。これらの結果は、T2I システムにおけるプロンプトエンジニアリングの重要な役割を強調し、自動プロンプト改善の幅広い応用への道を開きます。

fulfulggg commented 5 hours ago

論文要約

fulfulggg commented 5 hours ago

@yukihiko-fuyuki が以下のラベルを提案し、適用しました: