memochou1993 / gpt-ai-assistant

OpenAI + LINE + Vercel = GPT AI Assistant
https://memochou1993.github.io/gpt-ai-assistant-docs/
MIT License
7.15k stars 9.24k forks source link

新增圖片輸入與 DALL-E 3 功能的請求 #299

Open waynesung opened 8 months ago

waynesung commented 8 months ago

目前開放了gpt-4-vision-preview以及DALL·E 3的API,希望作者能參考更新這些功能,謝謝!

GaryCHAN888 commented 4 months ago

請問是否能夠將圖片的品質提升呢?目前繪圖的品質的滿意度有一點點差人強意,希望是能夠更像DELL3畫出來的品質,提供對比的截圖。 可以接受較久的Timeout時間(升級Vercel),目前已經嘗試提升OPENAI_IMAGE_GENERATION_SIZE=1024X1024,以及OPENAI_COMPLETION_MODEL=gpt-4似乎都不能實現這個需求,希望作者能夠幫忙解答,謝謝! Screenshot_20240317-103309682 (1) Screenshot_20240317-103158441_1

Jakevin commented 2 months ago

@GaryCHAN888

我發了一個PR,已經加入DALL-3模型 跟 Standard 與 HD 品質

OPENAI_IMAGE_GENERATION_MODEL //模型名稱 dall-e-2 or dall-e-3
OPENAI_IMAGE_GENERATION_QUALITY //模型品質 standard or hd

值得注意的是 DALL-3 只有支援 1024x1024 以上的尺吋

GaryCHAN888 commented 2 months ago

@Jakevin

Thanks a lot! That is really helpful!

Jakevin commented 2 months ago

@waynesung 我剛剛發了個 PR,加入了 gpt-4-vision的功能,可以試試看

截圖 2024-04-26 下午2 47 55

memochou1993 commented 1 week ago

非常感謝 @Jakevin 和 @cdcd72 的貢獻。

v4.9.0 開始,可以使用 gpt-4o 模型讀取圖片,並使用 dall-e-3 模型產生圖片。

OPENAI_IMAGE_GENERATION_MODEL=dall-e-3
OPENAI_VISION_MODEL=gpt-4o