新增圖片輸入與 DALL-E 3 功能的請求

memochou1993 / gpt-ai-assistant

OpenAI + LINE + Vercel = GPT AI Assistant

https://memochou1993.github.io/gpt-ai-assistant-docs/

MIT License

7.43k stars 9.59k forks source link

新增圖片輸入與 DALL-E 3 功能的請求 #299

Open waynesung opened 1 year ago

waynesung commented 1 year ago

目前開放了gpt-4-vision-preview以及DALL·E 3的API，希望作者能參考更新這些功能，謝謝！

GaryCHAN888 commented 8 months ago

請問是否能夠將圖片的品質提升呢？目前繪圖的品質的滿意度有一點點差人強意，希望是能夠更像DELL3畫出來的品質，提供對比的截圖。可以接受較久的Timeout時間(升級Vercel)，目前已經嘗試提升OPENAI_IMAGE_GENERATION_SIZE=1024X1024，以及OPENAI_COMPLETION_MODEL=gpt-4似乎都不能實現這個需求，希望作者能夠幫忙解答，謝謝！ Screenshot_20240317-103309682 (1) Screenshot_20240317-103158441_1

Jakevin commented 6 months ago

@GaryCHAN888

我發了一個PR，已經加入DALL-3模型跟 Standard 與 HD 品質

OPENAI_IMAGE_GENERATION_MODEL //模型名稱 dall-e-2 or dall-e-3
OPENAI_IMAGE_GENERATION_QUALITY //模型品質 standard or hd

值得注意的是 DALL-3 只有支援 1024x1024 以上的尺吋

GaryCHAN888 commented 6 months ago

@Jakevin

Thanks a lot! That is really helpful!

Jakevin commented 6 months ago

@waynesung 我剛剛發了個 PR，加入了 gpt-4-vision的功能，可以試試看

截圖 2024-04-26 下午2 47 55

memochou1993 commented 4 months ago

非常感謝 @Jakevin 和 @cdcd72 的貢獻。

在 v4.9.0 開始，可以使用 gpt-4o 模型讀取圖片，並使用 dall-e-3 模型產生圖片。

OPENAI_IMAGE_GENERATION_MODEL=dall-e-3
OPENAI_VISION_MODEL=gpt-4o