Open land007 opened 3 months ago
同问,能流式吗?一边儿生成一边儿播,要不然作为大模型回答内容转音频,等模型那边儿全部给回复完再等这边儿全推理完,就不能算实时生成了。
这个api服务的模型支撑是离线的吗,无网环境下服务还能正常运行吗