建议：是否可对模型提速

mrhan1993 / Fooocus-API

FastAPI powered API for Fooocus

GNU General Public License v3.0

558 stars 148 forks source link

fooocus这个算法让我很疑惑，不吃CPU计算，不吃显存，就占着很大内存，是怎么样的一个计算方式才会有这样的表现（监测来的）。

我有个疑问点，模型是否可以全部加载着放显存里，然后能节省模型加载的时间？目前这个占用方式让我很奇怪。

如果我开成API，显存40G，我更期望模型一直在显存里呆着（以全局变量的形式），从而没有太高数据吞吐延时。

up主可以考虑一下这个问题吗？

mrhan1993 / Fooocus-API