ComfyUI-Molmo

使用molmo模型，在ComfyUI中实现图片描述，分析图片内容。可以把图片转文本的结果作为提示词生成图片。

功能

在ComfyUI的管理器中搜索并安装"ComfyUI-Molmo"。
或者，也可以手动克隆此仓库到ComfyUI的custom_nodes目录:
```
git clone https://github.com/CY-CHENYUE/ComfyUI-Molmo.git
```
重启ComfyUI。
依赖安装：
- 首次运行节点时，将自动下载并安装所需的依赖项。
- 注意：部分依赖可能需要重启ComfyUI后才能生效。如果遇到问题，请尝试重新启动ComfyUI。
模型下载：
- 如果模型文件不存在，将在首次使用时自动下载。
- 由于模型文件较大，下载可能需要一些时间，请耐心等待。

注意：初次使用时，由于需要下载模型和安装依赖，启动时间可能会较长。后续使用将会更快。

安装后,您可以在ComfyUI的节点菜单的"Molmo"类别中找到"Molmo 7B D bnb 4bit"节点。

alt text

如果模型不存在,将在首次使用时自动下载。国内环境可以通过网盘下载 https://pan.quark.cn/s/882aea39f59c 后放到ComfyUI/models。
需要CUDA兼容的GPU以获得最佳性能
由于模型大小,初始加载时间可能较长
使用 unload_model_after_generation 选项可以在生成后释放GPU内存，但可能会增加下次使用时的加载时间

模型使用基于Molmo 7B-D的量化版本，可以降低显存的使用。

欢迎贡献!请随时提交Pull Request.