CY-CHENYUE / ComfyUI-Molmo

Generate detailed image descriptions and analysis using Molmo models in ComfyUI.
Apache License 2.0
41 stars 1 forks source link

ComfyUI-Molmo

使用molmo模型,在ComfyUI中实现图片描述,分析图片内容。可以把图片转文本的结果作为提示词生成图片。

功能

安装

  1. 在ComfyUI的管理器中搜索并安装"ComfyUI-Molmo"。

  2. 或者,也可以手动克隆此仓库到ComfyUI的custom_nodes目录:

    git clone https://github.com/CY-CHENYUE/ComfyUI-Molmo.git
  3. 重启ComfyUI。

  4. 依赖安装:

    • 首次运行节点时,将自动下载并安装所需的依赖项。
    • 注意:部分依赖可能需要重启ComfyUI后才能生效。如果遇到问题,请尝试重新启动ComfyUI。
  5. 模型下载:

    • 如果模型文件不存在,将在首次使用时自动下载。
    • 由于模型文件较大,下载可能需要一些时间,请耐心等待。

注意:初次使用时,由于需要下载模型和安装依赖,启动时间可能会较长。后续使用将会更快。

使用

安装后,您可以在ComfyUI的节点菜单的"Molmo"类别中找到"Molmo 7B D bnb 4bit"节点。

输入参数

输出

示例

https://github.com/user-attachments/assets/173f44b2-ecc2-4218-b774-ce8aaa96d060

alt text

注意事项

性能

模型使用基于Molmo 7B-D的量化版本,可以降低显存的使用。

致谢

贡献

欢迎贡献!请随时提交Pull Request.