WSH032 / sd-webui-fast-dataset-maker

A funny extension that integrates image-browsing , downloader , deduplicate , cluster , can quickly collect, classify and process your images. | 一个有趣的扩展,整合了 图库,下载,去重,聚类 ,可以快速搜集、分类、处理你的图片。
Apache License 2.0
20 stars 1 forks source link
cluster dataset-maker deduplicate gelbooru image-browsing image-dataset image-downloader stable-duffusion webui

sd-webui-fast-dataset-maker

一个有趣的扩展,整合了 图库下载去重聚类 ,可以快速搜集、分类、处理你的图片。

A funny extension that integrates image-browsing , downloader , deduplicate , cluster , can quickly collect, classify and process your images.

Powered by

我只是把它们整合起来,并独立运行

Credit

WebUI部分借鉴了AUTOMATIC1111/stable-diffusion-webui

现在我们有什么?

1. 强大的图片浏览器

来自zanllp/sd-webui-infinite-image-browsing sd-webui-infinite-image-browsing

2. Gelbooru的图片下载器

来自WSH032/Gelbooru-API-Downloader Gelbooru-API-Downloader

3. 基于imagededup,sklearn,WD14模型的图片去重与聚类

来自WSH032/image-deduplicate-cluster-webui deduplicate-webui

cluster-webui 展示

4. 强大的booru风格的tag编辑插件

来自toshiaki1729/dataset-tag-editor-standalone dataset-tag-editor-standalone

dataset-tag-editor-standalone 完整展示

😀Development

如果你觉得此项目有用💪,可以去 GitHub Repo stars 点一颗小星星🤤,非常感谢你⭐

遇到问题可以在Github上提issue ❓

Change History

V 1.1.0

08 Aug.2023 2023/08/08

New Features:

Other Changes:

Bug Fixes:

更新 Update

部署使用时更新方式:

本项目带有子模块,请使用以下命令拉取新的更新,并再次重复 安装 Install ,以免有新的依赖要求

git pull --recurse-submodules 

如果你不会使用git命令,可以运行update.ps1完成更新

安装 Install

(一)Colab使用

本项目链接 Fast-Dataset-Maker Colab

Notebook Name Description Link Old-Version
fast_dataset_maker NEW 整合了 图库下载去重聚类 的图片数据集WebUI

友情链接 SD-Lora-Training Colab

Notebook Name Description Link Old-Version
Colab_Lora_train 基于Akegarasu/lora-scripts的定制化Colab notebook
kohya_train_webui NEW 基于WSH032/kohya-config-webui的WebUI版Colab notebook

(二)部署使用

请尽量使用python >= 3.10

运行以下git命令克隆仓库并初始化子模块

git clone https://github.com/WSH032/sd-webui-fast-dataset-maker.git --recurse-submodules

安装依赖

# 对于通过 `requirements.txt` 安装的用户请注意
# 如果你想使用 Torch Cuda 或者 GPU 进行加速
# 请打开 `requirements.txt` 修改安装 torch=2.0.0 + cuda118

# If you want to install with CUDA, please use the following command:

--extra-index-url https://download.pytorch.org/whl/cu118
torch==2.0.0+cu118
torchvision==0.15.1+cu118

注意

此WebUI使用了Gradio非官方文档的操作方法,并在 gradio <=3.35.2, >=3.29.0 进行了测试,但不保证未来Gradio官方不会修改相应接口

requirements.txt 内只要求了 gradio >= 3.31.0 ,如果出现问题请尝试降级至 gradio <=3.35.2, >=3.31.0

或者使用 requirements_versions.txt 安装依赖

(三)做为AUTOMATIC1111/stable-diffusion-webui的扩展使用

请参阅原作者各自的仓库,几乎所有扩展均可做为 SD-WebUI 的扩展使用

A1111-SD-WebUI

部署使用 - 使用方法

注意

dataset-tag-editor-standalone扩展,在以原图方式,处理超过50张图片时候,会消耗巨大内存和时间,并且可能会出现图片过滤器不工作的情况

setting_resolution


Please refer to the original author's repository for the specific usage of each extension

各插件具体的使用方法请查看原作者仓库自述文件,这里不再重复


(一) 新手 请运行 run_webui.ps1

(二) 进阶 Shell中运行并设置参数

python webui.py # 使用 `--help` 查看可选参数

# 例如
# python webui.py --sd_webui_config="config.json" --update_image_index --inbrowser

(三) Python API 接口

请参阅 Colab 示例 或者 run_webui.ipynb

from webui import WebuiUtils

# params for extension
# 为各扩展设置参数,具体参数请参阅 `extensions/extensions_preload.py`
# 或者运行 `WebuiUtils(help=True)` 查看帮助信息
# Pyhton 接口参数 与 命令行参数一致
webui_utils = WebuiUtils(

    # for image_browsing setting
    sd_webui_config = "config.json",
    extra_paths = ["path"],
    update_image_index = True,

    # disable extension
    disable_image_browsing = False,
    disable_deduplicate_cluster = False,
    disable_tag_editor = False,
)

"""
The args of `queue()` and `launch()` are the same as `gradio.Blocks.queue()` and `gradio.Blocks.launch()`

接下来把它当成 `gradio.Blocks` 使用就好,所有接口与 `gradio.Blocks` 一致
"""
webui_utils.queue(concurrency_count=2)  # equal to `gradio.Blocks.queue(concurrency_count=2)`

webui_utils.launch(debug=True, server_port=7860)  # equal to `gradio.Blocks.launch(debug=True, server_port=7860)`