AIGC 绘图/图片创作

一、安装篇 🔗︎

1. 安装 Homebrew 🔗︎

2. 安装 Stable Diffusion Web UI 🔗︎

步骤: 🔗︎

  1. 安装依赖
    使用 Homebrew 安装必要的工具和库:

    brew install cmake protobuf rust [email protected] git wget
    
  2. 克隆仓库
    克隆 AUTOMATIC1111 的 Stable Diffusion Web UI 仓库:

    git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
    
  3. 下载模型
    下载并放置模型文件到 stable-diffusion-webui/models/Stable-diffusion/ 目录。例如:

  4. 启动服务
    启动 Web UI:

    ./webui.sh
    

    访问地址:http://127.0.0.1:7860/

常见问题及解决方法: 🔗︎

  • 错误信息RuntimeError: "LayerNormKernelImpl" not implemented for 'Half'
    • 修改 webui.sh 文件,添加以下参数:
      export COMMANDLINE_ARGS="--precision full --no-half --skip-torch-cuda-test"
      
    • 重新启动服务。

更多参考: 🔗︎


二、理论篇 🔗︎

1. LoRA 模型 🔗︎

  • 定义:LoRA(Low-Rank Adaptation)通过冻结预设好的模型权重参数,在每个 Transformer 中注入可训练的层,从而减少计算量。
  • 用途:生成指定风格、面孔、动作等要求的图片。
  • 资源CivitAI LoRA 模型集合

2. Colab(Google 免费 GPU) 🔗︎

  • 平台Google Colab
  • 启动命令
    python launch.py --share --xformers --enable-insecure-extension-access
    

三、实战篇 🔗︎

1. Checkpoint 模型 🔗︎

2. 快速出图技巧 🔗︎

2.1 调整参数找到最佳效果 🔗︎

  • 基本参数

    • 采样器DPM++ 2M Karras
    • Seed:填相同的值可以保持人物一致;若勾选 Resize seed from width/height,即使尺寸不同也能保持一致性。
    • Restore Faces:脸部修复功能。
    • HiRes.Fix:提升画质。
    • CFG Scale:控制生成图片与提示词的差异程度,默认值为 7 或 8。
  • 参考资料Stable Diffusion Art 参数详解

2.2 高效出图 🔗︎

  • Batch Count:同样的配置循环生成多次。
  • Batch Size:一次生成多张图片,方便挑选。

2.3 图片转高清 🔗︎

  • 内置功能通常已足够,但可以通过以下工具进一步提升清晰度:

2.4 一键图片转视频 🔗︎

  • 功能暂未详细说明。

3. 改变图片姿势 🔗︎

  • 插件ControlNet
    ControlNet 是一个强大的扩展,用于控制生成图片的姿态、布局等。

4. 提示语生成器 🔗︎

5. 社区资源 🔗︎


四、补充说明 🔗︎

  • Windows 用户:可以直接搜索相关教程,安装过程相对简单。
  • Mac 用户:建议按照上述步骤操作,并根据报错信息调整环境配置。