手把手教你跑一个二次元AI老婆!另附自然语言生图教程!

极!其!简!单!傻!子!都!会!本期将手把手教你从软件安装,到模型配置再到出图,百分百画出惊艳的图片!

手把手教你跑一个二次元AI老婆!另附自然语言生图教程!

引言

曾经我写过一篇文章,记录了从零开始研究AI绘图的经历——当时把Stable Diffusion WebUI、Stable Diffusion Forge WebUI、ComfyUI全装了一遍,各种找教程、实操、试错。好在凭借着仅剩的记忆也是顺着这些蛛丝马迹把丢掉的知识找回来了。

但那篇文章从现在看来,配置还是太麻烦了,并且有很多深层的东西没有讲清楚,只是教授了如何画 Danbooru 里已收录的角色。那么如果我想要画的角色很新或者没有收录呢?这期带你吃透AI绘图!

在纯小白的情况下,你可以跑出类似下面的图!(跑不出来你打死我!)

2025-05-13-11-59-50-ComfyUI_00016_.webp

2025-05-13-12-00-37-ComfyUI_00011_.webp

简单的思维风暴

在正式开始前,我们将会用到以下术语,这里会简单介绍都是做什么的:

  • ComfyUI:一个软件,是AI绘图控制台,你只需要在这里点点即可出图
  • checkpoint:一个底层的,作为基底的模型。可以直接用它开始绘图又或者搭配下面的Lora模型来绘图
  • LoRA:一个控制角色/风格的模型。可以通过载入不同的LoRA去画出不同的角色或风格
  • prompt:提示词,用以告知AI你想要画出什么样的东西

简单来说,这一切并不复杂,我们只需要首先挑选一个基底模型,如果你不挑或者你想画的角色正好就在其中,可以直接使用该角色的提示词作画。如果你想画不在其中的角色,只需要再载入一个LoRA模型即可。

正式开始

下载ComfyUI

尽管ComfyUI支持AMD显卡以及纯CPU绘图,但还是建议使用 NVIDIA Cuda 进行绘图,更快,兼容性也更好!

方式一:官方版(推荐)

前往 ComfyUI | 用AI生成视频、图像、音频 下载并安装,记得打开魔法或在设置中更改镜像源

点击右下角的开始运行,先让他进行初始化,直到它自动打开你的浏览器并且可以正常进入ComfyUI的界面

2025-05-13-12-06-57-image.webp

下载基底模型

大部分LoRA一般都需要这两个基底模型。其中 WAI 支持直接通过 Danbooru 里已有的角色直接作画,无需其他LoRA:

点击下载即可

如果你需要下载LoRA

首先你要知道你想画的角色的英文名,如 Cartethyia (鸣潮 - 卡提希娅)

然后前往 https://civitai.com/ 进行搜索,选择你喜欢的LoRA

在详情页你可以看到该LoRA所需要的基底模型。有些时候模型的简介也会写

下面的 Trigger Words 是推荐的 正向提示词 一般来说仅导入LoRA不写专有提示词也会有一定的效果

放置模型

Warning

这里有一个坑点,对于桌面版安装的ComfyUI,请将模型放到你当时安装时选择的文件夹中,如: C:\Users\af\Documents\ComfyUI ,而不是形如 C:\Users\af\AppData\Local\Programs\ComfyUI\resources\ComfyUI 的地方,更多请参见官方文档: 重要提示:请勿修改 resource/ComfyUI 文件夹 - Windows桌面版 - ComfyUI

打开 models 目录:

  • 将基底模型(类似 waiIllustriousSDXL_v160.safetensors)放入 checkpoints 文件夹
  • 将LoRA模型放入 loras 文件夹

启动!开始画!

启动 ComfyUI

默认打开应该是空空如也,这边提供了一个起手式+LoRA的工作流,你可以直接导入:

点我下载- 基础起手.json

点我下载- 基础起手+Lora.json

下载之后,点击左上角的ComfyUI图标,打开这个工作流

接下来,你应该已经有了这些节点

加载模型

这里加载基底模型,刷新ComfyUI后你应该可以在 Checkpoint加载器(简易) 处看到你放置的所有模型,选择带有 vPred... 的就是V预测模型

2025-05-13-12-11-55-image.webp

这里加载LoRA(如果有)

填写提示词

这里填写正/反向提示词,均为 英文 ,如果不会写就去找其他AI描述你要画什么,然后让它返回给你用以AI绘图的prompt

如何找到角色的提示词?

方式一:使用Danbooru角色标签(WAI专属)

WAI模型的一大特色就是支持直接通过Danbooru里已有的角色直接作画!你想要画什么呢?比如崩铁的流萤?

进入 Danbooru characters in NoobAI-XL (NAI-XL)

搜索流萤的英文名 firefly 或者搜索 star rail 找到所有关于崩铁的角色

2025-05-13-12-15-16-image.webp

复制 Prompt tags,然后将其粘贴进链接了正面条件的CLIP文本编码器

2025-05-13-12-16-35-image.webp

这样角色预设就写好了!

方式二:使用LoRA的Trigger Words

如果你使用LoRA,直接复制详情页的Trigger Words即可。

起手提示词推荐

我这里也提供了一些起手的提示词:

  • 正面条件

    masterpiece, best quality, newest, absurdres, highres
  • 负面条件

    text, watermark, worst quality, old, early, low quality, lowres, signature, username, logo, bad hands, mutated hands, mammal, anthro, furry, ambiguous form, feral, semi-anthro

我们将其添加到ComfyUI,如下图:

2025-05-13-12-19-32-image.webp

Tip

如果你想要图片是不同的样子请在正面提示词和反面提示词添加(必须为英文!不知道的用翻译或者问AI!)。比如想要让足部放到焦点上并且裸足就添加正面提示词barefoot, feet in foreground 如果你想要要纯自然语言生图就继续往下看!

设置图像尺寸

这里设置生成图片的分辨率,根据不同模型有不同的推荐分辨率:

WAI推荐分辨率(总面积约为 1024x1024):

  • 最推荐:832x1216
  • 其余:768x1344、896x1152、1024x1024、1152x896、1216x832、1344x768、1024x1536、1536x1024

2025-05-13-12-22-06-image.webp

建议前往模型发布页查看相关推荐分辨率信息

配置K采样器

这里控制生成参数(默认给你的就是一个不错的选择,如果不懂就不要动)

  • 种子:每次都是一个随机值,如果固定下来且其他内容无变化则会始终出相同的图
  • 步数:即AI需要重绘多少次,过低会导致鬼图、崩图,过高可能会导致元素冗杂、饱和度过高。推荐:28-35
  • CFG:AI对你输入的提示词的服从度,越高则越服从,越低则画得越天马行空(忽略一些提示词) 推荐7-9
  • 采样器名称euler
  • 降噪:AI生图的原理是将一张看起来像纯色图的图片一次次进行降噪来得到最终产物,该值设置得越低,则图片越不清楚、混杂,越高则越清晰,但更会出现过度锐利或过度解析

开启实时预览

为了确保在生图的时候我们不无聊,可以前往设置开启实时预览功能,将 实时预览 改为 自动 即可

运行生成

接下来点击右上角的运行,哦对了,你还可以编辑旁边的数字来一次性生成多张图片

由于我们开启了实时预览,你可以看到模型每一步的绘画进度

点击右上角的资产,可以展开,查看大图

所有生成的图片都可以在 output 文件夹看到

如果你想画其他角色也只需要:找LoRA,写推荐提示词,开跑!

常见问题与技巧

  • AI生成的图片随机性较强:每一次生成的图片都不太一样,多试试!

  • 避免生成涩图:可以在负面提示词添加 NSFW,在正面提示词添加 safe

  • 参考资源:更多WAI模型的技巧可以到Civitai模型页面的About查看 2025-05-13-12-30-55-image.webp

新章:纯中文自然语言生图!

Warning

需要一个大显存(>8G)的图形显示卡

思路

现在LLM这么发达,我们为什么不能使用LLM将我们输入的 中文句子 翻译为生图模型能看懂的 英文 Tag 呢?

当然可以,于是该项目应运而生了!

https://github.com/afoim/natureDrawImage

推荐使用 Google AI Studio 里面的High思考级别的Gemma4。它的安全审查并不审查 思维链 所以…

通过在本地启动LM Studio(或Ollama,其他的在线LLM…)

让LLM做 中文 -> 英文 Tag 的转换,最后再传给生图模型,即可实现 纯中文的生图!

搭建

Tip

推荐拉取仓库后直接询问AI如何部署该项目。后文只做项目特殊点阐述

项目采用工作流形式来模仿 Stable Diffusion 的模板。你需要手动制作多个工作流来跑不同角色(Lora),或者创建一个通配工作流来跑Danbooru角色(无Lora)

项目启动后会读取你的本地工作流,选择其一后即可开跑

其余概述参见仓库 README 由于文章具有时效性,如果有不懂的地方建议询问AI

新版 2x.nz/draw 使用技巧

我们构建了一个站点,可以供AI绘图爱好者们免费生图: https://2x.nz/draw

文生图

使用DanBooru角色库

目前文生图采用 WAI 模型,仅支持动漫画风。它本身可以跑很多角色,具体参见 Danbooru characters in NoobAI-XL (NAI-XL)

你需要将 工作流 切换为 无Lora 避免角色Lora影响最终出图

搜索(用英文)并选择一个你想跑的角色,复制角色tag

填入正向提示词

DanBooru的角色有非常多,所以在大多数情况下,我们不需要引入特定角色的Lora即可出图

使用角色Lora

直接选择你想跑的角色的工作流,正向提示词会自动添加,直接生图即可

自定义绘画

你可以使用 英文Tag 来控制图像生成,如在正向提示词添加 school ,则最终出图会有 学校元素 (图例为校服)

为了便于理解和使用,你可以在自然语言描述 文本框中输入 中文的自然语言 ,随后选择 转换 ,LLM将会把你的需求和原本的Prompt融合,最终在 正/负面提示词 输出合并后的 英文Tag

你也可以手动使用主流LLM来做这件事,如 Deepseek,ChatGPT,Gemini,Claude…

反向提示词

顾名思义,在这里填写的 英文Tag ,模型会尽可能回避。最常用的情况是填写 nsfw ,防止模型出涩图

画风/风格

实际上,画风是一个特殊的 英文Tag ,由 by 开头,所有画风可以前往 Danbooru Artists’ Styles in NoobAI-XL (NAI-XL) 寻找。这也是 DanBooru 提供的,我们默认已经精选了一批画风。可以直接选择,选择后,将会在最终生图前,为正向Prompt注入画风Tag

将这些串起来

读到这里,想必你已经完全掌握了文生图的用法。无外乎三件事

  • 跑谁?即从DanBooru角色库中选择角色或直接选择角色Lora
  • 怎么跑?即你想让图中的角色做什么,通过自然语言描述+LLM转换或直接通过书写 英文Tag 来指示模型生成你想要的图片
  • 怎么画?即你想要的出图画风,这是可选项,但推荐选择。默认画风AI感太重

Enjoy txt2img!

图生图

相比于文生图,图生图要简单的多,你只需要上传图片,并描述你想要做的事情即可。尽管支持中文描述,但英文描述的遵从度更高

这是一个提示词工程。模型的上限取决于你的指示

Now, eojoy img2img!