生成图片的AI那么多，为什么高手都私藏这一个？

市面上能生成图片的AI工具确实不少，Midjourney、DALL-E 3，还有各种小程序和网站。它们用起来简单，输入文字就能出图，对新手很友好。但你会发现，真正懂行的人，或者说那些专业设计师、画师，他们电脑里几乎都装着另一个东西：Stable Diffusion。

原因很简单，那些“一键出图”的工具，上限太低了。它们就像是相机里的自动模式，拍出来的东西能看，但总感觉差点意思，没法实现你脑子里真正想要的那个画面。而Stable Diffusion，就是那台可以让你调光圈、快门、感光度的手动相机。它不只是一个工具，更像是一个平台，给了创作者几乎无限的控制权。

Stable Diffusion最大的特点是开源。这意味着任何人都可以免费使用它，而且还能在它的基础上进行修改和再开发。正是因为这个特性，全世界的开发者和AI爱好者围绕它建立了一个庞大的社区。社区里的人不断开发新的模型、插件和工作流，功能越滚越强大。打个比方，Midjourney像苹果手机，系统封闭，好用但能自定义的东西少。Stable Diffusion就像安卓手机，你可以随便刷机、装各种模块，把它打造成完全符合你个人需求的设备。

控制，才是专业创作的核心

专业人士为什么偏爱Stable Diffusion？关键在于“控制”。在商业项目或者艺术创作里，模糊的、随机的结果是不可接受的。客户要的是“一个穿着2024年款耐克运动鞋的少年，在傍晚的东京街头奔跑，光线从他左后方打过来”，而不是“一个穿着运动鞋的少年在街上跑步”。这种精确的要求，只有Stable Diffusion能做到最好。

这种精确控制的核心，来自一个叫ControlNet的插件。 ControlNet可以说是Stable Diffusion的灵魂，它让AI绘画从“随机开盲盒”变成了“精确的定向制作”。

ControlNet是怎么工作的？简单说，它能让你用一张参考图来控制最终生成画面的多个方面，比如：

姿势控制： 你可以上传一张人物摆好姿势的照片，无论是自己拍的还是网上找的，ControlNet能提取出照片里人物的骨骼姿势，然后让AI生成一个全新的人物，但姿势和你的参考图一模一样。比如，你想画一个超人飞天的姿势，但又画不好，直接找一张超人电影的截图，把姿势提出来，再用文字描述让AI画一个穿着不同战衣的角色，姿势保证不变。
线条控制： 你可以自己画一张简单的草图，哪怕线条很乱，ControlNet也能识别你的线条轮廓，然后在这个基础上生成一张细节丰富、色彩完整的作品。这对那些有绘画基础但不想花时间细化的人来说特别有用。
深度控制： 它可以分析一张图片的深度信息，也就是哪里离镜头近、哪里离镜头远。利用这个，你可以复制一张照片的场景布局和空间关系，然后替换掉里面的所有东西。比如，你喜欢一张室内设计图的空间感，就可以用深度图把它“借”过来，然后换成你想要的中式或日式风格。
风格迁移： ControlNet还能做到更复杂的风格控制，比如把一张照片的光影、构图应用到一张全新的图片上。

怎么上手Stable Diffusion和ControlNet？

说到这里，你可能会觉得这东西听起来很复杂。确实，相比那些网页版工具，Stable Diffusion的安装和使用是有一些门槛。但只要你愿意花点时间，整个流程其实很直接。

第一步是安装。你需要一台配置还不错的电脑，最好有一块英伟达（NVIDIA）的显卡，显存至少6GB。然后，你需要安装一个叫做“Stable Diffusion WebUI”的程序，这是一个由社区开发者维护的图形界面，让你不用敲代码就能使用Stable Diffusion。最有名的版本是AUTOMATIC1111开发的。

安装过程大致是：
1. 去GitHub网站找到这个项目的页面。
2. 根据说明下载安装包并完成安装。
3. 启动程序，它会在你的浏览器里打开一个本地网页。

第二步是安装ControlNet插件。在WebUI的界面里，找到“扩展” (Extensions) 标签页，选择“从网址安装” (Install from URL)。把ControlNet的GitHub仓库地址输进去，点击安装。安装完成后重启WebUI。

第三步是下载ControlNet的模型。 ControlNet本身只是一个框架，要实现上面说的那些功能，还需要下载对应的模型文件。比如，你需要下载Canny模型来做线条控制，下载OpenPose模型来做姿势控制。这些模型文件需要放在ControlNet插件指定的文件夹里。

完成这些准备工作后，你就可以在文生图（txt2img）的界面下方看到ControlNet的控制面板了。使用起来就像这样：
1. 在主界面写好你的文字提示词，比如“一个穿着盔甲的骑士”。
2. 在下面的ControlNet面板里，上传你的参考图，比如一张摆着战斗姿势的人体模型照片。
3. 勾选“启用”(Enable)。
4. 在“控制类型”(Control Type)里选择“OpenPose”。预处理器(Preprocessor)和模型(Model)会自动匹配。
5. 点击“生成”按钮。

很快，你就会得到一张骑士的图片，他的姿势会和你上传的参考图基本一致。你可以调整“控制权重”(Control Weight)参数，来决定ControlNet对画面的影响程度。权重越高，AI就越严格地遵守你的参考图。

不只是复刻，更是创造力的延伸

Stable Diffusion的强大之处还不止于此。除了ControlNet，你还可以自己训练模型。这就是所谓的“炼丹”。

比如，你特别喜欢某位艺术家的画风，或者你想让AI画你自己的原创角色。你可以收集几十张这位艺术家的作品或者你角色的设定图，然后用一种叫做LoRA的技术，把这些图片“喂”给AI学习。经过训练，AI就能生成具有特定风格或者特定角色的图片了。很多设计师就是用这种方法，训练出自己公司产品风格的模型，用来快速生成营销海报和设计素材。

这种自定义能力，是Midjourney这类封闭工具完全无法比拟的。它意味着你可以让AI成为你创作流程的一部分，而不是仅仅把它当成一个“图片搜索引擎”。你可以控制画面的每一个细节，可以把你的个人风格注入其中，甚至可以创造出之前不存在的全新风格。

当然，这也意味着你需要投入更多时间去学习和实践。你需要了解不同模型之间的区别，需要学习怎么写出更有效的提示词，还需要不断尝试各种参数组合。但对于追求极致效果和创作自由的专业人士来说，这种投入是值得的。因为他们得到的不仅仅是一张图片，而是一个能够无限拓展自己创意边界的强大工具。

原创文章，作者：MakeAI，如若转载，请注明出处：https://www.qidianhudong.com/aiyy/ai-pic/3200.html