市面上能生成图片的AI工具确实不少,Midjourney、DALL-E 3,还有各种小程序和网站。 它们用起来简单,输入文字就能出图,对新手很友好。但你会发现,真正懂行的人,或者说那些专业设计师、画师,他们电脑里几乎都装着另一个东西:Stable Diffusion。
原因很简单,那些“一键出图”的工具,上限太低了。它们就像是相机里的自动模式,拍出来的东西能看,但总感觉差点意思,没法实现你脑子里真正想要的那个画面。而Stable Diffusion,就是那台可以让你调光圈、快门、感光度的手动相机。 它不只是一个工具,更像是一个平台,给了创作者几乎无限的控制权。
Stable Diffusion最大的特点是开源。 这意味着任何人都可以免费使用它,而且还能在它的基础上进行修改和再开发。 正是因为这个特性,全世界的开发者和AI爱好者围绕它建立了一个庞大的社区。社区里的人不断开发新的模型、插件和工作流,功能越滚越强大。打个比方,Midjourney像苹果手机,系统封闭,好用但能自定义的东西少。Stable Diffusion就像安卓手机,你可以随便刷机、装各种模块,把它打造成完全符合你个人需求的设备。

控制,才是专业创作的核心
专业人士为什么偏爱Stable Diffusion?关键在于“控制”。 在商业项目或者艺术创作里,模糊的、随机的结果是不可接受的。客户要的是“一个穿着2024年款耐克运动鞋的少年,在傍晚的东京街头奔跑,光线从他左后方打过来”,而不是“一个穿着运动鞋的少年在街上跑步”。这种精确的要求,只有Stable Diffusion能做到最好。
这种精确控制的核心,来自一个叫ControlNet的插件。 ControlNet可以说是Stable Diffusion的灵魂,它让AI绘画从“随机开盲盒”变成了“精确的定向制作”。
ControlNet是怎么工作的?简单说,它能让你用一张参考图来控制最终生成画面的多个方面,比如:
- 姿势控制: 你可以上传一张人物摆好姿势的照片,无论是自己拍的还是网上找的,ControlNet能提取出照片里人物的骨骼姿势,然后让AI生成一个全新的人物,但姿势和你的参考图一模一样。 比如,你想画一个超人飞天的姿势,但又画不好,直接找一张超人电影的截图,把姿势提出来,再用文字描述让AI画一个穿着不同战衣的角色,姿势保证不变。
- 线条控制: 你可以自己画一张简单的草图,哪怕线条很乱,ControlNet也能识别你的线条轮廓,然后在这个基础上生成一张细节丰富、色彩完整的作品。 这对那些有绘画基础但不想花时间细化的人来说特别有用。
- 深度控制: 它可以分析一张图片的深度信息,也就是哪里离镜头近、哪里离镜头远。利用这个,你可以复制一张照片的场景布局和空间关系,然后替换掉里面的所有东西。比如,你喜欢一张室内设计图的空间感,就可以用深度图把它“借”过来,然后换成你想要的中式或日式风格。
- 风格迁移: ControlNet还能做到更复杂的风格控制,比如把一张照片的光影、构图应用到一张全新的图片上。
怎么上手Stable Diffusion和ControlNet?
说到这里,你可能会觉得这东西听起来很复杂。确实,相比那些网页版工具,Stable Diffusion的安装和使用是有一些门槛。但只要你愿意花点时间,整个流程其实很直接。
第一步是安装。你需要一台配置还不错的电脑,最好有一块英伟达(NVIDIA)的显卡,显存至少6GB。 然后,你需要安装一个叫做“Stable Diffusion WebUI”的程序,这是一个由社区开发者维护的图形界面,让你不用敲代码就能使用Stable Diffusion。最有名的版本是AUTOMATIC1111开发的。
安装过程大致是:
1. 去GitHub网站找到这个项目的页面。
2. 根据说明下载安装包并完成安装。
3. 启动程序,它会在你的浏览器里打开一个本地网页。
第二步是安装ControlNet插件。 在WebUI的界面里,找到“扩展” (Extensions) 标签页,选择“从网址安装” (Install from URL)。 把ControlNet的GitHub仓库地址输进去,点击安装。 安装完成后重启WebUI。
第三步是下载ControlNet的模型。 ControlNet本身只是一个框架,要实现上面说的那些功能,还需要下载对应的模型文件。 比如,你需要下载Canny模型来做线条控制,下载OpenPose模型来做姿势控制。 这些模型文件需要放在ControlNet插件指定的文件夹里。
完成这些准备工作后,你就可以在文生图(txt2img)的界面下方看到ControlNet的控制面板了。 使用起来就像这样:
1. 在主界面写好你的文字提示词,比如“一个穿着盔甲的骑士”。
2. 在下面的ControlNet面板里,上传你的参考图,比如一张摆着战斗姿势的人体模型照片。
3. 勾选“启用”(Enable)。
4. 在“控制类型”(Control Type)里选择“OpenPose”。 预处理器(Preprocessor)和模型(Model)会自动匹配。
5. 点击“生成”按钮。
很快,你就会得到一张骑士的图片,他的姿势会和你上传的参考图基本一致。你可以调整“控制权重”(Control Weight)参数,来决定ControlNet对画面的影响程度。 权重越高,AI就越严格地遵守你的参考图。
不只是复刻,更是创造力的延伸
Stable Diffusion的强大之处还不止于此。除了ControlNet,你还可以自己训练模型。 这就是所谓的“炼丹”。
比如,你特别喜欢某位艺术家的画风,或者你想让AI画你自己的原创角色。你可以收集几十张这位艺术家的作品或者你角色的设定图,然后用一种叫做LoRA的技术,把这些图片“喂”给AI学习。 经过训练,AI就能生成具有特定风格或者特定角色的图片了。 很多设计师就是用这种方法,训练出自己公司产品风格的模型,用来快速生成营销海报和设计素材。
这种自定义能力,是Midjourney这类封闭工具完全无法比拟的。 它意味着你可以让AI成为你创作流程的一部分,而不是仅仅把它当成一个“图片搜索引擎”。你可以控制画面的每一个细节,可以把你的个人风格注入其中,甚至可以创造出之前不存在的全新风格。
当然,这也意味着你需要投入更多时间去学习和实践。你需要了解不同模型之间的区别,需要学习怎么写出更有效的提示词,还需要不断尝试各种参数组合。但对于追求极致效果和创作自由的专业人士来说,这种投入是值得的。因为他们得到的不仅仅是一张图片,而是一个能够无限拓展自己创意边界的强大工具。
原创文章,作者:MakeAI,如若转载,请注明出处:https://www.qidianhudong.com/aiyy/ai-pic/3200.html