画图AI自动生成图，你想要啥都能画出来！

你有个画面，比如，一只穿着唐朝铠甲的猫，站在赛博朋克风格的长安城墙上，手里拿着一把发光的激光剑。搁以前，这事儿你只能想想。现在，把这句话打出来，回车。等个半分钟，这张图就出来了。

这就是AI画图。不是什么魔法，就是个电脑程序。你给它文字，它给你图像。这东西已经不是什么新鲜玩意了，很多人都在用。下面就说说这东西到底是怎么回事，怎么用，用了之后又会怎么样。

AI画图的工作原理

想知道AI怎么画画，得明白一个叫“扩散模型”的东西。

这东西的工作方式有点意思。你想象一张全是雪花点的电视屏幕，完全是噪音。AI的工作，就是根据你的指令，把这些噪音一步步变成一张清晰的图。

它能做到这一点，是它之前看过几十亿张图片和对应的文字描述。

①AI的学习过程
它会先拿一张正常的猫的照片。
往照片上一点点加噪音，直到照片完全变成一堆雪花点。
它会记住从清晰变模糊的每一步。
这个过程重复几十亿次，看各种各样的图。
最后，它就学会了怎么把任何一张清晰的图变成噪音。

②AI的画图过程
你给它指令，比如“一只猫”。
它先生成一张纯粹的、满是噪点的图。
它开始反向操作，把学习时记住的步骤倒过来。
它根据“猫”这个词，一点点地把噪音抹掉，慢慢还原出猫的轮廓、毛色、眼睛。
最后出来的，就是一张全新的猫图，不是它数据库里存的任何一张。

它不是在复制粘贴。它是在理解了“猫”这个概念之后，从一堆随机像素里，把符合这个概念的图像给“造”了出来。

现在市面上有哪些画图AI

工具很多，但大家用得最多的就那么几个。每个脾气都不一样。

A.Midjourney
这个工具出的图，艺术感很强。你随便写几个词，它生成的图经常都很好看，光影和构图都挺讲究。
特别适合做那种需要感觉、需要氛围的图，比如游戏海报、小说封面。
缺点是用起来有点麻烦。你得在Discord那个聊天软件里，通过跟机器人对话的方式来画图。

B.Stable Diffusion
这是个开源的工具。意思就是，免费，而且谁都能改。
高手最喜欢用这个。因为网上有无数人做了各种各样的模型。你想画二次元，就下个二次元模型。你想画照片一样的真人，就下个写实模型。
它的控制功能也最细。你可以上传一张火柴人的图，让AI生成的画里，人物姿势跟你的火柴人一模一样。
缺点是对电脑配置要求高，特别是显卡。而且要自己安装、设置，新手搞起来会头大。

C.DALL-E 3
ChatGPT那个公司做的。它最大的优点是听得懂人话。
你不用学什么复杂的指令格式。你就用平时说话的方式，告诉它你要什么，它基本都能理解。比如你说“一个红色的方块在一个蓝色的球上面”，它能准确画出来。
出图质量不错，虽然艺术感上可能没Midjourney那么惊艳，但胜在准确、听话。适合不想折腾，只想快速把想法变成图的人。

D.国产工具
像百度的文心一格、阿里的通义万相。
它们的好处是懂中国文化。你要画个“穿着汉服的姑娘在苏州园林里弹古筝”，它们画出来的感觉，通常比国外的工具更对味。

怎么写出好指令

你跟AI沟通，靠的就是“提示词”（Prompt）。写得好不好，出的图天差地别。

这里有个简单的结构，你可以照着填空：

主体 + 细节 + 风格 + 构图 + 光线

①主体
图里最主要的东西是什么。写清楚。
例子：“一只柯基犬”。

②细节
给主体加点描述。
例子：“一只戴着领结的柯基犬，毛茸茸的”。

③风格
你想要什么感觉的画。
例子：“宫崎骏动画风格”、“3D渲染”、“水墨画”。

④构图
画面怎么安排。
例子：“特写镜头”、“从下往上拍”、“广角”。

⑤光线
光从哪来，什么颜色，什么感觉。
例子：“下午温暖的阳光”、“霓虹灯光”、“阴天”。

我们来对比一下：

差的指令
a dog (一只狗)
出来的图可能很普通，甚至有点丑。
好的指令
一只微笑的柯基犬的特写，戴着红色小领结，坐在草地上，下午的阳光从侧面照过来，背景是虚化的树林，皮克斯动画风格
这样出来的图，就会具体、生动，跟你想的差不多。

还有个技巧，叫“负面提示词”。就是告诉AI你不想要什么。这在Stable Diffusion里用得很多。
比如在负面提示词里写：模糊, 画质差, 畸形的手
这样就能避免生成一些常见的AI画图毛病。

AI画图正在改变一些行业

这东西不只是个玩具。很多行业的工作方式，已经因为它变了。

①设计师
以前做一张海报，要先找很多参考图，再自己动手画好几个草稿。
现在，可以直接跟AI说“给我画一个赛博朋克风格的咖啡广告海报”，AI几分钟内就能给你几十个不同的方案。设计师的工作，从动手画，变成了动脑选、动脑改。

②游戏公司
开发一款新游戏，最开始要做大量的美术设定，比如角色长什么样，场景是什么风格。
这活儿以前得靠原画师一张张画。现在，美术总监可以先用AI生成几百张概念图，快速确定方向，然后再交给原画师去细化。整个流程快了很多。

③电商卖家
给商品拍照，特别是服装，要请模特、找场地，花钱不少。
现在，可以把衣服的图片发给AI，让AI生成不同身材、不同肤色的虚拟模特试穿图。还可以给商品随便换背景，比如把一个背包P到登山的场景里。

④写东西的人
写小说的，可以自己用AI给小说做封面。
做自媒体的，可以自己给文章配图，不用再去找那些免费但又不好看的图库了。

这东西带来的麻烦

AI画图很方便，但也带来一堆新问题。

①版权是谁的
你用AI画了张图，这张图的版权算谁的？
是你，因为是你出的想法和指令？
是AI公司，因为是他们的工具生成的？
还是被AI“学习”过的那些原画师，因为AI是“抄”他们的风格？
现在这事儿全世界的法律都没搞清楚，很乱。美国的说法是，纯AI生成的图没有版权，但如果你在AI图的基础上做了很多修改，那修改后的作品可能有版权。

②画师会不会失业
这个问题吵得很凶。
那些画头像、画简单插画的，靠重复劳动赚钱的画师，确实危险了。因为AI做这些事又快又便宜。
但对顶尖的画师和设计师，AI更像个工具。他们的核心价值是创意、审美和讲故事的能力。这些东西AI暂时还给不了。以后，画师的工作可能不再是亲手画画，而是指导AI去画出自己想要的东西。

③AI会学坏
AI是靠学习网上的图片来画画的。网上的图片有什么偏见，它就会学到什么偏见。
你让它画“一个CEO”，它画出来的很可能是个白人男性。你让它画“一个保姆”，很可能就是个女性。它会不知不觉地加深这些刻板印象。
还有人拿它来造假图，P别人的照片，做坏事。这也是个管不住的风险。

原创文章，作者：七点互动，如若转载，请注明出处：https://www.qidianhudong.com/aiyy/ai-pic/1055.html