你有个画面,比如,一只穿着唐朝铠甲的猫,站在赛博朋克风格的长安城墙上,手里拿着一把发光的激光剑。搁以前,这事儿你只能想想。现在,把这句话打出来,回车。等个半分钟,这张图就出来了。
这就是AI画图。不是什么魔法,就是个电脑程序。你给它文字,它给你图像。这东西已经不是什么新鲜玩意了,很多人都在用。下面就说说这东西到底是怎么回事,怎么用,用了之后又会怎么样。

AI画图的工作原理
想知道AI怎么画画,得明白一个叫“扩散模型”的东西。
这东西的工作方式有点意思。你想象一张全是雪花点的电视屏幕,完全是噪音。AI的工作,就是根据你的指令,把这些噪音一步步变成一张清晰的图。
它能做到这一点,是它之前看过几十亿张图片和对应的文字描述。
①AI的学习过程
它会先拿一张正常的猫的照片。
往照片上一点点加噪音,直到照片完全变成一堆雪花点。
它会记住从清晰变模糊的每一步。
这个过程重复几十亿次,看各种各样的图。
最后,它就学会了怎么把任何一张清晰的图变成噪音。
②AI的画图过程
你给它指令,比如“一只猫”。
它先生成一张纯粹的、满是噪点的图。
它开始反向操作,把学习时记住的步骤倒过来。
它根据“猫”这个词,一点点地把噪音抹掉,慢慢还原出猫的轮廓、毛色、眼睛。
最后出来的,就是一张全新的猫图,不是它数据库里存的任何一张。
它不是在复制粘贴。它是在理解了“猫”这个概念之后,从一堆随机像素里,把符合这个概念的图像给“造”了出来。
现在市面上有哪些画图AI
工具很多,但大家用得最多的就那么几个。每个脾气都不一样。
A.Midjourney
这个工具出的图,艺术感很强。你随便写几个词,它生成的图经常都很好看,光影和构图都挺讲究。
特别适合做那种需要感觉、需要氛围的图,比如游戏海报、小说封面。
缺点是用起来有点麻烦。你得在Discord那个聊天软件里,通过跟机器人对话的方式来画图。
B.Stable Diffusion
这是个开源的工具。意思就是,免费,而且谁都能改。
高手最喜欢用这个。因为网上有无数人做了各种各样的模型。你想画二次元,就下个二次元模型。你想画照片一样的真人,就下个写实模型。
它的控制功能也最细。你可以上传一张火柴人的图,让AI生成的画里,人物姿势跟你的火柴人一模一样。
缺点是对电脑配置要求高,特别是显卡。而且要自己安装、设置,新手搞起来会头大。
C.DALL-E 3
ChatGPT那个公司做的。它最大的优点是听得懂人话。
你不用学什么复杂的指令格式。你就用平时说话的方式,告诉它你要什么,它基本都能理解。比如你说“一个红色的方块在一个蓝色的球上面”,它能准确画出来。
出图质量不错,虽然艺术感上可能没Midjourney那么惊艳,但胜在准确、听话。适合不想折腾,只想快速把想法变成图的人。
D.国产工具
像百度的文心一格、阿里的通义万相。
它们的好处是懂中国文化。你要画个“穿着汉服的姑娘在苏州园林里弹古筝”,它们画出来的感觉,通常比国外的工具更对味。
怎么写出好指令
你跟AI沟通,靠的就是“提示词”(Prompt)。写得好不好,出的图天差地别。
这里有个简单的结构,你可以照着填空:
主体 + 细节 + 风格 + 构图 + 光线
①主体
图里最主要的东西是什么。写清楚。
例子:“一只柯基犬”。
②细节
给主体加点描述。
例子:“一只戴着领结的柯基犬,毛茸茸的”。
③风格
你想要什么感觉的画。
例子:“宫崎骏动画风格”、“3D渲染”、“水墨画”。
④构图
画面怎么安排。
例子:“特写镜头”、“从下往上拍”、“广角”。
⑤光线
光从哪来,什么颜色,什么感觉。
例子:“下午温暖的阳光”、“霓虹灯光”、“阴天”。
我们来对比一下:
- 差的指令
a dog (一只狗)
出来的图可能很普通,甚至有点丑。 - 好的指令
一只微笑的柯基犬的特写,戴着红色小领结,坐在草地上,下午的阳光从侧面照过来,背景是虚化的树林,皮克斯动画风格
这样出来的图,就会具体、生动,跟你想的差不多。
还有个技巧,叫“负面提示词”。就是告诉AI你不想要什么。这在Stable Diffusion里用得很多。
比如在负面提示词里写:模糊, 画质差, 畸形的手
这样就能避免生成一些常见的AI画图毛病。
AI画图正在改变一些行业
这东西不只是个玩具。很多行业的工作方式,已经因为它变了。
①设计师
以前做一张海报,要先找很多参考图,再自己动手画好几个草稿。
现在,可以直接跟AI说“给我画一个赛博朋克风格的咖啡广告海报”,AI几分钟内就能给你几十个不同的方案。设计师的工作,从动手画,变成了动脑选、动脑改。
②游戏公司
开发一款新游戏,最开始要做大量的美术设定,比如角色长什么样,场景是什么风格。
这活儿以前得靠原画师一张张画。现在,美术总监可以先用AI生成几百张概念图,快速确定方向,然后再交给原画师去细化。整个流程快了很多。
③电商卖家
给商品拍照,特别是服装,要请模特、找场地,花钱不少。
现在,可以把衣服的图片发给AI,让AI生成不同身材、不同肤色的虚拟模特试穿图。还可以给商品随便换背景,比如把一个背包P到登山的场景里。
④写东西的人
写小说的,可以自己用AI给小说做封面。
做自媒体的,可以自己给文章配图,不用再去找那些免费但又不好看的图库了。
这东西带来的麻烦
AI画图很方便,但也带来一堆新问题。
①版权是谁的
你用AI画了张图,这张图的版权算谁的?
是你,因为是你出的想法和指令?
是AI公司,因为是他们的工具生成的?
还是被AI“学习”过的那些原画师,因为AI是“抄”他们的风格?
现在这事儿全世界的法律都没搞清楚,很乱。美国的说法是,纯AI生成的图没有版权,但如果你在AI图的基础上做了很多修改,那修改后的作品可能有版权。
②画师会不会失业
这个问题吵得很凶。
那些画头像、画简单插画的,靠重复劳动赚钱的画师,确实危险了。因为AI做这些事又快又便宜。
但对顶尖的画师和设计师,AI更像个工具。他们的核心价值是创意、审美和讲故事的能力。这些东西AI暂时还给不了。以后,画师的工作可能不再是亲手画画,而是指导AI去画出自己想要的东西。
③AI会学坏
AI是靠学习网上的图片来画画的。网上的图片有什么偏见,它就会学到什么偏见。
你让它画“一个CEO”,它画出来的很可能是个白人男性。你让它画“一个保姆”,很可能就是个女性。它会不知不觉地加深这些刻板印象。
还有人拿它来造假图,P别人的照片,做坏事。这也是个管不住的风险。
原创文章,作者:七点互动,如若转载,请注明出处:https://www.qidianhudong.com/aiyy/ai-pic/1055.html