看过那种很怪又很酷的图吧?什么猫穿着盔甲打架,天上飘着城市,还有把你朋友变成动画片里的人。大家都在玩,看着好像很复杂,要会写代码才行。
其实这东西没那么玄乎。说白了,就是你跟一个很会画画的AI聊天,让它把你脑子里的想法画出来。你说话,它画画,就这么简单。
这篇内容就是给你准备的。我把我玩这么久总结的经验,一步一步拆开给你看。别怕,看完你也能做出来。

怎么回事,AI为什么会画画
先搞懂AI是怎么干活的,后面你用起来会顺手很多。
可以这么想,有个AI,它把网上几十亿张图片和配的文字都看了一遍。
它看到一张图写着“一只狗在追飞盘”,它就记住了“狗”和“飞盘”长什么样,还有“追”这个动作。它看了梵高的画,就学会了那种卷卷的笔触。
它学的东西多了,就建立了一个巨大的“词语”和“画面”的连接库。你跟它说个词,它脑子里就能冒出对应的画面。
那它是怎么从无到有画出一张图的呢?
这过程有点像变魔术。
①它先弄出一屏幕的雪花点,就像没信号的老电视,乱七八糟。
②你给它一句话,比如“一只猫戴着草帽”。它就开始对着这堆雪花点收拾。把不像猫、不像草帽的雪花点擦掉,把像的留下来,让它们变得更清楚。
③这个“收拾”的过程重复几十次。最后,雪花点就变成了一张清晰的、戴草帽的猫的图。
你用文字告诉它要什么,它就在一堆混乱里把你要的画面找出来。这就是“文生图”。
这东西能干嘛用?
用处很多。
想个好玩的画面,以前只能自己想,现在能直接让AI画出来给你看。
写文章、做PPT要配图,以前要去图库找半天,还怕有版权。现在自己一句话就生成了。
或者干脆就是瞎玩,给自己做个独一无二的头像,也很有意思。
挑个顺手的工具
市面上的工具一大堆,别晕。对新手来说,就看下面这三个,它们代表了三种不同的路子。
①Midjourney
这家伙出的图,艺术感最强。画面特别漂亮,有种高级感。你跟它说话不用太死板,多描述感觉和气氛,它给你的结果经常超出想象。
但是,用起来有点怪。你得在个叫Discord的聊天软件里用它,而且要花钱。
适合谁:不差钱,而且想要那种能直接当海报用的高质量图片的人。
②Stable Diffusion
这个是完全免费的,而且能让你随便折腾。
你可以把它整个装在自己电脑上,只要你电脑配置够好。这样做的好处是,完全免费,想生成多少张就多少张。而且,你能给它装各种插件,换各种模型,画风、角色都能自己定。
但是,装起来很麻烦。所以大部分人会用那些已经把它装好了的网站,比如国内的“C站”、“哩布哩布”,打开就能用,还给免费额度。
适合谁:喜欢研究、喜欢自己动手,想完全控制画面的玩家。
③DALL-E 3
这个最简单,因为它最能听懂人话。
它就在ChatGPT和微软Copilot里。你不用学什么复杂的指令,就像跟人聊天一样就行。你说:“帮我画一只熊猫,它在电脑前敲代码,背景是竹林,要卡通风格。”它就能听懂,而且画得八九不离十。画完还能接着聊,让它改:“把熊猫的眼镜换成方的。”
适合谁:纯新手,怕麻烦,就想快速把想法变成图的人。
下面这个表,帮你决定用哪个。
| 工具 | 一句话概括 | 上手难度 | 效果 | 花钱吗 | 自由度 |
| Midjourney | 效果最好的艺术家 | 中等 | 顶级 | 要 | 中等 |
| Stable Diffusion | 最自由的万能工具 | 难 | 上限高 | 不用(本地) | 无上限 |
| DALL-E 3 | 最会聊天的画师 | 简单 | 好 | Copilot免费 | 低 |
我的建议:
- 想马上免费玩玩,就用微软Copilot里的DALL-E 3。
- 想深入玩,又不怕折腾,就去C站这类网站用Stable Diffusion。
- 有钱,就想直接要最好看的图,那就上Midjourney。
核心技术,怎么说对话
选好工具,就到了最关键的一步:写提示词(Prompt)。你写的词,决定了AI画出来的东西是神作还是垃圾。
一个好的提示词,是有结构的。你可以试试这个公式:
[主体] + [细节和环境] + [风格] + [构图和镜头] + [光线和颜色] + [质量词]
看个例子,我们一步步把一张普通的画变牛逼。
A.先说主体:
a girl (一个女孩)
AI会随便给你画个女孩,很普通。
B.加上细节和环境:
a girl with long white hair, holding a glowing crystal, in a dark forest (一个长白发的女孩,拿着发光水晶,在黑暗森林里)
画面立刻有了故事。
C.定下风格:
… concept art, fantasy, detailed (… 概念艺术,奇幻,细节丰富)
AI就知道要往游戏原画那个方向画了。
D.安排镜头:
… full body shot, from a low angle (… 全身照,从低角度拍摄)
你开始像个摄影师一样指挥它,画面更有冲击力。
E.布置光线:
… moonlight, cinematic lighting (… 月光,电影感光效)
光影是画面的灵魂,这两个词能让质感上一个台阶。
F.最后加点质量词:
… masterpiece, best quality (… 杰作,最高品质)
这两个词等于告诉AI:给我拿出你最好的水平来画。
看到了吧?你描述得越细,AI就越懂你,画出来的东西就越接近你想要的。
这里给你一些好用的“魔法词”,加到你的公式里去。
①风格类
Cyberpunk (赛博朋克)
Ukiyo-e (浮世绘)
Watercolor (水彩)
Pencil sketch (铅笔素描)
②光线类
Cinematic lighting (电影光,万能好用)
Rim light (轮廓光,能把主体和背景分开)
Golden hour (黄金时刻,傍晚那种暖洋洋的光)
③镜头类
Wide-angle shot (广角,拍大场面)
Macro (微距,拍细节)
Bokeh (背景虚化)
有时候,你还得告诉AI不要画什么。
AI画画经常会出错,比如把手画成六根指头。这时候就要用“负面提示词”(Negative Prompt),在Stable Diffusion里尤其重要。
你可以在负面提示词框里写这些:
extra fingers, ugly, blurry, bad anatomy, watermark (多余的手指,丑,模糊,身体结构不对,水印)
这能帮你过滤掉很多画崩了的结果。
玩点高级的
熟练了基本操作,可以试试下面这些进阶玩法。
(1)图生图
这个功能,让你不光能用文字画画,还能用一张现成的图当起点。
操作很简单:
①上传一张图,比如你的自拍。
②写提示词,比如“anime style”(动漫风格)。
③AI就会把你的自拍,在保持大致轮廓和颜色的基础上,变成动漫风格。
你可以用它把自己的照片变成各种风格的头像,或者把你随手画的草稿变成一张完整的画。
(2)精准控制
在Stable Diffusion里,还有更厉害的工具。
- ControlNet
这个插件能让你精准控制画面的构图和人物姿势。
比如,你找一张别人画的画,里面有个你很喜欢的动作。用ControlNet提取出这个动作的“骨架”,然后你就可以让AI用这个一模一样的动作,画一个完全不同的角色。 - Seed(种子)
每个AI画的图,都有一个叫“种子”的编号。
如果你用同样的提示词和同样的种子编号,就能画出和上次一模一样的图。
这个功能在你需要画一个系列,保持主角长相不变的时候,用处极大。
这东西能用来干啥
学会了,就该用起来了。
①给自己做头像、壁纸。独一无二,绝对不会跟别人撞。
②给自己的文章、PPT做配图。再也不用去网上找图了。
③设计点小东西。比如T恤图案、手机壳,甚至可以放到网上卖。
最后要记住的两件事
玩归玩,有两条规矩要清楚。
No.1版权
AI画的图算谁的?这事现在全世界都还在吵。
简单说就是:个人玩没问题。但如果你想拿去卖钱,就要看你用的那个工具的规定。Midjourney的付费版说你可以商用。Stable Diffusion就比较复杂,要看你用的模型。
No.2别干坏事
工具是中性的,但用的人要有底线。
别拿别人的照片乱搞,特别是搞成丑化、造谣的图。也别做那些假新闻图片去骗人。
技术是让人发挥创造力的,不是用来作恶的。
好了,东西都教给你了。现在别看了,自己去选个工具,写下你的第一句提示词。哪怕只是“a dog flying in the sky”(一只在天上飞的狗),当你看到画面真的出来时,那种感觉还是很奇妙的。
去试试吧。
原创文章,作者:七点互动,如若转载,请注明出处:https://www.qidianhudong.com/aiyy/ai-pic/1042.html