小白也能懂！怎么用AI生成图片？一份超详细指南！

看过那种很怪又很酷的图吧？什么猫穿着盔甲打架，天上飘着城市，还有把你朋友变成动画片里的人。大家都在玩，看着好像很复杂，要会写代码才行。

其实这东西没那么玄乎。说白了，就是你跟一个很会画画的AI聊天，让它把你脑子里的想法画出来。你说话，它画画，就这么简单。

这篇内容就是给你准备的。我把我玩这么久总结的经验，一步一步拆开给你看。别怕，看完你也能做出来。

怎么回事，AI为什么会画画

先搞懂AI是怎么干活的，后面你用起来会顺手很多。

可以这么想，有个AI，它把网上几十亿张图片和配的文字都看了一遍。

它看到一张图写着“一只狗在追飞盘”，它就记住了“狗”和“飞盘”长什么样，还有“追”这个动作。它看了梵高的画，就学会了那种卷卷的笔触。

它学的东西多了，就建立了一个巨大的“词语”和“画面”的连接库。你跟它说个词，它脑子里就能冒出对应的画面。

那它是怎么从无到有画出一张图的呢？

这过程有点像变魔术。

①它先弄出一屏幕的雪花点，就像没信号的老电视，乱七八糟。

②你给它一句话，比如“一只猫戴着草帽”。它就开始对着这堆雪花点收拾。把不像猫、不像草帽的雪花点擦掉，把像的留下来，让它们变得更清楚。

③这个“收拾”的过程重复几十次。最后，雪花点就变成了一张清晰的、戴草帽的猫的图。

你用文字告诉它要什么，它就在一堆混乱里把你要的画面找出来。这就是“文生图”。

这东西能干嘛用？

用处很多。

想个好玩的画面，以前只能自己想，现在能直接让AI画出来给你看。

写文章、做PPT要配图，以前要去图库找半天，还怕有版权。现在自己一句话就生成了。

或者干脆就是瞎玩，给自己做个独一无二的头像，也很有意思。

挑个顺手的工具

市面上的工具一大堆，别晕。对新手来说，就看下面这三个，它们代表了三种不同的路子。

①Midjourney

这家伙出的图，艺术感最强。画面特别漂亮，有种高级感。你跟它说话不用太死板，多描述感觉和气氛，它给你的结果经常超出想象。

但是，用起来有点怪。你得在个叫Discord的聊天软件里用它，而且要花钱。

适合谁：不差钱，而且想要那种能直接当海报用的高质量图片的人。

②Stable Diffusion

这个是完全免费的，而且能让你随便折腾。

你可以把它整个装在自己电脑上，只要你电脑配置够好。这样做的好处是，完全免费，想生成多少张就多少张。而且，你能给它装各种插件，换各种模型，画风、角色都能自己定。

但是，装起来很麻烦。所以大部分人会用那些已经把它装好了的网站，比如国内的“C站”、“哩布哩布”，打开就能用，还给免费额度。

适合谁：喜欢研究、喜欢自己动手，想完全控制画面的玩家。

③DALL-E 3

这个最简单，因为它最能听懂人话。

它就在ChatGPT和微软Copilot里。你不用学什么复杂的指令，就像跟人聊天一样就行。你说：“帮我画一只熊猫，它在电脑前敲代码，背景是竹林，要卡通风格。”它就能听懂，而且画得八九不离十。画完还能接着聊，让它改：“把熊猫的眼镜换成方的。”

适合谁：纯新手，怕麻烦，就想快速把想法变成图的人。

下面这个表，帮你决定用哪个。

工具	一句话概括	上手难度	效果	花钱吗	自由度
Midjourney	效果最好的艺术家	中等	顶级	要	中等
Stable Diffusion	最自由的万能工具	难	上限高	不用(本地)	无上限
DALL-E 3	最会聊天的画师	简单	好	Copilot免费	低

我的建议：

想马上免费玩玩，就用微软Copilot里的DALL-E 3。
想深入玩，又不怕折腾，就去C站这类网站用Stable Diffusion。
有钱，就想直接要最好看的图，那就上Midjourney。

核心技术，怎么说对话

选好工具，就到了最关键的一步：写提示词（Prompt）。你写的词，决定了AI画出来的东西是神作还是垃圾。

一个好的提示词，是有结构的。你可以试试这个公式：

[主体] + [细节和环境] + [风格] + [构图和镜头] + [光线和颜色] + [质量词]

看个例子，我们一步步把一张普通的画变牛逼。

A.先说主体：
a girl (一个女孩)
AI会随便给你画个女孩，很普通。

B.加上细节和环境：
a girl with long white hair, holding a glowing crystal, in a dark forest (一个长白发的女孩，拿着发光水晶，在黑暗森林里)
画面立刻有了故事。

C.定下风格：
… concept art, fantasy, detailed (… 概念艺术，奇幻，细节丰富)
AI就知道要往游戏原画那个方向画了。

D.安排镜头：
… full body shot, from a low angle (… 全身照，从低角度拍摄)
你开始像个摄影师一样指挥它，画面更有冲击力。

E.布置光线：
… moonlight, cinematic lighting (… 月光，电影感光效)
光影是画面的灵魂，这两个词能让质感上一个台阶。

F.最后加点质量词：
… masterpiece, best quality (… 杰作，最高品质)
这两个词等于告诉AI：给我拿出你最好的水平来画。

看到了吧？你描述得越细，AI就越懂你，画出来的东西就越接近你想要的。

这里给你一些好用的“魔法词”，加到你的公式里去。

①风格类
Cyberpunk (赛博朋克)
Ukiyo-e (浮世绘)
Watercolor (水彩)
Pencil sketch (铅笔素描)

②光线类
Cinematic lighting (电影光，万能好用)
Rim light (轮廓光，能把主体和背景分开)
Golden hour (黄金时刻，傍晚那种暖洋洋的光)

③镜头类
Wide-angle shot (广角，拍大场面)
Macro (微距，拍细节)
Bokeh (背景虚化)

有时候，你还得告诉AI不要画什么。

AI画画经常会出错，比如把手画成六根指头。这时候就要用“负面提示词”（Negative Prompt），在Stable Diffusion里尤其重要。

你可以在负面提示词框里写这些：
extra fingers, ugly, blurry, bad anatomy, watermark (多余的手指，丑，模糊，身体结构不对，水印)
这能帮你过滤掉很多画崩了的结果。

玩点高级的

熟练了基本操作，可以试试下面这些进阶玩法。

(1)图生图

这个功能，让你不光能用文字画画，还能用一张现成的图当起点。

操作很简单：
①上传一张图，比如你的自拍。
②写提示词，比如“anime style”（动漫风格）。
③AI就会把你的自拍，在保持大致轮廓和颜色的基础上，变成动漫风格。

你可以用它把自己的照片变成各种风格的头像，或者把你随手画的草稿变成一张完整的画。

(2)精准控制

在Stable Diffusion里，还有更厉害的工具。

ControlNet
这个插件能让你精准控制画面的构图和人物姿势。
比如，你找一张别人画的画，里面有个你很喜欢的动作。用ControlNet提取出这个动作的“骨架”，然后你就可以让AI用这个一模一样的动作，画一个完全不同的角色。
Seed（种子）
每个AI画的图，都有一个叫“种子”的编号。
如果你用同样的提示词和同样的种子编号，就能画出和上次一模一样的图。
这个功能在你需要画一个系列，保持主角长相不变的时候，用处极大。