你有没有过这种体验:兴冲冲地跑去玩AI生成图片,结果出来的东西要么是长着七八根手指的怪物,要么就是五官扭曲、背景混乱,完全不是你想要的样子。感觉就像AI喝醉了酒,随手画了张“鬼画符”来敷衍你。
其实,这事儿不赖AI,问题出在你跟它“说话”的方式上。AI毕竟不是人,它听不懂模棱两可的话。你得像个导演一样,给它清晰、具体的指令。大多数人之所以失败,就是因为他们的指令太模糊了。
我玩了这么长时间的AI绘画,踩了无数的坑,最后发现,想让AI听懂话,关键就三句话。只要你把这三句话的精髓喂给它,出图效果立马就不一样了。

第一句:“画一只【主体】,它正在【做什么】,在【什么样的环境】里。”
这句话的核心就两个字:具体。
很多人用AI,开头就是“一只猫”、“一个美女”、“一片风景”。 这对AI来说,信息量几乎为零。它不知道你要什么猫,什么美女,什么风景。它只能从它那庞大的数据库里随便抓一个最“平均”的形象给你,结果自然就很普通,甚至奇怪。
记住,AI生成图片的过程,不是凭空创造,而是根据你的文字描述,在它学习过的亿万张图片里寻找最匹配的视觉元素,然后拼接、重构成一张新图。 你的描述越详细,它能找到的元素就越精确,最后的结果就越接近你的想象。
我们来拆解一下这句话:
1. 主体:
这是你画面的核心。你要把主体的所有关键特征都说清楚。不要只说“一只狗”,要说“一只毛茸茸的、正在咧嘴笑的金色萨摩耶”。你看,加上“毛茸茸”、“咧嘴笑”、“金色萨摩耶”这几个定语,狗的形象一下就清晰了。
- 失败的例子:
一个男人 - 成功的例子:
一个留着络腮胡、眼神深邃的中年男人,穿着一件深灰色的旧夹克
2. 它正在做什么:
给你的主体加上动作,画面才能活起来。一个静态的主体是很呆板的。你想想,是“一个人站着”有意思,还是“一个人在雨中奔跑,溅起水花”更有故事感?动作能让AI更好地理解场景和氛围。
- 失败的例子:
一只鸟 - 成功的例子:
一只蜂鸟正悬停在半空中,翅膀高速振动,试图吸食一朵红色花朵的花蜜
3. 在什么样的环境里:
环境是画面的舞台,它能决定一张图的整体感觉。 是在赛博朋克的都市里,还是在宁静的乡间小路上?背景信息给得越足,AI就越能渲染出你想要的氛围。
- 失败的例子:
一辆车 - 成功的例子:
一辆复古的红色跑车,停在一条被霓虹灯照亮的湿漉漉的东京街道上,地面反射着五彩斑斓的灯光
我们把这三块合起来,看一个完整的例子。
假设你最初的想法只是“画个宇航员”。直接把这三个字扔给AI,你可能会得到一张非常普通的、不知道飘在哪里的宇航员标准照。
但如果我们用上面那句话来改造一下:
“画一个【穿着白色宇航服的宇航员】,他正在【失重状态下,漂浮着伸手去抓一颗发光的蓝色星球】,周围是【深邃的宇宙,背景里有遥远的星云和闪烁的恒星】。”
你看,同样是画宇航员,后面这个描述给出的信息就丰富多了。AI能准确地抓住“白色宇航服”、“失重”、“抓”、“发光的蓝色星球”、“深邃宇宙”和“星云”这些关键元素,生成出来的图片自然就更有故事性和视觉冲击力。
第二句:“不要出现【鬼手】、【崩坏的脸】、【多余的肢体】。”
这句话听起来有点奇怪,像是在跟AI“辟邪”。但它的作用非常直接:告诉AI什么东西不能画。这就是所谓的“负面提示词”(Negative Prompts)。
AI在画画时,最常翻车的地方就是人的身体结构,特别是手。 它可能会画出六根手指的手,或者把关节拧成麻花。这是因为AI在学习时,看了太多不同姿势、角度的手,有时候会“理解错乱”,不知道正常的手到底该长什么样。 同样的问题也出现在脸上,比如眼睛不对称、牙齿长得乱七八糟。
这时候,光告诉它“要什么”就不够了,你还得明确告诉它“不要什么”。
几乎所有主流的AI绘画工具都支持负面提示词功能。你可以在一个专门的输入框里填,或者在主提示词后面加上特定的参数(比如 --no)。
它的用法很简单,就是把你不想看到的东西列出来。
比如,你在画一个人物肖像,但AI总是把手画得很奇怪。你就可以在负面提示词里加上:
deformed hands, extra fingers, extra limbs, poorly drawn hands (变形的手、多余的手指、多余的肢体、画得很差的手)
如果你发现画面里的人物脸部表情僵硬,或者五官有点吓人,可以加上:
poorly drawn face, ugly, deformed eyes (画得很差的脸、丑陋、变形的眼睛)
负面提示词的作用就像是给AI的创作加了一道“安全滤网”,能帮你过滤掉很多常见的、容易出错的元素。我个人有个习惯,每次画人物,都会默认加上一串负面提示词“套餐”,基本可以避免80%以上的“惊悚”作品。
我的常用“套餐”包括:
- 身体结构类:
extra limbs, extra fingers, mutated hands, fused fingers, disfigured, malformed limbs(多余的肢体、多余的手指、变异的手、融合的手指、毁容、畸形的四肢) - 画面质量类:
blurry, bad anatomy, bad proportions, grainy, low resolution, watermark, text, signature(模糊、身体结构崩坏、比例失调、颗粒感、低分辨率、水印、文字、签名)
加上这道保险,你会发现AI“犯病”的概率大大降低,出图的稳定性会好很多。这就像你请一个画师,不仅告诉他要画什么,还特意嘱咐他:“千万别把手画崩了啊!” AI虽然没感情,但它能听懂这个技术指令。
第三句:“用【某种风格】,从【某个角度】,打上【什么光】。”
如果你能熟练运用第一句和第二句话,你已经能生成比较正常、具体的图片了。但这第三句话,是让你从“能用”进阶到“好用”的关键。它让你从一个单纯的“提需求的人”,变成一个掌握画面最终效果的“导演”和“摄影师”。
这句话包含了三个核心要素:风格、构图和光线。
1. 风格(Style):
这是决定一张画看起来“像什么”的关键。是油画?水彩画?还是像素画?或者是某个著名艺术家的风格?直接告诉AI,它就能模仿。
- 想画得像梵高? 加上
in the style of Vincent van Gogh - 想要动漫感? 加上
anime style, Ghibli studio(动漫风格,吉卜力工作室) - 想要科幻感? 加上
cyberpunk, futuristic, neon(赛博朋克、未来主义、霓虹)
明确风格,是让你的图片脱离“AI感”的第一步。因为不同的艺术风格包含了独特的笔触、色彩和构图逻辑,AI一旦开始模仿,它的发挥就会被引导到一个具体的、成熟的艺术体系里,而不是漫无目的地随机组合。
2. 构图(Composition):
构图就是“从哪个角度拍”。你是想拍一个大头照,还是一个全身像?是仰视还是俯视?这些描述镜头位置的词,AI都听得懂。
- 想突出面部细节? 用
close-up shot, portrait(特写镜头,肖像) - 想展示宏大场面? 用
wide-angle shot, landscape(广角镜头,风景) - 想从上往下看? 用
bird's-eye view(鸟瞰视角)
构图指令能帮你牢牢控制画面的主体和背景关系,让画面更有冲击力,而不是永远都是平淡的“标准视角”。
3. 光线(Lighting):
光是摄影和绘画的灵魂。同样一个场景,在“清晨柔和的光线下”和在“正午刺眼的阳光下”,感觉是完全不同的。AI对描述光线的词语非常敏感。
- 想要温暖、浪漫的感觉? 加上
golden hour, soft light(黄金时刻,柔和的光) - 想要神秘、紧张的氛围? 加上
dramatic lighting, hard shadows(戏剧性光照,硬阴影) - 想要夜店风? 加上
neon lighting, cinematic lighting(霓虹灯光,电影感光照)
现在,我们把这三句话的精髓全部融合在一起,来做一个终极对比。
假设我们最开始的指令是:a girl (一个女孩)
这基本就是“鬼画符”的直通车。
第一步,运用第一句话,让描述变具体:A young girl with long brown hair, wearing a red dress, is reading a book on a wooden bench in a park. (一个留着棕色长发的年轻女孩,穿着红色连衣裙,正在公园的长椅上看书。)
第二步,运用第二句话,加上负面提示词,避免崩坏:--no blurry, disfigured, extra fingers, poorly drawn face (不要模糊、毁容、多余的手指、画得差的脸)
第三步,运用第三句话,注入艺术灵魂:An impressionist oil painting of a young girl with long brown hair, wearing a red dress, reading a book on a wooden bench in a park. Golden hour lighting, creating long soft shadows. Wide-angle shot, showing the surrounding trees and flowers. (一幅印象派油画,画的是一个留着棕色长发的年轻女孩,穿着红色连衣裙,正在公园的长椅上看书。黄金时刻的光线,投下柔和的长长的影子。广角镜头,能看到周围的树木和花朵。)
对比一下最初的 a girl 和最后这一长串描述,结果会是天壤之别。后者几乎就是在指导一个专业的画师进行创作,每一个细节都被你牢牢掌控。
所以,别再抱怨AI画得不好了。它就像一个能力超强但毫无主见的实习生,你指令给得越细,它交出来的作品就越让你满意。下次再想生成图片时,试试把这三句话喂给它,看看效果会不会让你大吃一惊。
原创文章,作者:MakeAI,如若转载,请注明出处:https://www.qidianhudong.com/aiyy/ai-pic/2031.html