你是不是也遇到过这种情况?脑子里想的是一回事,AI画出来的是另一回事。想画个精致的美女,结果人脸有点怪。想画个宏大的场景,出来的图却很平淡。
问题不在AI,在于我们跟它“说话”的方式。AI听不懂“感觉”,你得把话说明白、说清楚。这东西就叫提示词(Prompt)。
这篇东西不谈虚的。我会直接告诉你一个我一直在用的、很管用的方法,让你也能把你脑子里的画面,变成一张具体的图。

先搭个架子,这是最关键的一步
别一上来就乱七八糟地堆一堆词。先搭一个清晰的架子,然后往里面填东西。这样做,思路不会乱,AI也能更好地理解。
我自己的习惯是按这个顺序来:
主体 + 风格 + 镜头 + 光线 + 细节 + 平台参数
咱们拿“一只猫”来举例子,你看加东西和不加东西,区别有多大。
- 先说画什么
- 你输入:a cat (一只猫)
- 出来的图会很普通,就是一张猫的图,没什么特别的。
- 然后,加个风格
- 你输入:a cat, anime style (一只猫,动漫风格)
- 好,现在它知道要画成动画片的感觉了,画风就不一样了。
- 接着,告诉它镜头怎么摆
- 你输入:a cat, anime style, close-up shot (一只猫,动漫风格,特写镜头)
- 现在画面开始有重点了。镜头会推到猫的脸上,更有故事感。
- 再来点光
- 你输入:a cat, anime style, close-up shot, morning light (一只猫,动漫风格,特写镜头,早晨的光)
- 光是营造气氛最好的东西。加了“早晨的光”,整个图的色调就暖了、亮了。
- 最后,提点细节要求
- 你输入:a cat, anime style, close-up shot, morning light, high detail, 8k (一只猫,动漫风格,特写镜头,早晨的光,高细节,8K)
- 这就是在告诉AI:“别糊弄,给我画清楚点!”这样出来的图会精致很多。

你看,就这么一步步加东西,一个简单的想法就变得具体了。这就是搭架子的好处。
词汇库:往架子里填什么
知道了架子,你还需要具体的词。下面这些都是我常用而且效果不错的,你直接拿去用就行。分类很清楚。
第一类:主体 (你想画的核心)
这是画面的主角。描述得越有画面感越好。
- 人物: a knight in heavy armor (穿重甲的骑士)、an old wizard reading a book (看书的老巫师)。
- 动物: a giant dragon sleeping on a mountain (在山上睡觉的巨龙)、a fox in a snowy forest (雪林里的狐狸)。
- 场景: a cyberpunk city street at night (赛博朋克风格的城市夜间街道)、an abandoned castle in the forest (森林里的废弃城堡)。
第二类:风格 (决定画成什么样)
这个决定了画面的整体感觉。
- 画种: oil painting (油画)、watercolor (水彩)、ink wash painting (水墨画)、pencil sketch (铅笔素描)。
- 艺术风格: Ukiyo-e (浮世绘)、Pop Art (波普艺术)、Steampunk (蒸汽朋克)。
- 像谁的风格: by Hayao Miyazaki (宫崎骏的风格)。但是,直接用名人名字,AI有时候只会模仿个皮毛。
第三类:镜头 (决定怎么拍)
把自己当成一个摄影师,告诉AI你的机位在哪。
- 远近: full body shot (全身照)、close-up (特写)、macro shot (微距)。
- 角度: low angle view (仰视)、top-down view (俯视)。
- 效果: blurry background (背景虚化)、wide angle (广角)。
第四类:光线和色彩 (决定画面气氛)
光是最好的气氛组。
- 光线: cinematic lighting (电影光)、rim light (轮廓光,能让主体和背景分开)、neon lights (霓虹灯)。
- 时间和天气: golden hour (日出日落前的黄金一小时,光线很软)、misty (有雾的)、rainy (下雨的)。
- 色彩: vibrant colors (鲜艳的颜色)、monochromatic (单色的)、pastel colors (柔和的粉彩色)。
第五类:细节 (决定图片精度)
想让图更清楚、更好看,就用这些词。
- masterpiece (杰作)、best quality (最高质量)、ultra-detailed (超多细节)、photorealistic (像照片一样真实)。
- 用 Unreal Engine (虚幻引擎) 这个词,能让画面有很强的游戏CG感。
第六类:不要画什么 (负面提示词)
这个很重要。AI画画经常会出错,比如手画不明白。你得告诉它什么东西不能要。
- 通用: low quality, worst quality (低质量)。
- 防人体变形: deformed hands, extra fingers, bad anatomy (变形的手、多余的手指、糟糕的人体结构)。
- 防杂乱: text, watermark (文字、水印)。
来,我们从头到尾走一遍
假设我想画:“一个穿着唐代铠甲的宇航员,站在火星上,手里拿着一棵发光的植物。”
第一反应的写法可能很直接:
A chinese astronaut on mars, holding a plant.
这样出来的图,效果肯定不行。
现在,我们用上面的架子重新说一遍:
- 先说主体: a female astronaut, wearing Tang Dynasty style heavy armor (一个女宇航员,穿着唐代风格的重甲)。
- 加场景和动作: standing on the red desert of Mars, holding a glowing plant (站在火星的红色沙漠上,拿着一棵发光的植物)。
- 定风格和镜头: sci-fi concept art, wide shot, cinematic (科幻概念艺术,广角镜头,电影感)。
- 给光和氛围: dramatic lighting, long shadows (戏剧性的光,长长的影子)。
- 提细节要求: masterpiece, 8k, detailed armor (杰作,8K,铠甲细节要多)。
- 最后,加不想要的: (Negative) cartoon, 3d, blurry, deformed hands. (不要卡通、3D、模糊、变形的手)。

把这些组合起来,就是一条高质量的指令。AI拿到这种指令,想画歪都难。
一些额外的经验
- Midjourney 和 Stable Diffusion 不一样。 Midjourney更像个艺术家,你跟它说个大概感觉,它能懂。Stable Diffusion像个工程师,你得说得特别明白,词的顺序、用括号加重(word:1.2),它都会认真执行。
- 没想法了怎么办? 去看看别人怎么写的。有两个网站不错:PromptHero 和 Lexica.art。上面全是别人的图和提示词。但别光抄。你看别人的图,先猜他可能用了什么词,然后再去看答案。这样学得快。
总的来说,方法就是这样。
把脑子里的画面,拆成一小块一小块,然后用清晰的词告诉AI。它就能帮你画出来了。
你现在就可以找个想法,用这个架子试试。
原创文章,作者:七点互动,如若转载,请注明出处:https://www.qidianhudong.com/aikonw/585.html