AI绘画关键词技巧：如何写出让AI满意的提示词

🔥小编按： AI绘画的浪潮席卷而来，Midjourney、Stable Diffusion、DALL-E等工具让“人人都是艺术家”的梦想照进现实。但，你是否也发现，即便掌握了基础的提示词技巧，生成的作品有时仍与预期相去甚远？这往往是因为你忽略了提示词的“深层逻辑”和“高级玩法”。今天，小编将带你深入AI绘画的“内核”，解锁更专业、更精细的提示词操控技巧，助你彻底驯服AI，创作出真正令人惊叹的艺术杰作！

一、从“表层”到“内核”：理解AI绘画的工作原理

要写出让AI满意的提示词，首先要理解AI绘画工具的“思维方式”，即它们如何将文字转化为图像。

大多数AI绘画模型，如Stable Diffusion，采用了扩散模型（Diffusion Model）。简单来说，这个过程可以理解为：

文本编码（Text Encoding）：你的提示词首先被转化为AI能够理解的数学表示，即“向量”（Vector）。这个过程由“文本编码器”（Text Encoder）完成，常用的有CLIP（Contrastive Language-Image Pre-training）模型。
潜在空间漫游（Latent Space Diffusion）：AI在一个高维度的“潜在空间”（Latent Space）中进行“创作”。这个空间包含了大量图像的特征信息。AI从一个随机噪声点出发，根据提示词向量的“指引”，逐步“去噪”，最终生成一个与提示词相关的图像表示。
图像解码（Image Decoding）：AI将潜在空间中的图像表示转化为我们能够看到的像素图像。这个过程由“图像解码器”（Image Decoder）完成。

理解了这个过程，我们就能明白：

提示词的质量直接影响“向量”的质量：越精准、越丰富的提示词，生成的向量就越能准确地表达你的意图，AI在潜在空间中的“寻路”就越清晰。
AI并非“凭空创造”，而是“组合”与“重塑”：AI绘画模型学习了海量的图像数据，它生成的图像本质上是对已有图像特征的组合与重塑。因此，提示词中包含的风格、艺术家、流派等信息，能帮助AI更有效地调用相关的图像特征。

二、进阶策略：提示词的“高级语法”

掌握了AI绘画的“底层逻辑”，我们就可以进一步探索提示词的“高级语法”，实现更精细的控制：

权重（Weight）：
- 概念：通过调整关键词的权重，可以控制它们在生成图像中的重要程度。
- 语法：（在不同AI绘图工具中，语法略有不同）：
  - Midjourney：使用::，如a cat::2, a dog::1 (猫的权重是狗的两倍)
  - Stable Diffusion (AUTOMATIC1111 WebUI)：使用()和[]，如(cat:1.5), [dog:0.8] (增加猫的权重，降低狗的权重)
- 技巧：对于希望突出的元素，可以增加权重；对于次要或背景元素，可以降低权重。
负面提示词（Negative Prompt）：
- 概念：告诉AI你“不希望”在图像中看到什么。
- 作用：有效避免生成“畸形”、“多余”、“不协调”的元素。
- 常用词汇：ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, blurry, bad anatomy, blurred, watermark, grainy, signature, cut off, draft
- 技巧：将负面提示和正面提示结合使用，例如，想要画一只写实的猫，正面提示可以是猫的品种，颜色，姿势，而负面提示可以是：cartoon, 3d, painting, 畸形, 多余的腿
混合（Blending/Remixing）：
- 概念：将多个图像或提示词混合在一起，生成新的图像。
- Midjourney中的/blend命令: 可以上传多张图片, 让AI融合这些图片生成新的图片。
- Stable Diffusion中的”img2img”功能: 上传一张图片, 配合提示词, 生成与原图风格, 构图相似, 但内容根据提示词变化的图片.
种子（Seed）：
- 概念：AI绘画的生成过程具有一定的随机性。种子值决定了随机性的“起点”。相同的种子值，在相同的提示词和参数下，会生成相同的图像。
- 作用：
  - 固定结果：如果你对某个生成结果满意，可以记录下它的种子值，以便后续复现或微调。
  - 探索变化：通过微调种子值，可以在保持整体风格和构图不变的情况下，探索细节上的变化。
采样器/采样步数 (Sampler/Sampling Steps)
- 概念: 扩散模型生成图片的过程，是从一个随机噪声开始，逐步“去噪”，最终生成清晰图像的过程。“采样”就是指去噪的过程。不同的采样器有不同的去噪算法。采样步数指去噪的次数。
- 常见采样器:
  - Euler a (速度快，适合早期迭代)
  - DPM++ 2M Karras （高质量，常用）
  - DPM++ SDE Karras （更具创造性，但速度慢）
- 技巧:
  - 早期探索阶段, 可以用较少的步数和较快的采样器 (如 Euler a), 快速生成预览图。
  - 确定方向后，可以用较多的步数和质量更高的采样器 (如 DPM++ 2M Karras)，生成最终图像。
  - 并非步数越多越好，过多的步数可能导致图像过饱和或失真。
CFG Scale (Classifier-Free Guidance Scale)
- 概念: 控制AI遵循你提示词的严格程度。值越低, AI的自由度越高, 可能会产生更有创意的结果, 但也可能偏离你的提示; 值越高, AI越严格遵循你的提示词, 但可能牺牲创造性。
- 技巧:
  - 通常设置在 7-15 之间。
  - 如果希望AI更自由地发挥，可以尝试较低的CFG Scale (如 5-7)。
  - 如果希望AI更严格地遵循提示词，可以尝试较高的CFG Scale (如 15-20)。

三、高级技巧：打造“大师级”提示词

在之前的基础上，我们继续深化“大师级”提示词的打造技巧：

艺术风格的深度理解：
- 不仅仅是“风格名称”：除了直接使用“油画风格”、“水墨风格”等，还可以更深入地描述风格的特征。
- 例子：
  - “Art Nouveau风格，强调有机的、波浪形的线条，自然形态的装饰，色彩柔和，受到日本浮世绘的影响。”
  - “包豪斯风格，几何形状，功能主义，强调形式追随功能，简洁的线条，有限的色彩。”
艺术家风格的模仿与融合：
- 不仅仅是“艺术家名字”：除了直接使用“梵高”、“莫奈”等，还可以尝试融合多个艺术家的风格。
- 例子：“草间弥生的波点与梵高的星空融合，色彩鲜艳，充满动感和生命力。”
文化背景与历史元素的融入：
- 增加深度和内涵：将特定文化、历史时期的元素融入提示词，可以让作品更具文化底蕴和历史感。
- 例子：“唐朝仕女图风格，融合赛博朋克元素，身着华丽的汉服，头戴赛博朋克风格的发饰，背景是未来城市的霓虹灯光。”
专业术语的运用（摄影、电影、设计等）：
- 更精准的控制：如果你熟悉摄影、电影、设计等领域的专业术语，可以将它们运用到提示词中，实现更精准的控制。
- 例子：
  - “电影感，85mm镜头，f/1.8光圈，浅景深，焦外虚化，黄金分割构图，逆光，丁达尔效应。”
  - “产品设计渲染，C4D，Octane Render，KeyShot，工作室灯光，白色背景，4K。”
迭代与微调的艺术：
- 没有“一蹴而就”的完美提示词：AI绘画是一个不断尝试、迭代、微调的过程。不要害怕“失败”，每一次尝试都是一次学习和积累。
- 记录和分析: 记录每次尝试的提示词、参数和结果, 分析哪些有效, 哪些无效, 逐步优化。

四、实战案例：进阶提示词的威力

让我们通过一个更复杂的案例，来展示进阶提示词的威力：

目标：生成一张具有史诗感和幻想色彩的场景，表现一位女战士在战场上的英姿。

基础提示词：“女战士，战场” (效果：可能比较普通，缺乏特色)
进阶提示词：
(masterpiece, best quality:1.2), (highly detailed:1.2), cinematic lighting, epic, fantasy, a lone female warrior, (intricate armor:1.3), (wielding a glowing sword:1.2), standing on a battlefield, (smoke and fire in the background:1.1), (stormy sky:1.2), (god rays piercing through the clouds:1.3), (dynamic pose:1.2), (determined expression:1.2), art by Greg Rutkowski and Artgerm and Alphonse Mucha, trending on Artstation, 8k Negative prompt: ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, blurry, bad anatomy, blurred, watermark, grainy, signature, cut off, draft
(解释):
* masterpiece, best quality, highly detailed: 提升画质
* cinematic lighting, epic, fantasy: 确定场景氛围
* a lone female warrior, intricate armor, wielding a glowing sword: 描述主体和细节, 并通过权重强调
* standing on a battlefield, smoke and fire in the background, stormy sky, god rays piercing through the clouds: 描述背景和环境, 并通过权重强调
* dynamic pose, determined expression: 描述人物姿态和表情
* art by Greg Rutkowski and Artgerm and Alphonse Mucha: 指定艺术家风格
* trending on Artstation, 8k: 追求高质量和流行风格
* Negative prompt: 避免常见的错误