想用AI画画,但感觉市面上的工具多得让人头疼,不知道从哪儿下手。很多人都有这个困惑:到底哪个AI能画出我想要的风格?是照片一样的真实感,还是二次元动漫风?又或者是梵高那样的油画笔触?其实,不用挨个试。有一个工具,基本上能满足你对所有风格的想象,这个工具就是Midjourney。
先说清楚,Midjourney不是唯一的选择,但它在生成图片的“艺术感”和风格多样性上,确实做得非常突出。 它的新版本,尤其是V6,理解能力和细节处理都比以前强了不少。 更重要的是,它有两种方法来控制风格:一种是传统的“念咒语”,也就是写关键词;另一种是直接“喂”给它一张参考图,让它学习风格。后者才是它能搞定几乎所有风格的真正原因。

第一部分:用关键词精确控制风格
这是最基础的玩法,也是所有AI绘画工具通用的逻辑。你用文字告诉AI你要画什么,以及用什么风格画。关键就在于,描述风格的词要够准。AI其实不懂什么是“好看”,它只认识标签。你在一个词上加一点点变化,出来的图就可能完全是两码事。
下面是一些具体的例子,你可以直接拿去用,感受一下效果。
1. 模拟真实的绘画或艺术媒介
如果你想让图片看起来像是人画的,而不是电脑做的,可以指定具体的绘画工具或材料。这能立刻给图片增加质感。
- 油画 (Oil Painting): 这个关键词能生成有明显笔触和厚重纹理的图像,就像真的油画一样。 比如,你可以写:
an old fisherman, oil painting style --ar 16:9(一个老渔夫,油画风格,16:9的宽高比)。 - 水彩画 (Watercolor): 效果是颜色清透、边缘有浸润感。 适合画一些清新、明亮的场景。比如:
a cat sleeping on a windowsill, watercolor --ar 4:3(一只在窗台上睡觉的猫,水彩画,4:3的宽高比)。 - 素描 (Sketch): 能生成铅笔或炭笔画的黑白草图效果。 想要更具体一点,可以指定是“炭笔素描 (Charcoal sketch)”还是“铅笔素描 (Pencil sketch)”。比如:
a detailed sketch of a classic car --ar 16:9(一辆老爷车的精细素描,16:9的宽高比)。 - 版画 (Woodcut): 这种风格会产生类似木刻版画的粗犷线条和色块,非常有力量感。比如:
a roaring tiger, Japanese woodcut style --ar 1:1(一只咆哮的老虎,日本版画风格,1:1的宽高比)。
2. 指定艺术流派和时代风格
如果你对美术史有点了解,可以直接用艺术流派的名字,AI都认识。这能让你的图片带上强烈的特定气息。
- 印象派 (Impressionism): 会模仿莫奈、雷诺阿那种注重光影和色彩的风格,笔触比较零碎。比如:
a field of sunflowers at sunset, impressionism --ar 16:9(日落下的向日葵花田,印象派,16:9的宽高比)。 - 装饰风艺术 (Art Deco): 这种风格强调几何形状、金属质感和奢华感,非常适合做一些复古的海报设计。 比如:
a poster for a 1920s jazz club, art deco style --ar 2:3(一张1920年代爵士俱乐部的海报,装饰风艺术风格,2:3的宽高比)。 - 赛博朋克 (Cyberpunk): 霓虹灯、高楼林立的未来城市、雨夜、科技与破败的结合,这些元素都会出现。 比如:
a woman with glowing cables in her hair, standing in a futuristic city street at night, cyberpunk --ar 16:9(一个头发里有发光线缆的女人,站在未来城市的夜间街道上,赛博朋克,16:9的宽高比)。 - 浮世绘 (Ukiyoe): 这是日本的一种传统绘画风格,线条清晰,色彩平涂,很有特点。 比如:
The Great Wave off Kanagawa with a giant octopus, ukiyoe style --ar 3:2(神奈川巨浪与一只巨大的章鱼,浮世绘风格,3:2的宽高比)。
3. 模仿特定的流行文化风格
除了传统的艺术风格,你也可以让Midjourney模仿某些知名的动画工作室或游戏风格。
- 吉卜力动画风格 (Studio Ghibli style): 画面会变得清新、治愈,有种手绘动画的温暖感。 比如:
a little girl and a friendly forest spirit, Studio Ghibli anime style --ar 16:9(一个小女孩和友善的森林精灵,吉卜力动画风格,16:9的宽高比)。 - 皮克斯风格 (Pixar style): 会生成那种3D、角色表情夸张、色彩鲜艳的动画效果。 比如:
a grumpy bulldog wearing a small hat, 3D Pixar style --ar 1:1(一只戴着小帽子的暴躁斗牛犬,3D皮克斯风格,1:1的宽高比)。 - 像素艺术 (Pixel Art): 图像会变成由一个个小方块组成的复古游戏风格。 比如:
a knight fighting a dragon, 16-bit pixel art --ar 4:3(一个骑士在和龙战斗,16位像素艺术,4:3的宽高比)。
第二部分:真正的杀手锏——风格参考 (Style Reference)
好了,上面说的这些,虽然已经很强大,但都有一个前提:你得知道描述这个风格的关键词是什么。如果你在网上看到一张画,风格很特别,你说不出它属于哪个流派,怎么办?
这就是Midjourney V6版本之后最厉害的功能——风格参考(Style Reference)。 它的用法非常直接:你给Midjourney一张或几张图片,告诉它“我不要这张图的内容,我只要它的风格”,然后你再用文字描述你想要画的内容。
这个功能,就解决了“无法用语言描述的风格”这个问题。
具体怎么操作?
步骤很简单:
- 准备参考图: 找到你喜欢的那张图,把它上传到Discord里,或者找到它的图片链接。
- 获取图片链接: 把上传的图片在浏览器里打开,复制它的链接地址。链接必须以
.png,.gif,.webp,.jpg, or.jpeg结尾。 - 使用
--sref指令: 在写你的提示词时,在最后加上--sref这个参数,后面再紧跟着粘贴你复制的图片链接。
举个实际的例子。
假设你非常喜欢一个独立漫画家的画风,他的线条很乱,用色很大胆,这种风格没法用“印象派”或者“赛博朋克”来概括。
- 第一步: 你找到他的一张作品,上传到Discord,拿到图片链接,比如是
https://example.com/artist-style-image.jpg。 - 第二步: 你想画一个“在屋顶上喝咖啡的宇航员”。
- 第三步: 你的完整提示词就是:
an astronaut drinking coffee on a rooftop, --sref https://example.com/artist-style-image.jpg --ar 16:9
提交之后,Midjourney就会生成一张宇航员在屋顶喝咖啡的图,但画面的笔触、颜色、光影和整体感觉,都会去模仿你给的那张漫画。
你甚至可以同时参考多张图的风格,只要把它们的链接都跟在 --sref 后面,用空格隔开就行。这样,AI会试着融合这几张图的共同特点,创造出一种混合风格。
这个功能为什么说它包含了所有风格?因为它把定义风格的权力,从AI的词汇库里解放了出来,交给了你。只要是你能找到的图片,理论上,你就能模仿它的风格。这意味着,风格库是无限的。
关于其他工具
当然,也不是说别的工具就不好。
- Stable Diffusion 是另一个非常强大的工具,而且是开源的。 它的最大好处是自由度极高,你可以下载各种别人训练好的模型(Models),每种模型都专精于一种特定风格,比如专门画二次元的,或者专门生成真实照片的。 但是,它需要一定的技术知识,你要自己部署、下载模型,对电脑配置也有要求,不适合只想快速出图的普通用户。
- DALL-E 3 的优势是和ChatGPT深度整合,你用自然语言跟它聊天就能出图,理解能力很好,操作最简单。 比如你可以说“帮我画一只猫,让它看起来更卡通一点,颜色用蓝色和黄色”,它能听懂。但它生成的图片在艺术性和风格的惊艳程度上,有时候会比Midjourney稍微“规矩”一些。
总的来说,如果你追求的是极致的风格多样性和艺术感,而且愿意花一点点时间学习指令,Midjourney绝对是目前最合适的选择。特别是它的风格参考功能,真正让“画出任何你想要的风格”这件事,变得可能了。
原创文章,作者:MakeAI,如若转载,请注明出处:https://www.qidianhudong.com/aiyy/ai-pic/2448.html