你最近肯定在网上刷到过一些图片,好看是好看,但总觉得哪里怪怪的。有的像画,又真实得吓人;有的画面精美得不像话。这些图,很多都是AI画的。
这东西叫“AI图像生成器”。玩法很简单,你打一段字,AI就能给你变出一张画来。这让画画的门槛一下子降到几乎没有了。但现在市面上一大堆这种工具,名字听着都挺唬人:Midjourney, Stable Diffusion, DALL-E 3… 选哪个?它们到底有啥区别?

这篇东西就是为了把这事儿说明白。我会把市面上最火的几个AI拎出来,一个个讲清楚,帮你找到最适合你自己的那款。
这玩意儿到底怎么回事
① “文生图”是个啥
“文生图”(Text-to-Image),听名字就懂。就是“用文字生成图片”。
这就像你跟一个超级画师提需求,这个画师脑子里装着人类有史以来几乎所有的图片。你跟他说:“我要一张图,一只猫穿着宇航服在月球表面弹吉他,画风要像梵高的《星空》。” 画师听懂了,就把这张奇葩的图给你画了出来。AI干的就是这个活。你输入的文字,行话叫“提示词”(Prompt)。
② AI画图的原理,说白了就是“修复”
现在这些AI画图,大部分用的是一个叫“扩散模型”的技术。
过程大概是这样:
先让AI看无数的图片和描述这些图片的文字。然后,程序会把一张清晰的图片,不断往上加噪点,直到变成一块啥也看不清的“雪花”,就像老电视没信号那样。AI要学习的就是这个“搞破坏”的过程。
最关键的是第二步:反过来。让AI看着一堆杂乱无章的雪花点,再把它一步步“修复”回清晰的图片。
等你输入“一只在月球弹吉他的猫”这段话,这段话就成了AI修复雪花点的“导航图”。AI从一堆随机噪点开始,一边看着你的文字要求,一边把噪点往你想要的样子上“凑”,直到最后“修复”成一张全新的、符合你描述的图片。
③ 为啥市面上有这么多不同的AI绘画工具
技术底子差不多,但各家公司和团队“喂”给AI的图片不一样,调教AI的“口味”也不一样,做出来的产品样子和功能自然就千差万别了。
好比都是厨师,有的专门学做法国菜,有的专攻川菜,用的食材和调料也不同,最后做出来的菜,味道肯定不一样。
- Midjourney 可能看了更多艺术品和摄影大片,所以它“画”出来的东西艺术感就特别强。
- Stable Diffusion 像个开源的大厨房,所有菜谱、厨具都公开,谁都能来学、都能来改造,所以玩法花样最多。
- DALL-E 3 更注重“听懂”你说的话,力求准确地把你描述的东西画出来,不太追求独特的艺术风格。
市面上最火的三个家伙
说到AI绘画,绕不开这三个:Midjourney,Stable Diffusion,DALL-E 3。它们完全是三种不同的路子。
No.1 Midjourney:图片质感的标杆
想让AI出图有“高级感”和“艺术感”,目前Midjourney还是头一个。它生成的图,不管是光影、构图还是细节,都有一种独特的味道,圈内人称“MJ味”。
- 特点是啥
- 出图好看。这是它最核心的优势。就算你只会用最简单的词,它生成的图也丑不到哪去,审美一直在线。出来的图经常有种电影截图的感觉。
- 在Discord里用。这点比较特别,它的使用界面不是网页,而是一个叫Discord的聊天软件。你需要加入它的服务器,在一个聊天频道里输入指令来画图。比如输入/imagine prompt: a cat is playing guitar on the moon。
- 能抄作业。因为大家都在公共频道里画图,所以你能实时看到别人用了什么提示词生成了哪些好看的图。这对于新手来说,是最好的学习材料,直接复制粘贴别人的提示词,改改就能用。
- 缺点呢
- 要花钱。现在Midjourney没有免费版了,想玩就得掏钱订阅。
- 界面劝退。如果你没用过Discord,一开始可能会有点懵。
- 没啥隐私。在公共频道里,你画的所有东西,连同你的提示词,所有人都能看到。想要自己偷偷画,得买更贵的套餐。
- 谁适合用
设计师、画师、艺术工作者,或者任何对图片最终效果要求很高的人。
我的看法: Midjourney像个收费的高级艺术工作室。你不用管过程多复杂,只要把想法告诉它,它就能给你一个惊艳的结果。它重在“结果”,轻在“控制”。
No.2 Stable Diffusion:配置自由的开源王者
Stable Diffusion(简称SD)跟Midjourney正好反过来。它是完全开源的,意思是模型的代码、权重都公开,任何人都能免费下载,在自己的电脑上运行。
- 特点是啥
- 完全免费,而且能本地跑。只要你电脑显卡还行,就能在自己电脑上装一个SD,然后想画多少画多少,不用花一分钱。而且图片都保存在自己电脑里,绝对安全。
- 控制力最强,没有之一。这是SD最牛的地方。因为开源,全世界的开发者都在给它开发各种插件和新玩法。
- 能换模型。你可以从一个叫Civitai(俗称C站)的网站下载各种各样的“大模型”。有专门画二次元的,有专门画真人的,有专门画风景的,想换风格,换个模型就行。
- 能加LoRA。这玩意儿像个小小的“风格补丁”。比如你想画某个特定动漫角色的图,就可以去C站下载对应的LoRA文件,加载后就能准确画出这个角色。
- 有ControlNet插件。这是个神器。你可以上传一张火柴人摆的姿势图,然后让AI按照这个姿势生成一个复杂的人物。你甚至可以上传一张线稿,让AI帮你上色和细化。它能让你像做手术一样精确地控制画面构图和人物姿势。
- 缺点呢
- 门槛高。从安装配置到学会使用各种复杂的参数和插件,非常折腾人,对电脑小白不友好。
- 吃显卡。在自己电脑上跑,对显卡要求高。显卡不好,画一张图可能要等好几分钟甚至更久。
- 效果全靠自己。上限高,下限也低。用得好,出的图不比Midjourney差。用不好,生成的图可能就是一堆奇形怪状的玩意儿。
- 谁适合用
喜欢钻研技术的人,想完全控制画面每个细节的专业画师,或者预算不多但愿意花时间学习的学生和爱好者。
我的看法: Stable Diffusion不是一个工具,它是一个工具箱。它不直接给你鱼,而是给你全套的渔具和造船厂。它考验的是使用者的技术和耐心,但只要你肯钻研,它能帮你实现任何异想天开的画面。
No.3 DALL-E 3:最会“听人话”的伙伴
DALL-E 3是开发ChatGPT那家公司OpenAI做的。它最大的本事不是画得有多艺术,而是它能特别准确地理解你说的话。
- 特点是啥
- 和ChatGPT绑定。你可以直接在ChatGPT里跟它聊天来画图。你不用学那些复杂的提示词写法,就用平时说话的方式描述就行。你说完,ChatGPT还会帮你自动优化和丰富你的描述,让AI画得更好。
- 理解能力强。它对复杂的空间关系、前后左右、数量颜色的理解比其他AI强得多。举个例子,你跟它说“一个红色的方块在一个蓝色的球上面,旁边站着三只黄色的鸭子”,DALL-E 3能准确画出这个场景,但Midjourney可能会把颜色、数量或位置搞混。
- 用起来方便。除了在付费的ChatGPT Plus里用,你还可以在微软的Copilot(以前叫Bing Chat)里免费用它,门槛极低。
- 缺点呢
- 风格有点单一。画出来的图大多是插画、卡通那种感觉,质量不错,但缺少Midjourney那种“艺术大片”的质感。
- 控制选项少。它把很多东西都自动化了,你没法像Stable Diffusion那样调整各种细节参数。画成啥样,基本由它决定。
- 谁适合用
刚接触AI绘画的新手,写文章需要配图的内容创作者,或者 просто想把脑子里的想法快速变成图的普通人。
我的看法: DALL-E 3像一个特别聪明的翻译。你用中文(自然语言)跟它说话,它能精准地翻译成AI能懂的“绘画语言”,然后画出来。它让你把精力放在“想什么”上,而不是“怎么说”上。
还有几个也挺厉害的
除了上面三个,还有些工具在某些方面做得特别好,也值得关注。
A. Leonardo.Ai:游戏美术的瑞士军刀
这个工具不只是画图,它更像一个创作平台。你可以用它生成图,还能在它的网站上训练属于你自己的专属风格模型。比如,你把自己画的10张图上传,就能训练一个能模仿你画风的AI模型。它在生成游戏角色、道具、图标这些素材方面很受欢迎。而且它每天会送一些免费点数,够你随便玩玩了。
B. Ideogram AI:做带字的图,它最强
以前,让AI在图里写字简直是噩梦,写出来的都是些鬼画符。Ideogram这个工具出来后,情况变了。它有一个“Magic Spell”功能,能比较准确地把文字生成在图片里。你要做个海报、Logo、或者T恤印花,上面需要有清晰的英文,用它就对了。
C. 国内的代表(文心一格、通义万相):更懂中国味
像百度的文心一格和阿里的通义万相,最大的优势是中文和中国文化。你跟它们说“水墨山水风格”或者“赛博朋克风的长安城”,它们能理解得更到位。画出来的东西,更有“中国味”。而且界面都是中文的,用起来也方便。
一张表看明白
| Midjourney | Stable Diffusion | DALL-E 3 | Leonardo.Ai | Ideogram AI | 国内代表 | |
| 好不好上手 | 一般,得学用Discord | 贼难,得折腾 | 贼容易,会聊天就行 | 容易 | 容易 | 容易 |
| 出图好不好看 | 顶级,艺术感拉满 | 看人,上限高下限低 | 好,偏插画风 | 好,风格多 | 好 | 好,有中国特色 |
| 能控制的细节 | 一般 | 极高,啥都能调 | 少,基本靠AI自己 | 较多,能训练模型 | 少 | 一般 |
| 独门绝活 | 出图质感第一 | 免费、开源、控制力 | 听得懂人话 | 训练专属模型 | 在图里写字 | 懂中文和中国文化 |
| 花不花钱 | 只卖月卡/年卡 | 自己电脑上跑就免费 | ChatGPT Plus要钱/Copilot免费 | 每天送免费点数 | 每天送免费点数 | 每天送免费点数 |
| 中文好不好用 | 一般 | 看模型 | 好 | 还行 | 还行 | 最好 |
那你到底该用哪个
看了这么多,直接给点建议吧,看你属于哪一类。
① 如果你就是想随便玩玩,体验一下
- 直接用微软的Copilot。打开浏览器就能用,背后就是DALL-E 3,免费。随便跟它聊天,让它画点好玩的东西,体验一下AI的乐趣,足够了。
- 或者试试Leonardo.Ai。网站做得挺好,每天有免费额度,还能看看别人分享的模型,一键生成同款,也很有意思。
② 如果你是设计师,工作要用,对图片质量要求高
- 直接上Midjourney。别犹豫,它是目前最能保证出图质量和艺术感的工具。花钱买的是效率和效果,对于专业人士来说这笔投资划算。
③ 如果你爱钻研技术,想让AI完全听你的话
- 必须是Stable Diffusion。准备好一块好点的N卡,去B站找几个“Stable Diffusion整合包”教程,花一个周末的时间折腾一下。一旦上手,它的强大控制力和免费、无限出图的特性,会让你觉得一切折腾都值了。
④ 如果你要做海报、Logo,图里必须带字
- 试试Ideogram AI。目前在图里加英文字,它的效果是最好的,能省掉很多后期用PS调整的功夫。
最后说几句
AI画图这东西,说白了还是个工具,跟你用相机拍照,用画笔画画一样。它们不是来替代你思考的,而是帮你把脑子里的想法更快地拿出来。
别光看不练。随便挑一个看起来顺眼的,上手去玩。输入第一段描述,看看它会给你什么惊喜。这年头,想象力可能比技术更重要。
原创文章,作者:七点互动,如若转载,请注明出处:https://www.qidianhudong.com/aiyy/ai-pic/1202.html