从0到1，教你如何用AI做出第一个属于自己的短视频

做AI短视频，总共分五步：搞定文案、生成配音、配上画面、找点音乐，最后把它们剪辑到一起。整个流程，我会用一个“每天阅读一小时，一年后会怎样”的例子，带你从头走到尾。

第一步：先搞定文案

视频的根基是文案。文案不行，画面再好也白搭。别自己硬想，这事AI很擅长。

你可以用ChatGPT（需要能上网的工具）或者国内的Kimi Chat。它们都能帮你。你要做的，不是让AI直接写，而是先给它一个明确的框架。

一个短视频的文案框架，通常是这样的：
1. 黄金三秒开头： 用一个问题或者一个有冲击力的事实抓住别人的注意力。
2. 中间部分： 展开说，给出具体的论点和例子，分成几点说更清楚。
3. 结尾： 总结一下，或者给出一个能让人思考的结尾。

我们用这个框架来处理“每天阅读一小时”的例子。你可以直接复制下面这段话，发给AI：

“写一个短视频文案，主题是‘每天阅读一小时，一年后会发生什么’。要求：
1. 开头要能吸引人。
2. 中间部分，从知识、思维和心态三个方面，用具体的例子来说明变化。
3. 结尾要有力量，能鼓励人。
4. 全文写成配音稿的格式，语言要口语化，总时长控制在60秒左右。”

AI会很快给你一份稿子。它给的稿子通常能用，但可能有点干。你需要自己再改改，加点个人语气。比如AI写“你会获得知识”，你可以改成“你的知识库会像滚雪球一样变大”。加一点自己的话，感觉就不一样了。改稿子比自己从零开始写，要快得多。

第二步：生成配音

文案有了，就该把它变成声音了。真人录音当然最好，但如果你的声音不好听或者没设备，AI配音是最好的选择。

现在AI配音做得好的工具很多，比如ElevenLabs。它的优点是声音非常自然，可选的音色也多。免费版有一定额度，做几个短视频是够用的。

操作很简单：
1. 打开网站，注册一个账号。
2. 把我们上一步改好的文案，粘贴到文本框里。
3. 在下面选择一个你喜欢的声音。我建议你多试听几个，找一个听起来最舒服的。
4. 点击生成，等一会，音频文件就好了，直接下载下来。

这里有个小技巧：想让AI读得更自然，你可以在需要停顿的地方多加逗号或者句号。比如“一年后…你会发现”，中间的省略号就能让AI产生一个自然的停顿，听起来就不那么像机器了。

第三步：生成视频画面

这是最关键的一步，也是AI技术发展最快的地方。以前我们得找素材，现在直接用文字生成视频。

目前最好用的工具是Pika和Runway。它们都是输入文字，生成几秒钟的短视频片段。Sora效果惊人，但现在我们大部分人用不上，所以先不管它。我们就用Pika举例。

做视频画面，千万不要想着输入一段长文案，让AI直接生成一个完整的视频。这是错的。正确做法是“分镜”，也就是把你的文案拆成一句一句话，每一句话配上一个对应的画面。

还是用“每天阅读”的例子：
* 文案第一句：“如果你每天坚持阅读一小时，一年后会怎样？”
* 对应的画面想法：一个时钟在快速转动，最后停在一年后的标记上。
* 你给Pika的指令（Prompt）：“A clock face, hands spinning rapidly, symbolizing the passage of one year, cinematic, high detail.”（一个钟面，指针飞速旋转，象征一年时间流逝，电影感，高细节。）

文案第二句：“首先，你的知识会变得更丰富。”
- 对应的画面想法：一个人的大脑，有知识像光一样流进去。
- 给Pika的指令：“An abstract animation of knowledge flowing into a human brain like streams of light, glowing, metaphorical.”（知识像光束一样流入人脑的抽象动画，发光的，隐喻的。）
文案第三句：“其次，你的思维会更敏锐。”
- 对应的画面想法：一个复杂的迷宫，有一条清晰的线从起点通向终点。
- 给Pika的指令：“A complex maze, a bright glowing line quickly finds a path from start to finish, symbolizing clear thinking.”（一个复杂的迷宫，一条明亮的线快速找到了从起点到终点的路，象征清晰的思维。）

就这样，把你的文案拆成大概10到15个镜头，一句一句地去生成。每个生成的视频片段大概3到5秒。这样做的好处是，你可以精确控制每一个画面的内容，而且画面的风格可以保持一致。在写指令时，可以在每句后面都加上“cinematic, high detail”这样的词，来帮助统一风格。

把所有生成的小视频片段，都下载保存好。

第四步：找一段背景音乐

一个好的背景音乐，能让视频的感觉好很多。这事也可以交给AI。

Suno和Udio是目前最好的AI音乐生成工具。你只要告诉它你想要什么样的音乐就行。

操作步骤：
1. 打开Suno网站。
2. 在创作框里，用简单的语言描述你想要的音乐风格。比如，我们要给阅读视频配乐，就可以输入：“一段平静、能启发思考的背景音乐，纯乐器，有点慢，适合用在关于学习和成长的视频里。”（A calm, inspiring background music, instrumental only, slow tempo, suitable for videos about learning and growth.）
3. 点击生成，它会一次给你两首备选。听一下，哪个好就用哪个。不满意就再让它生成一次。
4. 找到喜欢的，下载下来。用AI生成音乐最大的好处，就是完全不用担心版权问题，因为每一首都是它原创的。

第五步：剪辑，把所有东西合在一起

现在，我们手里有了一段配音、一堆视频片段和一首背景音乐。最后一步，就是把它们组装起来。

最适合新手的剪辑软件是CapCut，也就是国内的剪映。它操作简单，而且有很多AI功能可以用。

具体剪辑流程：
1. 导入素材： 打开剪映，新建一个项目。把你下载好的配音、所有视频片段和背景音乐，都拖拽进去。
2. 对齐配音和画面： 先把配音音频拖到主时间轴上。然后听配音，听到哪一句，就把对应的视频片段拖到配音的上方。比如，配音说到“你的知识会变得更丰富”，就把那个“知识流入大脑”的视频片段对齐到这里。一个一个对齐，直到配音结束。
3. 调整画面： 有的视频片段可能比你需要的时间长，直接拖动它的边缘，就能把它裁短。确保画面的切换和你配音的节奏能对上。
4. 加入背景音乐： 把下载好的背景音乐文件拖到最下面的音轨。然后右键点击音乐，把音量调低，大概调到10%到20%就行。记住，它只是背景，不能盖过配音。
5. 自动生成字幕： 这是剪映最好用的功能之一。在主菜单找到“文本”，然后点击“智能字幕”，选择识别音频。它会自动把你的配音转成字幕，并且时间轴都对好了。你只需要检查一遍，改几个错别字就行。这能省下大量时间。
6. 导出视频： 所有东西都弄好后，预览一遍，没问题就点击右上角的“导出”。选一个1080p的分辨率就够用了，然后等它输出就行。

到这里，你的第一个AI短视频就做完了。整个过程，你没有写一个字（AI写的），没有录一句音（AI读的），没有拍一个镜头（AI画的），甚至背景音乐也是AI创作的。你做的，是当一个导演，负责提出想法，拆分镜头，然后把这些素材组合起来。熟练之后，做一个这样的视频，一个小时足够了。

原创文章，作者：MakeAI，如若转载，请注明出处：https://www.qidianhudong.com/aiyy/ai-video/2663.html