做AI短视频,总共分五步:搞定文案、生成配音、配上画面、找点音乐,最后把它们剪辑到一起。整个流程,我会用一个“每天阅读一小时,一年后会怎样”的例子,带你从头走到尾。

第一步:先搞定文案
视频的根基是文案。文案不行,画面再好也白搭。别自己硬想,这事AI很擅长。
你可以用ChatGPT(需要能上网的工具)或者国内的Kimi Chat。它们都能帮你。你要做的,不是让AI直接写,而是先给它一个明确的框架。
一个短视频的文案框架,通常是这样的:
1. 黄金三秒开头: 用一个问题或者一个有冲击力的事实抓住别人的注意力。
2. 中间部分: 展开说,给出具体的论点和例子,分成几点说更清楚。
3. 结尾: 总结一下,或者给出一个能让人思考的结尾。
我们用这个框架来处理“每天阅读一小时”的例子。你可以直接复制下面这段话,发给AI:
“写一个短视频文案,主题是‘每天阅读一小时,一年后会发生什么’。要求:
1. 开头要能吸引人。
2. 中间部分,从知识、思维和心态三个方面,用具体的例子来说明变化。
3. 结尾要有力量,能鼓励人。
4. 全文写成配音稿的格式,语言要口语化,总时长控制在60秒左右。”
AI会很快给你一份稿子。它给的稿子通常能用,但可能有点干。你需要自己再改改,加点个人语气。比如AI写“你会获得知识”,你可以改成“你的知识库会像滚雪球一样变大”。加一点自己的话,感觉就不一样了。改稿子比自己从零开始写,要快得多。
第二步:生成配音
文案有了,就该把它变成声音了。真人录音当然最好,但如果你的声音不好听或者没设备,AI配音是最好的选择。
现在AI配音做得好的工具很多,比如ElevenLabs。它的优点是声音非常自然,可选的音色也多。免费版有一定额度,做几个短视频是够用的。
操作很简单:
1. 打开网站,注册一个账号。
2. 把我们上一步改好的文案,粘贴到文本框里。
3. 在下面选择一个你喜欢的声音。我建议你多试听几个,找一个听起来最舒服的。
4. 点击生成,等一会,音频文件就好了,直接下载下来。
这里有个小技巧:想让AI读得更自然,你可以在需要停顿的地方多加逗号或者句号。比如“一年后…你会发现”,中间的省略号就能让AI产生一个自然的停顿,听起来就不那么像机器了。
第三步:生成视频画面
这是最关键的一步,也是AI技术发展最快的地方。以前我们得找素材,现在直接用文字生成视频。
目前最好用的工具是Pika和Runway。它们都是输入文字,生成几秒钟的短视频片段。Sora效果惊人,但现在我们大部分人用不上,所以先不管它。我们就用Pika举例。
做视频画面,千万不要想着输入一段长文案,让AI直接生成一个完整的视频。这是错的。正确做法是“分镜”,也就是把你的文案拆成一句一句话,每一句话配上一个对应的画面。
还是用“每天阅读”的例子:
* 文案第一句:“如果你每天坚持阅读一小时,一年后会怎样?”
* 对应的画面想法:一个时钟在快速转动,最后停在一年后的标记上。
* 你给Pika的指令(Prompt):“A clock face, hands spinning rapidly, symbolizing the passage of one year, cinematic, high detail.”(一个钟面,指针飞速旋转,象征一年时间流逝,电影感,高细节。)
文案第二句:“首先,你的知识会变得更丰富。”
- 对应的画面想法:一个人的大脑,有知识像光一样流进去。
- 给Pika的指令:“An abstract animation of knowledge flowing into a human brain like streams of light, glowing, metaphorical.”(知识像光束一样流入人脑的抽象动画,发光的,隐喻的。)
文案第三句:“其次,你的思维会更敏锐。”
- 对应的画面想法:一个复杂的迷宫,有一条清晰的线从起点通向终点。
- 给Pika的指令:“A complex maze, a bright glowing line quickly finds a path from start to finish, symbolizing clear thinking.”(一个复杂的迷宫,一条明亮的线快速找到了从起点到终点的路,象征清晰的思维。)
就这样,把你的文案拆成大概10到15个镜头,一句一句地去生成。每个生成的视频片段大概3到5秒。这样做的好处是,你可以精确控制每一个画面的内容,而且画面的风格可以保持一致。在写指令时,可以在每句后面都加上“cinematic, high detail”这样的词,来帮助统一风格。
把所有生成的小视频片段,都下载保存好。
第四步:找一段背景音乐
一个好的背景音乐,能让视频的感觉好很多。这事也可以交给AI。
Suno和Udio是目前最好的AI音乐生成工具。你只要告诉它你想要什么样的音乐就行。
操作步骤:
1. 打开Suno网站。
2. 在创作框里,用简单的语言描述你想要的音乐风格。比如,我们要给阅读视频配乐,就可以输入:“一段平静、能启发思考的背景音乐,纯乐器,有点慢,适合用在关于学习和成长的视频里。”(A calm, inspiring background music, instrumental only, slow tempo, suitable for videos about learning and growth.)
3. 点击生成,它会一次给你两首备选。听一下,哪个好就用哪个。不满意就再让它生成一次。
4. 找到喜欢的,下载下来。用AI生成音乐最大的好处,就是完全不用担心版权问题,因为每一首都是它原创的。
第五步:剪辑,把所有东西合在一起
现在,我们手里有了一段配音、一堆视频片段和一首背景音乐。最后一步,就是把它们组装起来。
最适合新手的剪辑软件是CapCut,也就是国内的剪映。它操作简单,而且有很多AI功能可以用。
具体剪辑流程:
1. 导入素材: 打开剪映,新建一个项目。把你下载好的配音、所有视频片段和背景音乐,都拖拽进去。
2. 对齐配音和画面: 先把配音音频拖到主时间轴上。然后听配音,听到哪一句,就把对应的视频片段拖到配音的上方。比如,配音说到“你的知识会变得更丰富”,就把那个“知识流入大脑”的视频片段对齐到这里。一个一个对齐,直到配音结束。
3. 调整画面: 有的视频片段可能比你需要的时间长,直接拖动它的边缘,就能把它裁短。确保画面的切换和你配音的节奏能对上。
4. 加入背景音乐: 把下载好的背景音乐文件拖到最下面的音轨。然后右键点击音乐,把音量调低,大概调到10%到20%就行。记住,它只是背景,不能盖过配音。
5. 自动生成字幕: 这是剪映最好用的功能之一。在主菜单找到“文本”,然后点击“智能字幕”,选择识别音频。它会自动把你的配音转成字幕,并且时间轴都对好了。你只需要检查一遍,改几个错别字就行。这能省下大量时间。
6. 导出视频: 所有东西都弄好后,预览一遍,没问题就点击右上角的“导出”。选一个1080p的分辨率就够用了,然后等它输出就行。
到这里,你的第一个AI短视频就做完了。整个过程,你没有写一个字(AI写的),没有录一句音(AI读的),没有拍一个镜头(AI画的),甚至背景音乐也是AI创作的。你做的,是当一个导演,负责提出想法,拆分镜头,然后把这些素材组合起来。熟练之后,做一个这样的视频,一个小时足够了。
原创文章,作者:MakeAI,如若转载,请注明出处:https://www.qidianhudong.com/aiyy/ai-video/2663.html