快手旗下的人工智能产品可灵AI近日宣布,其2.6版本模型已全面上线,并首次引入了“音画同出”功能。这一创新旨在彻底整合视觉与听觉创作流程,显著提升用户的内容制作体验。
此次更新的核心亮点在于,可灵AI 2.6能够在一次性生成过程中,同步输出画面、自然语音、匹配音效及环境氛围,打破了传统AI视频创作中“先生成无声画面,后进行人工配音剪辑”的模式。
为满足多元化的创作需求,可灵2.6提供了两条主要的创作路径:“文生音画”和“图生音画”。通过“文生音画”,用户仅需提供一段文本描述,即可迅速生成完整的音视频内容。而“图生音画”则使得静态图像能够被赋予动态表现和声音,实现“开口说话”的效果。
该模型具有广泛的应用前景,适用于多种内容创作形式,包括个人独白(如商品展示、生活Vlog、新闻播报、演讲)、旁白解说(如商品讲解、赛事解说、纪录片旁白、故事叙述)、多角色对话(如访谈节目、短剧)以及音乐表演(如演唱、说唱、多重合唱、乐器演奏)等。
快手可灵AI团队表示,2.6版本的推出将极大地提高视频创作的灵活性和便捷性,使用户能够更充分地表达创意。此次升级标志着快手在人工智能内容生成领域迈出了重要一步,进一步响应了用户不断增长的多元化创作需求。 经济观察网与界面新闻的报道指出,目前,该模型支持中文与英文语音生成,生成的视频长度最长可达10秒。