爱诗科技于12月1日正式推出其AI视频大模型PixVerse V5.5(国内版为拍我AI V5.5),标志着AI视频生成技术在叙事能力和用户体验方面取得显著进展。此次更新的核心在于实现“导演级”的音画同步与多镜头智能切换,旨在大幅降低视频创作门槛,让用户能够更便捷地生成高质量短片。
PixVerse V5.5版本的一项关键功能是支持用户通过简洁的文本描述,一键生成带有声音和口型同步的高清视频。系统能够自动处理人声、环境音及情绪配音,并使其与画面中的角色节奏、动作和口型精准契合,从而实现镜头与声音的一次性成型,确保叙事逻辑的连贯性。
与以往仅能生成单一镜头或零散画面的模型不同,PixVerse V5.5能够输出具备完整叙事结构的短片。它支持智能多镜头自动切换,可在远景、中景、近景之间自然过渡,使运镜更为流畅。用户可选择生成5秒、8秒或10秒长度的分镜,直接输出“初版成片”。
该版本采用爱诗科技自主研发的Diffusion与Transformer混合架构,有效提升了视频生成的处理速度与最终质量。这一架构优化了高保真视频生成和时间上的一致性,确保了输出内容的视觉连贯性。 此外,PixVerse V5.5整合了文生视频、图生视频、台词口型同步及音效等多元功能,为用户提供了从创意构思到作品发布的端到端一站式服务。
PixVerse V5.5的发布,特别是其音画一体化的特性,使得用户无需进行二次剪辑即可直接发布视频内容,极大地降低了视频创作所需的技术门槛。对于不熟悉复杂提示词的新手而言,只需简单的描述即可生成相应的视频,进一步促进了AI工具在视频创作领域的普及应用。