快手可灵 ai 团队正式发布全球首个统一多模态视频模型——可灵视频 o1 模型全量上线。
据悉,该模型采用全新生成式架构,旨在“打破功能壁垒”,并引入了 MVL(多模态视觉语言)交互系统,实现多种任务在单一输入框内的无缝整合。结合 Chain-of-thought 技术,模型具备出色的常识推理与事件演化能力。

官方表示,基于统一模型所具备的深层语义理解能力,“每一张图片、每一段视频、每一句文本,在可灵 O1 看来都是可执行指令”。同时推出的还有全新设计的创作界面,用户只需通过自然对话,即可灵活调用各类素材,精细控制生成内容的每个细节。
模型支持多角度构建主体对象,宣称无论镜头如何切换或移动,主体特征始终保持一致,保障画面精准流畅。此外,还允许自由组合多个主体进行创作。


体验地址:https://www.php.cn/link/81282cfb8f54dd1988c4f87dbc903c2b
源码地址:点击下载
以上就是快手正式全量上线可灵 AI 视频 O1 模型,全球首个统一多模态视频模型的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号