豆包上线Seedance 1.5 Pro：0成本制作 AI 大片

看不見的法師

发布时间：2026-01-09 09:56:47

727人浏览过

来源于php中文网

原创

火山引擎总裁谭待：字节追赶全球大模型，差距仍在，更要看加速度
图片来源：视觉中国
蓝鲸新闻12月19日讯（记者朱俊熹）
“衡量AI发展快慢的核心标尺，就是tokens的调用量。”字节跳动旗下云服务平台火山引擎总裁谭待指出，“模型唯有被实际调用，才能释放真实价值；而越具实用价值的模型，其调用量自然越高。”
在12月18日举行的FORCE原动力大会上，火山引擎披露最新数据：截至2025年12月，豆包大模型日均token使用量已突破50万亿，相较今年5月公布的16.4万亿实现大幅跃升，较去年同期亦显著增长。（该信息的时间戳是2025年12月19日）

字节跳动全新音视频模型Seedance 1.5 Pro 正式登陆豆包App，支持一键生成音画同步的有声视频
记者19日从字节跳动获悉，豆包App视频生成能力全面升级，现已集成Seedance 1.5 Pro模型，用户可直接生成声画高度匹配的完整有声视频。实测显示，打开豆包App对话框，点击“照片动起来”，上传任意图片并输入提示词，选择“1.5 Pro”模型，即可即时体验该功能。
据字节跳动Seed官网介绍，Seedance 1.5 Pro是其自主研发的新一代音视频联合生成模型，依托原生音视频融合架构与深度后训练优化，在多模态指令理解与执行方面表现突出。
该模型实现了高精度音画同步，视听一致性达行业领先水平；同时原生支持普通话、多种外语及地方方言口音，能精准还原不同语种特有的语音韵律与情感张力。
在影像表达层面，Seedance 1.5 Pro具备电影级运镜调度能力——可自主完成推拉摇移、希区柯克变焦等复杂镜头语言，实现专业级画面衔接与影调控制，显著增强视频动态表现力。
语义理解与叙事协同能力亦同步升级，模型能深入解析文本背后的叙事逻辑与语境关系，提升整段音视频内容的情绪连贯性与节奏协调性，为影视短剧、广告创意、戏曲数字化等专业场景提供坚实支撑。
早在2025年6月，Seedance 1.0 Pro已正式发布，支持文图双模输入，可生成多镜头无缝切换的高质量视频，在主体稳定性与画面自然度上获得广泛认可。
与此同时，即梦AI也已同步上线Seedance 1.5 Pro，全面支持音画同生。其网页端官宣升级为一站式“AI片场”，涵盖模型能力、交互界面与创作流程三大维度，致力于打通从灵感萌芽到成片输出的全链路。本次更新核心亮点为“视频 3.5 Pro”——基于Seedance 1.5 Pro打造，在即梦AI全球首发。该模型支持音视频同步生成，人物口型、乐器演奏、环境音效等元素无需后期合成，极大增强沉浸感与真实感；在复杂运镜指令、动作幅度控制、光影氛围渲染等方面响应精准，并对中文发音口型、面部微表情乃至方言语音生成提供更强适配能力。
此外，即梦AI网页版还将迎来全新UI设计，升级画布操作逻辑、Agent智能体交互等功能，进一步降低专业创作门槛。
字节跳动表示，此次全面升级标志着即梦AI正加速构建直观、高效、一体化的AI创作基础设施，将原本分散的AI能力整合为可感知、可操作、可复用的“AI片场”，助力每一位创作者将天马行空的构想，高效转化为富有感染力的视听作品。

豆包视频生成模型Seedance 1.5 Pro今日正式上线
据悉，Seedance 1.5 Pro支持音视频联合生成，可完成文本→音视频、图像→音视频等多种生成任务。由此，Seedance不再仅聚焦于视觉呈现，而是真正实现声音与画面的自然共生。字节跳动Seed官方表示，在多项综合评测中，Seedance 1.5 Pro关键性能指标位居“业界前列”。目前，该模型已全面接入即梦AI与豆包平台。（消息发布于2025年12月18日）

7x24小时全球实时财经新闻直播
近日，豆包App视频生成功能完成重大升级，正式支持Seedance 1.5 Pro模型，用户可一键生成音画一致的有声视频。操作路径清晰简洁：进入豆包App对话框，选择“照片动起来”，上传图片并输入提示词，切换至“1.5 Pro”模型，即可启动生成。根据字节跳动Seed官网说明，Seedance 1.5 Pro作为新一代音视频创作模型，凭借原生音视频联合建模与精细化后训练策略，显著提升了对多模态指令的理解与执行精度。（2025年12月19日资料）

豆包上线 Seedance 1.5 Pro，支持端到端有声视频生成
本次上线的Seedance 1.5 Pro，本质是对“文字—画面—声音”创作链路的一次系统性重构：
语义驱动 + 音画同生：彻底告别“先出画再配音”的割裂模式，模型可深度解析文本语义，同步生成内容契合的画面、台词与音效，从根本上规避音画错位；
更拟真的语音表达：所生成的人物语音摆脱机械朗读感，具备自然的语气起伏、停顿节奏与情绪层次，接近真人讲述质感；
电影级叙事语言 + 动态镜头逻辑：画面自动嵌入景别变化与运镜逻辑，复杂肢体动作、人物互动等细节亦能被准确建模与呈现，无需人工添加特效。
普通用户操作极为便捷：打开豆包App对话框，点击“照片动起来”，选定“1.5 Pro”模型，上传一张参考图（如生活照、手绘稿），再输入提示词（例如：“让这只猫用温柔语气讲睡前故事，背景是星空卧室”），系统即刻输出一条完整的有声视频。从图文生成迈向有声视频生成，Seedance 1.5 Pro推动豆包迈入“对话即创作”的新阶段——无论是剧情短片、产品演示，还是静态素材活化，全部可在对话框内一站式完成，真正践行“让画面发声，让创意落地”。

豆包上线 Seedance 1.5 Pro，支持端到端有声视频生成
语义驱动 + 音画同生：彻底告别“先出画再配音”的割裂模式，模型可深度解析文本语义，同步生成内容契合的画面、台词与音效，从根本上规避音画错位；
更拟真的语音表达：所生成的人物语音摆脱机械朗读感，具备自然的语气起伏、停顿节奏与情绪层次，接近真人讲述质感；
电影级叙事语言 + 动态镜头逻辑：画面自动嵌入景别变化与运镜逻辑，复杂肢体动作、人物互动等细节亦能被准确建模与呈现，无需人工添加特效。
普通用户操作极为便捷：打开豆包App对话框，点击“照片动起来”，选定“1.5 Pro”模型，上传一张参考图（如生活照、手绘稿），再输入提示词（例如：“让这只猫用温柔语气讲睡前故事，背景是星空卧室”），系统即刻输出一条完整的有声视频。从图文生成迈向有声视频生成，Seedance 1.5 Pro推动豆包迈入“对话即创作”的新阶段——无论是剧情短片、产品演示，还是静态素材活化，全部可在对话框内一站式完成，真正践行“让画面发声，让创意落地”。（资料日期为2025年12月19日）

字节跳动发布Seedance 1.5 Pro音视频创作模型
Seedance 1.5 Pro支持音视频联合生成，可执行文本到音视频、图像引导音视频等多种生成任务。（发布时间为2025年12月16日）

字节跳动发布Seedance 1.5 Pro模型，实现音画深度融合
Seedance 1.5 Pro支持音视频联合生成，覆盖文本→音视频、图像→音视频等主流任务类型。由此，Seedance视频生成能力正式突破纯视觉边界，迈入音画共生新阶段。
相比Seedance 1.0侧重于夯实基础表现“下限”（如运动生成稳定性），1.5 Pro则聚焦突破视觉冲击力与运动表现力的“上限”，采用更具创新性的技术路径，在视听协同性、画面张力与叙事连贯性三方面取得实质性进展：
• 精准音画同步与多语种/方言适配：显著提升口型-语音-节奏三者拟合精度，原生支持多语种及地域方言，可细腻还原语音韵律与情感张力；
• 电影级运镜控制与动态表现：具备自主镜头调度能力，支持长镜头跟随、变焦运镜等专业手法，配合电影级画面衔接与影调处理，强化视频动态表现力；
• 强化语义理解与叙事协同：通过语义建模升级，更好识别叙事上下文，提升音视频段落整体节奏统一性与情绪连贯性，为专业内容生产提供底层支撑。
字节跳动Seed表示，Seedance 1.5 Pro在综合评测中多项关键能力处于“业界前列”。目前，该模型已全面上线即梦AI与豆包平台。（截至2025年12月16日）

字节跳动Seedance 1.5 Pro音视频创作模型正式发布
Seedance 1.5 Pro支持音视频联合生成，可执行文本到音视频、图像引导音视频等多种生成任务。（2025年12月16日）

豆包生视频功能升级，支持音画同步生成
首先，该模型实现高精度音画同步，视听一致性优异，且兼容多语种与地方方言口音，能精准复现其独特语音韵律与情感表达；
其次，Seedance 1.5 Pro具备电影级运镜控制能力与动态张力，拥有自主镜头调度机制，支持专业级画面衔接与影调风格，大幅提升视频动态表现力；
再次，语义理解与叙事协同能力显著增强，可精准把握叙事语境，提升音视频段落整体协调性，为专业内容创作提供有力保障。
据悉，Seedance 1.5 Pro在视听协同、动态调度与文化语境理解等方面的深度优化，使其在影视制作、短剧开发、广告创意及传统戏曲数字化等多元场景中，均展现出卓越的叙事能力与视听融合水准。（撰于2025年12月19日）

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

豆包上线seedance 1.5 pro：0成本制作 ai 大片