火山引擎总裁谭待:字节追赶全球大模型,差距仍在,更要看加速度
图片来源:视觉中国
蓝鲸新闻12月19日讯(记者 朱俊熹)
“衡量AI发展快慢的核心标尺,就是tokens的调用量。”字节跳动旗下云服务平台火山引擎总裁谭待指出,“模型唯有被实际调用,才能释放真实价值;而越具实用价值的模型,其调用量自然越高。”
在12月18日举行的FORCE原动力大会上,火山引擎披露最新数据:截至2025年12月,豆包大模型日均token使用量已突破50万亿,相较今年5月公布的16.4万亿实现大幅跃升,较去年同期亦显著增长。(该信息的时间戳是2025年12月19日)
字节跳动全新音视频模型Seedance 1.5 Pro 正式登陆豆包App,支持一键生成音画同步的有声视频
记者19日从字节跳动获悉,豆包App视频生成能力全面升级,现已集成Seedance 1.5 Pro模型,用户可直接生成声画高度匹配的完整有声视频。实测显示,打开豆包App对话框,点击“照片动起来”,上传任意图片并输入提示词,选择“1.5 Pro”模型,即可即时体验该功能。
据字节跳动Seed官网介绍,Seedance 1.5 Pro是其自主研发的新一代音视频联合生成模型,依托原生音视频融合架构与深度后训练优化,在多模态指令理解与执行方面表现突出。
该模型实现了高精度音画同步,视听一致性达行业领先水平;同时原生支持普通话、多种外语及地方方言口音,能精准还原不同语种特有的语音韵律与情感张力。
在影像表达层面,Seedance 1.5 Pro具备电影级运镜调度能力——可自主完成推拉摇移、希区柯克变焦等复杂镜头语言,实现专业级画面衔接与影调控制,显著增强视频动态表现力。
语义理解与叙事协同能力亦同步升级,模型能深入解析文本背后的叙事逻辑与语境关系,提升整段音视频内容的情绪连贯性与节奏协调性,为影视短剧、广告创意、戏曲数字化等专业场景提供坚实支撑。
早在2025年6月,Seedance 1.0 Pro已正式发布,支持文图双模输入,可生成多镜头无缝切换的高质量视频,在主体稳定性与画面自然度上获得广泛认可。
与此同时,即梦AI也已同步上线Seedance 1.5 Pro,全面支持音画同生。其网页端官宣升级为一站式“AI片场”,涵盖模型能力、交互界面与创作流程三大维度,致力于打通从灵感萌芽到成片输出的全链路。本次更新核心亮点为“视频 3.5 Pro”——基于Seedance 1.5 Pro打造,在即梦AI全球首发。该模型支持音视频同步生成,人物口型、乐器演奏、环境音效等元素无需后期合成,极大增强沉浸感与真实感;在复杂运镜指令、动作幅度控制、光影氛围渲染等方面响应精准,并对中文发音口型、面部微表情乃至方言语音生成提供更强适配能力。
此外,即梦AI网页版还将迎来全新UI设计,升级画布操作逻辑、Agent智能体交互等功能,进一步降低专业创作门槛。
字节跳动表示,此次全面升级标志着即梦AI正加速构建直观、高效、一体化的AI创作基础设施,将原本分散的AI能力整合为可感知、可操作、可复用的“AI片场”,助力每一位创作者将天马行空的构想,高效转化为富有感染力的视听作品。
豆包视频生成模型Seedance 1.5 Pro今日正式上线
据悉,Seedance 1.5 Pro支持音视频联合生成,可完成文本→音视频、图像→音视频等多种生成任务。由此,Seedance不再仅聚焦于视觉呈现,而是真正实现声音与画面的自然共生。字节跳动Seed官方表示,在多项综合评测中,Seedance 1.5 Pro关键性能指标位居“业界前列”。目前,该模型已全面接入即梦AI与豆包平台。(消息发布于2025年12月18日)
7x24小时全球实时财经新闻直播
近日,豆包App视频生成功能完成重大升级,正式支持Seedance 1.5 Pro模型,用户可一键生成音画一致的有声视频。操作路径清晰简洁:进入豆包App对话框,选择“照片动起来”,上传图片并输入提示词,切换至“1.5 Pro”模型,即可启动生成。根据字节跳动Seed官网说明,Seedance 1.5 Pro作为新一代音视频创作模型,凭借原生音视频联合建模与精细化后训练策略,显著提升了对多模态指令的理解与执行精度。(2025年12月19日资料)
豆包上线 Seedance 1.5 Pro,支持端到端有声视频生成
本次上线的Seedance 1.5 Pro,本质是对“文字—画面—声音”创作链路的一次系统性重构:
语义驱动 + 音画同生:彻底告别“先出画再配音”的割裂模式,模型可深度解析文本语义,同步生成内容契合的画面、台词与音效,从根本上规避音画错位;
更拟真的语音表达:所生成的人物语音摆脱机械朗读感,具备自然的语气起伏、停顿节奏与情绪层次,接近真人讲述质感;
电影级叙事语言 + 动态镜头逻辑:画面自动嵌入景别变化与运镜逻辑,复杂肢体动作、人物互动等细节亦能被准确建模与呈现,无需人工添加特效。
普通用户操作极为便捷:打开豆包App对话框,点击“照片动起来”,选定“1.5 Pro”模型,上传一张参考图(如生活照、手绘稿),再输入提示词(例如:“让这只猫用温柔语气讲睡前故事,背景是星空卧室”),系统即刻输出一条完整的有声视频。从图文生成迈向有声视频生成,Seedance 1.5 Pro推动豆包迈入“对话即创作”的新阶段——无论是剧情短片、产品演示,还是静态素材活化,全部可在对话框内一站式完成,真正践行“让画面发声,让创意落地”。
豆包上线 Seedance 1.5 Pro,支持端到端有声视频生成
语义驱动 + 音画同生:彻底告别“先出画再配音”的割裂模式,模型可深度解析文本语义,同步生成内容契合的画面、台词与音效,从根本上规避音画错位;
更拟真的语音表达:所生成的人物语音摆脱机械朗读感,具备自然的语气起伏、停顿节奏与情绪层次,接近真人讲述质感;
电影级叙事语言 + 动态镜头逻辑:画面自动嵌入景别变化与运镜逻辑,复杂肢体动作、人物互动等细节亦能被准确建模与呈现,无需人工添加特效。
普通用户操作极为便捷:打开豆包App对话框,点击“照片动起来”,选定“1.5 Pro”模型,上传一张参考图(如生活照、手绘稿),再输入提示词(例如:“让这只猫用温柔语气讲睡前故事,背景是星空卧室”),系统即刻输出一条完整的有声视频。从图文生成迈向有声视频生成,Seedance 1.5 Pro推动豆包迈入“对话即创作”的新阶段——无论是剧情短片、产品演示,还是静态素材活化,全部可在对话框内一站式完成,真正践行“让画面发声,让创意落地”。(资料日期为2025年12月19日)
字节跳动发布Seedance 1.5 Pro音视频创作模型
Seedance 1.5 Pro支持音视频联合生成,可执行文本到音视频、图像引导音视频等多种生成任务。(发布时间为2025年12月16日)
字节跳动发布Seedance 1.5 Pro模型,实现音画深度融合
Seedance 1.5 Pro支持音视频联合生成,覆盖文本→音视频、图像→音视频等主流任务类型。由此,Seedance视频生成能力正式突破纯视觉边界,迈入音画共生新阶段。
相比Seedance 1.0侧重于夯实基础表现“下限”(如运动生成稳定性),1.5 Pro则聚焦突破视觉冲击力与运动表现力的“上限”,采用更具创新性的技术路径,在视听协同性、画面张力与叙事连贯性三方面取得实质性进展:
• 精准音画同步与多语种/方言适配:显著提升口型-语音-节奏三者拟合精度,原生支持多语种及地域方言,可细腻还原语音韵律与情感张力;
• 电影级运镜控制与动态表现:具备自主镜头调度能力,支持长镜头跟随、变焦运镜等专业手法,配合电影级画面衔接与影调处理,强化视频动态表现力;
• 强化语义理解与叙事协同:通过语义建模升级,更好识别叙事上下文,提升音视频段落整体节奏统一性与情绪连贯性,为专业内容生产提供底层支撑。
字节跳动Seed表示,Seedance 1.5 Pro在综合评测中多项关键能力处于“业界前列”。目前,该模型已全面上线即梦AI与豆包平台。(截至2025年12月16日)
字节跳动Seedance 1.5 Pro音视频创作模型正式发布
Seedance 1.5 Pro支持音视频联合生成,可执行文本到音视频、图像引导音视频等多种生成任务。(2025年12月16日)
豆包生视频功能升级,支持音画同步生成
首先,该模型实现高精度音画同步,视听一致性优异,且兼容多语种与地方方言口音,能精准复现其独特语音韵律与情感表达;
其次,Seedance 1.5 Pro具备电影级运镜控制能力与动态张力,拥有自主镜头调度机制,支持专业级画面衔接与影调风格,大幅提升视频动态表现力;
再次,语义理解与叙事协同能力显著增强,可精准把握叙事语境,提升音视频段落整体协调性,为专业内容创作提供有力保障。
据悉,Seedance 1.5 Pro在视听协同、动态调度与文化语境理解等方面的深度优化,使其在影视制作、短剧开发、广告创意及传统戏曲数字化等多元场景中,均展现出卓越的叙事能力与视听融合水准。(撰于2025年12月19日)
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜















