通义万相团队正式推出wan2.5-preview版本,首次实现原生音画同步能力,全面升级视频生成、图像生成与图像编辑三大核心功能,助力广告、电商、影视等领域实现高质量商业内容创作。

体验地址:https://www.php.cn/link/859bf1416b8b8761c5d588dee78dc65f

Wan2.5-Preview核心亮点如下:
? 视频生成 —— 带“配音”的10秒微型电影引擎
- 原生音画同步: 自动生成人声(支持多人对话)、ASMR、环境音效及背景音乐,涵盖中文、英文、小语种及方言,声音与画面高度匹配;
- 10秒长视频支持: 时长翻倍,最高输出1080P 24fps视频,动态连贯性与结构稳定性显著增强,叙事表现更完整;
- 指令理解升级: 支持复杂连续动作描述、镜头运动控制和结构化提示词输入,准确还原用户创意构想;
- 图生视频ID保持优化: 在人物形象、商品外观等方面实现更高一致性,适用于品牌广告与虚拟角色制作;
- 通用音频驱动视频: 可上传自定义音频作为引导,结合提示词或首帧图像生成匹配的视频内容,轻松实现“用自己的声音讲述AI生成的故事”。
?️ 文生图 —— 懂“排版”的智能设计助手
- 视觉质感跃升: 光影真实感更强,细节刻画更精细,可精准还原多种艺术风格与设计美学;
- 稳定文字渲染: 支持中英文、小语种、艺术字体、长段落文本及复杂布局的文字生成,海报、LOGO一键完成;
- 图表直接输出: 能生成科学图表、流程图、数据可视化图、系统架构图以及带文字内容的表格等结构化图文信息;
- 指令理解深化: 对复杂指令具备逻辑推理能力,可高精度还原现实IP形象与具体场景细节。
✂️ 图像编辑 —— 工业级“改字不走形”修图工具
- 自然语言编辑: 支持换背景、调色、添加元素、风格迁移等多种操作,通过文字指令即可完成专业级编辑,无需PS经验;
- 视觉一致性保障: 支持单图或多图参考进行编辑,确保人脸、商品、整体风格等关键元素在修改后仍保持原有特征,“换场景不变样”。
源码下载:点击获取









