文章专题 AI工具学习下载问答源码最近更新

PHP

会员中心讲师中心微信公众号

首页 > 科技周边 > IT业界 > 正文

阿里云宣布自研 EMO 模型上线通义 App，用照片 + 音频生成唱歌视频

王林

发布： 2024-04-26 08:00:38

转载

1124人浏览过

“本站4月25日消息，emo（emote portrait alive）是一个由阿里巴巴集团智能计算研究院开发的框架，一个音频驱动的ai肖像视频生成系统，能够通过输入单一的参考图像和语音音频，生成具有表现力的面部表情和各种头部姿势的视频。”

阿里云今日宣布，通过实验室研发的 AI 模型 —— EMO 正式上线通用 App，并开放给所有用户免费使用。借助这一功能，用户可以在歌曲、热梗、表情包中任选一款模板，然后通过上传一张肖像照片就能让 EMO 合成演唱视频。

阿里云宣布自研 EMO 模型上线通义 App，用照片 + 音频生成唱歌视频

根据介绍，通义 App 首批上线了80多个 EMO 模板，包括热门歌曲《上春山》《野狼 Disco》等，还有网络热梗“钵钵鸡”“回手掏”等，但目前暂未提供自定义音频。

本站附 EMO 官网入口：

官方项目主页：https://humanaigc.github.io/emote-portrait-alive/
arXiv 研究论文：https://arxiv.org/abs/2402.17485
GitHub：https://github.com/HumanAIGC/EMO（模型和源码待开源）

阿里云宣布自研 EMO 模型上线通义 App，用照片 + 音频生成唱歌视频

EMO 的主要特点

生成EMO音频的视频：EMO能够根据输入的音频（如对话或歌曲）直接生成视频，无需依赖于预先录制的视频片段或3D面部模型。
高表现力和逼真度：EMO 生成的视频具有高度的表现力，能够捕捉并再现人类面部表情的细微差别，包括微妙的微表情，以及与音频节奏相匹配的头部运动。
无缝帧过渡：EMO 确保视频帧之间的过渡自然流畅，避免了面部扭曲或帧间抖动的问题，从而提高了视频的整体质量。
身份保持：通过 FrameEncoding 模块，EMO 能够在视频生成过程中保持角色身份的一致性，确保角色的外观与输入的参考图像保持一致。
稳定的控制机制：EMO 采用了速度控制器和面部区域控制器等稳定控制机制，以增强视频生成过程中的稳定性，避免视频崩溃等问题。
灵活的视频时长：EMO 可以根据输入音频的长度生成任意时长的视频，为用户提供了灵活的创作空间。
跨语言和跨风格：EMO 的训练数据集涵盖了多种语言和风格，包括中文和英文，以及现实主义、动漫和 3D 风格，这使得 EMO 能够适应不同的文化和艺术风格。

以上就是阿里云宣布自研 EMO 模型上线通义 App，用照片 + 音频生成唱歌视频的详细内容，更多请关注php中文网其它相关文章！

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

相关标签：

git github https

来源：IT之家网

上一篇：仰望旗舰车型U7线下首秀搭载革命性技术云辇-Z 下一篇：雷军现身北京车展比亚迪展台：称对方是小米重要伙伴，大方程豹一定是爆款

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

数据库视图迁移难题如何解决？staudenmeir/laravel-migration-views来助力

2025-06-11 16:38:06
如何使用ryanwinchester/netsuite-php解决NetSuiteAPI集成难题

2025-06-11 15:40:15
使用AlibabaCloudClientforPHP轻松搞定云服务集成问题

2025-06-11 15:38:02
告别手写SQL：ClickHouseBuilder如何简化PHP查询构建

2025-06-11 15:00:19
Mac玩‎《天天农场》攻略：苹果电脑畅玩iOS手游详细教程

2025-06-11 11:30:53
使用riskio/oauth2-auth0如何解决Auth0授权问题

2025-06-11 10:07:17
解决低版本PHP缺少新特性：使用SymfonyPolyfill实现兼容

2025-06-10 18:28:02
ISO语言代码转换难题如何解决？matriphe/iso-639助你轻松搞定！

2025-06-10 16:26:18
Laravel如何解决Oracle数据库连接问题？yajra/laravel-oci8助你轻松搞定

2025-06-10 15:34:20
如何优雅地解决文件访问难题？GaufretteExtras让你的应用更上一层楼

2025-06-10 14:32:23

最新问题

2025天猫618更简单：官方立减15%起，最高立减50%，一件也直减官方优惠力度加大，2025年天猫618推出更简单直接的促销方式。官方立减从15%起步，最高可达50%，单件商品也可享受直减优惠。据记者了解，今年的天猫618活动时间及规则已正式发布，并开始接受报名。与往年不同，今年的天猫618活动更加简洁，仅设“官方立减”这一玩法，基础优惠为85折，最高可立减50%，让消费者更容易获得实惠。此外，今年天猫618提前开启，第一波抢先购预售将于5月13日晚8点开始，尾款支付及现货抢购时间为5月16日晚8点至5月26日晚12点。临近618，淘宝天猫加大了对商家的支持力

2025-05-23 20:18:01

217

这会是以后的电子女友吗？日本新仿生人「小诺」发表松延动力在推出初代仿生人HOBBS后，最近正式推出了新一代仿生人产品"小诺"。这款新产品以女性形象为设计核心，并强调多模态具身交互功能。"小诺"配备了32自由度设计，能够展现出高度逼真的脸部表情变化，从而提升人机互动的自然感和亲和力。支持同步表情和个性化设置从官方发布的展示片段中可以看到，"小诺"能够精确模仿人类的表情动作，包括闭眼、张口、歪头等，表情细腻自然，具有极高的拟真度。此外，"小诺"还支持个性化人设定制，结合开放式底层界面，用户可以根据实际应用场景调整妆容及互动功能。松延动力专注于人形

2025-05-23 20:00:12

983

五大核心科技，傲风G7重新定义“专业电竞椅”标准！今年电竞圈最炙手可热的椅子无疑是傲风G7。5月，演员彭昱畅在直播中全程使用傲风G7；LPL也正式宣布2025-2026年英雄联盟职业赛事官方指定电竞椅正是这款产品。是什么让这款电竞椅能够同时赢得明星、职业选手和资深玩家的青睐？今天我们将深入剖析这款现象级产品，从配置、体验到使用场景，全面揭示傲风G7走红的奥秘。场景还原：从直播间到训练室，傲风G7凭借“坐感”征服全场除了在彭昱畅的直播中亲自体验傲风G7外，多位影视和综艺明星也在日常生活中选择这款椅子作为工作和休闲的伙伴，这进一步证明了傲风G7口碑

2025-05-23 19:56:11

833

办公软件已基本解决！博主这样评价华为首款鸿蒙PC 在3月举行的华为Pura先锋盛典及鸿蒙智行新品发布会上，华为常务董事、终端BG董事长余承东正式宣布，搭载鸿蒙系统的华为鸿蒙电脑将于今年5月发布。博主定焦数码透露，华为首款鸿蒙PC已经基本解决了办公软件的兼容问题，但生态系统仍需完善，可能需要通过镜像或虚拟器来解决，参考手机上的解决方案。他还提到，已经上架的鸿蒙NEXT生态应用理论上都能在鸿蒙PC上运行，只需一次认证就能实现多端部署。以华为音乐为例，其状态栏歌词使用的是PC的API接口。据爆料，华为鸿蒙PC版的设计风格与苹果macOS相似，状态栏置

2025-05-23 19:48:34

296

联想推出2025年ThinkPad T14p新品：Ultra 5/9处理器在今天的发布会上，联想推出了新一代的ThinkPadT14p2025系列产品。ThinkPadT14p2025AI元启版提供了酷睿Ultra5和Ultra9的选择，PPT展示为Arc130T集成显卡，首发价格分别为7999元和9499元。ThinkPadT14p2025AI高频版则搭载了Ultra9285H处理器，并配备了3K120Hz500尼特亮度的屏幕，采用Arc140T集成显卡，内存从32GB提升至64GB，首发价格也相应提高至10499元。与Thin

2025-05-23 19:42:11

456

iPhone 16 Pro卖断货！博主：128G没必要简直浪费国补今日，话题#国补版iPhone16Pro被抢购一空#迅速登上微博热搜榜，引发了热烈的讨论。近期，某些渠道通过降低价格的方式，使iPhone16Pro的128GB版本首次享受到了国家补贴。结合降价和补贴，该款手机在京东自营旗舰店以5499元的价格迅速售罄。对此，科技博主“科技Daily”表达了不同的观点：“128GB的版本真的有必要吗？我觉得这种存储容量不足的机型就是在浪费国家补贴。明明有许多性价比不错的国产旗舰手机可以选择，为什么非要买这种入门版的iPhone16Pro呢？”与此同时，部分网友认

2025-05-23 19:40:25

554

小米电视新品杀疯了！50寸只卖1499元还买显示器干嘛近期，小米发布了REDMIA系列电视的节能版，推出了50英寸、55英寸、65英寸、70英寸和75英寸共五种尺寸，采用直下式背光技术，起价为1499元。据了解，小米REDMIA系列电视节能版采用了DLED面板，搭载直下式背光技术，具备3940x2160的分辨率，最高可达144Hz的刷新率，亮度在200-300尼特之间。在色彩表现上，该电视支持10bit色深，覆盖94%的DCI-P3色域，色差ΔE约为3。官方表示，每台电视在出厂前都经过色彩校准，并支持低频闪模式。性能方面，小米REDMIA系列电视节

2025-05-23 19:22:13

1001

更缤纷更Q弹~谷歌为安卓系统推新UI介面比ios都好！ Google即将在5月20日举办年度GoogleI/O大会，提前通过备受瞩目的Android系统进行预热，发布了全新的Material3ExpressiveUI设计语言。该设计语言旨在为手机、平板、手表等设备提供更加统一的视觉风格，采用更加丰富的色彩搭配，并在动画与交互方面提供更细腻的反馈。Material3Expressive延续了原有的高度自定义、自由色彩搭配和扁平贴纸风格，但对许多细节进行了强化。正如其名称所示，新设计语言通过色彩与形状的变化，创造出更具表现力的操作互动体验。新UI在动画

2025-05-23 19:22:01

544

小米汽车智驾更名辅助驾驶行业监管使得命名规范化近期，小米汽车已将SU7车型定购页面的“智驾”一词全面替换为“辅助驾驶”，其中“小米智驾Pro”更名为“小米辅助驾驶Pro”，“小米智驾Max”调整为“小米端到端辅助驾驶”。此次更名并非孤立现象——多家媒体报道显示，特斯拉、比亚迪等车企近期也同步推进命名规范化，FSD系统更名为“智能辅助驾驶”，比亚迪的“天神之眼”系统改称为“驾驶辅助系统”。据行业人士分析，此次更名潮的直接推动因素，是工信部于4月16日智能网联汽车准入管理会议上提出的“禁止夸大宣传”要求。工信部会议明确要求车企“不得使用模糊表述

2025-05-23 19:20:01

158

Omdia预测明年Tandem OLED将重塑平板/笔电显示市场 Omdia发布的最新显示行业研究报告显示，TandemRGB技术在OLED平板和笔记本面板市场的渗透率已从接近零迅速增长至2024年的30%以上。报告指出，Tandem面板出货量的激增主要是因为苹果推出了基于OLED技术的新款iPadPro。这些首批OLED平板和笔记本产品主要瞄准高端移动PC市场，采用Tandem技术显著提升了显示质量，与竞争对手及苹果自家的旧款产品形成明显差异。Omdia的研究进一步预测，随着苹果预计在2026年推出首款OLED版Ma

2025-05-23 19:18:35

496

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

ThinkPHP5快速开发企业站点[全程实录]

399485次学习
收藏
PHP Workerman 基础与实战：即时通讯聊天系统（ThinkPHP6）

51101次学习
收藏
Thinkphp3.2.3个人博客开发

212645次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

PHP中文网抖音号: 发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部