近日,“腾讯混元”公众号宣布,混元3d生成模型家族迎来两位新成员——混元3d - omni与混元3d - part,均已正式发布并全面开源。
此举标志着腾讯混元在可控3D生成技术领域迈出了关键一步,显著提升了AI进行3D建模的实用性和精准度,进一步加速了3D生成技术在游戏开发、3D打印、AR/VR等实际生产场景中的应用落地进程。
作为行业领先的创新成果,混元3D - Omni突破了传统仅依赖单张图像输入的限制,构建了一个支持多种模态输入的统一生成体系,实现了对物体几何结构、拓扑关系和空间姿态的精细调控。
该模型基于此前开源的混元3D 2.1版本升级而来,引入了轻量化的统一控制编码器以及渐进式难度感知训练策略,能够同时融合最多四类控制信号,显著提升生成结果的可控性与视觉质量。
骨骼数据(Skeleton)
在单图基础上加入骨骼信息,可精确调整人物模型的姿态,广泛适用于动画制作、虚拟角色设计等场景。
点云数据(Point Cloud)
可注入完整物体点云或由深度图投影得到的部分点云,有效消除单视角图像带来的视觉歧义,增强几何细节还原能力,使生成模型更加真实可靠。
边界框(Bounding Box)
允许用户调节生成资产的长宽高比例,确保输出尺寸符合预期设计要求。
体素(Voxel)
针对物体内部结构进行精细化控制,满足对复杂几何形态的高精度需求。
这些控制方式不仅支持独立使用,还可自由组合,并兼容来自深度相机、LiDAR设备或三维重建系统的输入源。此外,社区开发者也可基于开放代码轻松扩展新的控制类型,例如自定义人物动作姿态等创意功能。
混元3D - Part则聚焦于3D模型的组件化生成与分割,让3D模型的分解与重构变得如同拼装乐高积木般简单高效。
该技术由两大核心模块构成:
整个流程如下:用户先通过混元3D 2.5或3.0模型生成完整的Mesh模型,随后利用P3-SAM提取语义特征与边界框,实现自动且精准的部件分割;接着由X-Part接手,将整体模型分解为多个独立组件,输出结构一致、保真度高的子部件几何体,全过程保持高度可控。
在多个权威基准测试中表现卓越:
Hunyuan3D-Part在分割精度与生成质量上均大幅领先现有方法。目前该模型已集成至混元3D Studio平台,用户可通过腾讯混元3D创作引擎免费调用。
值得关注的是,混元3D - Omni与混元3D - Part均已完全开源,推理代码与模型权重全部公开,支持免费用于学术研究与工业部署,旨在推动可控3D生成领域的生态建设与技术创新。
【混元3D - Omni】
【混元3D - Part】
以上就是腾讯混元3D-Omni与3D-Part发布开源,推动3D生成模型落地应用的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号