讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

全球首个“纯 AMD”训练 MoE 大模型 ZAYA1 发布

花韻仙語

发布时间：2025-11-25 18:46:15

|

928人浏览过

|

来源于php中文网

原创

amd联合ibm及ai新锐zyphra推出zaya1——全球首款完全基于amd硬件训练的moe基础模型，完成14t tokens预训练，整体表现媲美qwen3系列，数学与stem推理能力在未进行指令微调的情况下已接近qwen3专业版本。

全球首个“纯 AMD”训练 MoE 大模型 ZAYA1 发布

训练配置

集群架构：IBM Cloud平台部署128节点，每节点搭载8块AMD Instinct MI300X，总计1024张加速卡；采用InfinityFabric互联技术与ROCm软件栈，实现峰值算力750PFLOPs
训练数据：涵盖14万亿tokens，采用课程学习策略，逐步聚焦于数学、代码与复杂推理任务；后续将发布进一步优化的后训练版本

架构亮点

CCA注意力机制：融合卷积操作与压缩嵌入注意力头设计，显存消耗降低32%，长序列处理吞吐提升18%
线性路由MoE结构：细化专家粒度并引入负载均衡正则化，Top-2路由准确率提高2.3个百分点，在70%稀疏度下仍维持高效资源利用

性能表现

FreeTTS

FreeTTS

FreeTTS是一个免费开源的在线文本到语音生成解决方案，可以将文本转换成MP3，

下载

ZAYA1-Base（非指令调优版）在MMLU-Redux、GSM-8K、MATH、ScienceQA等多项评测中与Qwen3-Base相当；在CMATH与OCW-Math任务上表现更优，凸显其在科学与数学领域的强大潜力。Zyphra透露，指令微调及RLHF增强版本计划于2026年第一季度上线，并将开放API接口与模型权重下载。

AMD指出，本次合作成功验证了MI300X搭配ROCm在超大规模MoE模型训练中的稳定性与竞争力，未来将携手更多云服务商推广“全AMD”训练集群方案，目标在2026年实现训练超百亿参数MoE模型时，总体拥有成本（TCO）与NVIDIA方案持平。

源码地址：点击下载

相关文章

小蚂蚁云 XiaoMaYi-Nacos-EleVue 微服务框架 v1.1.0 发布

马斯克：AI 和机器人不可阻挡、中国会搞定芯片

消息称京东成立“变色龙业务部”，第二批自研 AI 玩具筹备中

美国犹他州率先允许人工智能审批处方续药

芯片设计巨头 Arm 重组汽车与机器人业务，成立“物理 AI”部门

相关标签:

云服务 nvidia 栈 ai amd 路由大模型 red qwen 架构 math 接口栈负载均衡

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Visual Studio 采用“年更”模式：每年 11 月发布年度大版本更新下一篇：2.64 亿元，优必选刷新人形机器人订单金额纪录

作者最新文章

Grok 2.0：埃隆·马斯克AI新模型引发伦理与创新大辩论

2026-01-11 10:31

小红书达人佣金多久结算？开通带货达人的要求有哪些？

2026-01-11 10:40

AWS AI图像分析器：使用Bedrock和Terraform构建无服务器应用

2026-01-11 10:41

科技论文海报设计终极指南：抓住眼球，赢得认可

2026-01-11 10:41

趣味动物世界：3D动画揭秘趣味变身和爆裂惊喜

2026-01-11 10:43

有限元分析中的机器学习：提速与优化

2026-01-11 10:50

京粉如何允许读取剪贴板

2026-01-11 10:59

如何在Java中正确实现数组元素删除并避免过早抛出异常

2026-01-11 11:13

《光与影：33号远征队》最终BOSS难度低于开发者预期

2026-01-11 11:13

《抖音商城》足迹记录查看方法

2026-01-11 11:29

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

硬盘接口类型介绍

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

1010

2023.10.19

PHP接口编写教程

PHP接口编写教程

本专题整合了PHP接口编写教程，阅读专题下面的文章了解更多详细内容。

59

2025.10.17

php8.4实现接口限流的教程

php8.4实现接口限流的教程

PHP8.4本身不内置限流功能，需借助Redis（令牌桶）或Swoole（漏桶）实现；文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

359

2025.12.29

堆和栈的区别

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

386

2023.07.18

堆和栈区别

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

568

2023.08.10

c++主流开发框架汇总

c++主流开发框架汇总

本专题整合了c++开发框架推荐，阅读专题下面的文章了解更多详细内容。

50

2026.01.09

c++框架学习教程汇总

c++框架学习教程汇总

本专题整合了c++框架学习教程汇总，阅读专题下面的文章了解更多详细内容。

28

2026.01.09

学python好用的网站推荐

学python好用的网站推荐

本专题整合了python学习教程汇总，阅读专题下面的文章了解更多详细内容。

90

2026.01.09

学python网站汇总

学python网站汇总

本专题整合了学python网站汇总，阅读专题下面的文章了解更多详细内容。

10

2026.01.09

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

Node.js 教程

Node.js 教程

共57课时 | 8.4万人学习

ASP 教程

ASP 教程

共34课时 | 3.4万人学习

Python 教程

Python 教程

共137课时 | 7.2万人学习

最新文章

更多

123 云盘拟推出无限容量 VIP 服务，招募内测志愿者

英伟达黄仁勋痛批“AI 末日论”：对社会毫无益处，让人们不敢投资 AI

为解决「报告太多」而生的AI新创Convogo 靠哪招让OpenAI今年第一个收购它？

iPhone Air 2传将採用三星CoE技术打造更薄、更亮的萤幕

可以「掰开来」的行动电源来了！可拆成2块各5000mAh 卖多少你愿意买单？

DeepSeek再丢震撼弹！新AI号称写程式比ChatGPT与Claude更厉害

赢了才能开电脑，开发者耗时 10 个月自制 UEFI 小游戏合集

Arthas 4.1.5 发布：新增堆内存分析功能，watch/trace 等命令支持 ClassLoader 精确匹配

比尔・盖茨呼吁社会警惕 AI 潜在风险：别让技术落入恶意行为者之手

DRAM 内存严重短缺，惠普正寻求中国供应商替代方案

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部