重磅！TeleAI 完成首个全国产化万卡万参大模型训练

心靈之曲

发布时间：2024-09-29 21:58:57

897人浏览过

来源于机器之心

转载

近日，中国电信人工智能研究院（teleai）成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型（万卡万参），并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 telechat2-115b。这是由中国电信集团 cto、首席科学家、中国电信人工智能研究院（teleai）院长李学龙教授带领团队完成的又一项里程碑式的重要科研成果，标志着国产大模型训练真正实现全国产化替代，正式进入全国产自主创新、安全可控的新阶段。telechat2-115b 基于中国电信自研的天翼云“息壤一体化智算服务平台”和人工智能公司“星海 ai 平台”训练完成，在保证训练精度的前提下利用多种优化手段提升模型训练效率和稳定性，实现了 gpu 同等算力计算效率的 93% 以上，同时模型有效训练时长占比达到 98% 以上。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

重磅！teleai 完成首个全国产化万卡万参大模型训练

TeleChat-52B在OpenCampass推理榜单排名第一

在今年5月的OpenCampass测试榜单中，TeleChat系列模型的逻辑推理能力名列开源大模型榜单第一。

TeleChat2-115B在C-Eval评测中排名第一

医真AI+开放平台

医真AI+ 医学AI开放平台

下载

作为新一代版本，TeleChat2-115B在9月最新公布的C-Eval评测Open Access模型综合榜单中，以86.9分的成绩排名第一。其通用能力较TeleChat系列模型提升近30%，特别是在工具使用、逻辑推理、数学计算、代码生成和长文写作等方面能力均有大幅提升。

重磅！TeleAI 完成首个全国产化万卡万参大模型训练

TeleChat2-115B在C-Eval Open Access模型综合榜单中排名第一
TeleChat2在模型训练与数据构建方面的研究经验
针对超大参数模型训练，TeleAI采用大量小模型进行Scaling，验证不同模型结构的有效性。同时，基于小模型实验结果反馈，采用回归预测模型，得到较优数据配比。
上述策略大幅提升了大参数模型最优方案的搜寻效率。此外，TeleAI通过实验验证探索了退火最佳数据量、最佳配比和学习率变化方式，进一步提升了模型训练效果。
在Post-Training（后训练）方面，TeleAI针对数学、代码和逻辑推理等内容合成了大量问答数据，用于SFT（监督式微调）第一阶段模型训练。其次，采用迭代式更新策略，使用模型对Prompt（提示词）数据进行指令复杂性提升与多样性扩充，通过模型合成和人工标注提升答案质量，利用拒绝采样获取优质SFT数据及RM（奖励模型）代表性数据，用于SFT训练和DPO（偏好对齐）训练，以及模型效果迭代。
TeleAI自研语义大模型获多项权威赛事第一名
连获中国计算语言学大会（CCL2024）挑战赛两项冠军：TeleAI在CCL2024大会获得中文空间语义理解评测和古文历史事件类型抽取评测两项第一名。在古文历史事件类型抽取评测任务挑战赛中，在所有子任务均取得第一名的情况下，获得了综合排名第一。
NLPCC2024中文议论文挖掘（Shared Task5）挑战赛冠军：TeleAI语义团队优化了大模型的上下文学习策略，通过Prompt设计、多模型投票机制等手段，提高了模型准确率和鲁棒性，最终排名第一。
开源共享，引领创新
TeleChat2-115B的开源标志着大模型国产化迈进了新征程。TeleAI积极通过开源推动大模型技术的进步，引领技术创新向产业落地快速跃迁。
开源地址：
GitHub：https://github.com/Tele-AI/TeleChat2Gitee：https://gitee.com/Tele-AI/tele-chat2Modescope：https://modelscope.cn/models/TeleAI/TeleChat2-115BModelers：https://modelers.cn/models/TeleAI/TeleChat2-115B

奇瑞风云T9L明日开启盲订超级AI智能体将同步亮相

Firefly怎样保版权安全插画_Firefly版权避险法【提醒】

一辆小鹏P7遭火车撞击后车主幸存何小鹏发文回应

2025年燃油车累计销量排行出炉 SUV车型国产前十占四

小米SU7领跑2025年国内中大型汽车市场超越奥迪A6L

相关专题

人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容，供大家免费下载体验。

411

2023.08.17

人工智能的基本概念是什么

人工智能的英文缩写为AI，是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学；该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

301

2024.01.09

人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

628

2024.09.10

Python 人工智能

本专题聚焦 Python 在人工智能与机器学习领域的核心应用，系统讲解数据预处理、特征工程、监督与无监督学习、模型训练与评估、超参数调优等关键知识。通过实战案例（如房价预测、图像分类、文本情感分析），帮助学习者全面掌握 Python 机器学习模型的构建与实战能力。

2025.10.21

http与https有哪些区别

http与https的区别：1、协议安全性；2、连接方式；3、证书管理；4、连接状态；5、端口号；6、资源消耗；7、兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1979

2024.08.16

vb中怎么连接access数据库

vb中连接access数据库的步骤包括引用必要的命名空间、创建连接字符串、创建连接对象、打开连接、执行SQL语句和关闭连接。本专题为大家提供连接access数据库相关的文章、下载、课程内容，供大家免费下载体验。

323

2023.10.09

vb连接access数据库的方法

vb连接access数据库方法：1、使用ADO连接，首先导入System.Data.OleDb模块，然后定义一个连接字符串，接着创建一个OleDbConnection对象并使用Open() 方法打开连接；2、使用DAO连接，首先导入 Microsoft.Jet.OLEDB模块，然后定义一个连接字符串，接着创建一个JetConnection对象并使用Open()方法打开连接即可。

395

2023.10.16