一门由TileLang社区驱动的编程语言,正在悄然重塑国产GPU的技术生态。
近日,deepseek 宣布其最新版本正式支持国产 gpu 编程语言 tilelang,这一举措在技术圈掀起热议。tilelang 项目由 tilelang 社区自主推进,致力于简化高性能 gpu/cpu 内核的开发流程。它采用类似 python 的简洁语法,使开发者既能专注于提升开发效率,又不失底层性能优化的能力。
生态突围:国产算力的协同进化
作为专为 GPU 内核设计的领域特定语言,TileLang 在性能层面已可与国际主流方案比肩。DeepSeek 官方建议开发者使用该版本进行探索性开发,因其在调试便利性和迭代速度方面表现突出。这对于正全力构建软件生态的国产 GPU 厂商而言,无疑是一次关键契机。
效率飞跃:TileLang 的颠覆性创新
TileLang 最引人注目的优势在于极大提升了 GPU 内核的开发效率。以 FlashAttention 算子为例,原本需要超过 500 行代码的实现,如今仅需约 80 行即可完成,且性能与官方版本持平。代码量的显著缩减不仅降低了开发门槛,还增强了代码的可维护性与可读性。
有开发者评价称,TileLang 是一种极具美感的语言,不到百行代码便实现了比 Flash Attention 2 原版快 30% 的性能。这种兼顾高效开发与极致性能的表现,正是 TileLang 赢得广泛关注的核心所在。
TileLang 提供了三个层级的编程接口,全面覆盖从入门新手到资深专家的不同需求。
真实场景:从概念验证到产品落地
DeepSeek 对 TileLang 的采纳并非空谈,而是基于实际性能测试的结果。具体数据来源于 TileLang 团队以 DeepSeek 发布的 FlashMLA 内核为基准所开展的实验:在英伟达 H100 上运行 MLA 解码任务时,由 TileLang 编写的内核性能与 FlashMLA 相当。这一结果充分证明了 TileLang 具备与国际顶尖技术抗衡的实力。同时,DeepSeek v3.2 版本也证实了 TileLang 可用于真实模型训练。这意味着 TileLang 已经迈出了从实验室走向工业级应用的关键一步。
在线体验:零门槛交互式上手
为了让广大开发者快速体验 TileLang,开源中国联合沐曦公司在模力方舟平台推出了基于沐曦 C 系列芯片的预配置 TileLang 在线运行环境。开发者无需自行部署硬件,即可直接在云端开展算子开发与优化实践。
您可通过模力方舟算力市场租用沐曦 GPU 资源,并选择 TileLang 镜像:

容器启动后,执行以下命令即可快速验证 TileLang 运行效果:
cd /root/mcTileLang/
如下图所示:

国庆期间更有机会领取 TileLang 专属算力券:
1. 扫描二维码参与【双节体验券】活动;

2. 领取您的 TileLang 专属算力券并兑换容器资源;
3. 立即体验 TileLang,感受高效编程的魅力。
目前,沐曦 C 系列显卡对 TileLang 的支持项目已开源至 https://www.php.cn/link/9cb88dd759fcae2f3cb5907b9280bcaa
立即前往模力方舟算力市场,开启您的 TileLang 探索之旅:https://www.php.cn/link/b8d1200c2569eb9ce9c29e1698dbc84e
源码地址:点击下载
以上就是全网首个国芯 TileLang 在线体验环境,就在模力方舟!的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号