“manus单次推理可能需要消耗100万个token,agent兴起所带来的算力需求增长速度将超过算力成本下降的速度。”投资人泽彦向php中文网(公众号:php中文网)表示。
美元基金投资人日昊同样预测,大规模视频生成与Agent调用将引发指数级的算力消耗,带来上千倍的算力需求增长,推动算力市场从当前百亿规模迈向万亿级别。
智能化转型是当前科技变革中最为确定的机会。九章云极DataCanvas公司董事长方磊指出,如今计算模式正经历从移动互联网“带宽式应用”到AI“计算密集型应用”的结构性转变。
在计算需求由“数据传输效率”向“算力处理能力”转移的大背景下,高昂的算力成本和技术门槛成为各行业推进智能化转型的最大障碍。
基于这一现状,AI原生的智能计算云平台将成为平衡效率与成本的最佳解决方案。在九章云极智能计算论坛上,新一代全栈智能计算云平台——九章智算云Alaya NeW Cloud 2.0正式发布。
“AI原生智算云平台不同于以往仅单点支撑AI的方式,它是以AI为核心设计理念、依托公有云构建的平台化人工智能基础设施,通过一体化能力实现AI应用全生命周期性能最大化,兼具灵活性、可扩展性和专用性,并且价格上比通用算力云更具经济性。”Forrester副总裁兼首席分析师戴鲲表示。
如何突破瓶颈、降低门槛并优化成本?九章智算云平台正在加速实现算力普惠。
Serverless新型云架构:端到端性能提升5倍,成本降低60%
随着智能化转型浪潮的到来,全球科技企业掀起从万卡集群到百万卡集群的军备竞赛。超大规模算力资源池解决了“有算力可用”的问题,但当算力达到一定规模,“高效利用”成为释放其价值的关键。
如何突破算力使用效率的瓶颈?新型云架构成为关键。
传统裸金属算力调度存在严重利用率低的问题,例如OpenAI在训练GPT-4时投入了约2.5万张A100 GPU,耗时90至100天,算力利用率仅为32%-36%。赛富投资基金合伙人蒋驰华指出,2024年上半年全球AI基础设施支出同比激增97%至474亿美元,其中72%的AI服务器收入来自云端服务,印证了云服务模式推动算力普及的趋势。
九章智算云采用Serverless技术架构替代传统虚拟化方式,打造统一高效的弹性底层平台,实现算力资源的最大化复用。对于用户而言,云服务避免了裸金属服务器资源利用率低、运维复杂、部署周期长、弹性差及技术门槛高等问题。它推动算力调度从“配置机器”转向“提交任务”,使AI开发者无需关注底层调度,专注于业务逻辑与模型调用。
完成全栈优化的九章智算云支持跨AIDC弹性资源调度,实现秒级响应和无限扩展,通过弹性伸缩自动完成环境配置与任务监控,端到端性能提升达5倍。
除了高效,降低使用门槛同样重要。与头部科技企业不同,数量庞大但技术能力薄弱的企业急需低门槛的智能开发工具。
某大型集团曾投入3000万元研发企业大模型,尽管高薪聘请技术专家,却因落地困难、数据隐私风险和商业模式不清等问题,一年内资金耗尽项目终止。
针对“落地难”问题,九章智算云推出一系列低门槛的智算工具链,覆盖大模型从预训练、精调到适配与应用开发的ModelOps全生命周期,大幅降低模型开发与应用的技术门槛。
通过这些工具链,用户无需掌握复杂的GPU配置或集群管理技术,只需明确数据来源、选择模型基座、设定优化方向,系统即可自动编排计算流程,真正实现对AI算力的“掌控”。
为了彻底降低技术落地门槛,九章云极同步发布了九章强化学习云平台AgentiCTRL,基于混合专家(MoE)架构,首次将强化学习能力深度融入基础设施,显著增强大模型的推理能力,将AI智能体训练与部署门槛压缩至“一行代码”。
相比传统强化学习方案,该平台在性能、成本和规模方面均具优势。其端到端训练效率提升500%,综合成本下降60%,成为全球首个支持万卡级异构算力调度的强化学习基础设施平台。
可用之外,成本可控至关重要。正如方磊所说,十卡至百卡规模的算力需求群体构成了庞大的市场。
九章智算云采用“按度计费”模式替代传统裸金属租赁,将企业总拥有成本(TCO)降低60%,使AI算力成为更多企业可负担的生产要素。
九章智算云通过“技术架构创新 + 工具链下沉 + 经济模型重构”的三维路径,实现从“有算力可用”到“有高效算力可用”的跨越。这种“基础设施即服务”的模式不仅破解了算力效率瓶颈,更让AI技术从头部企业的“专利”转变为各行各业的“通用生产力”,推动智能化转型进入深水区。
「开源开放」是算力规模化应用的核心驱动力
大模型演进、垂直模型落地及Agent规模化应用正推动智算市场的快速增长。《2025年中国人工智能计算力发展评估报告》显示,中国智能算力规模将达到1037.3EFLOPS,同比增长43%。
虽然算力建设持续升温,但产业供需错配问题突出,国内智算中心资源点亮率仅20%。IDC数据显示,在国内百万AI开发者中,有83%因算力成本限制无法开展模型训练。
针对算力利用率低的行业痛点,九章智算云打破传统GPU租用模式,推出“一度算力”按需计费标准,以按量计费方式重构算力消费生态。
九章智算云依托Serverless架构实现GPU资源池化管理,构建“算力即服务”的弹性供给体系,千卡级训练任务与十卡级微调需求共享同一资源池,使得算力使用成本较传统方案降低45%。
除创新计费模式外,生态协作同样是解决供需错配的关键。产业上下游的开放合作有助于加快理解用户需求,从而实现算力向智能成果的高效转化。九章云极将开放生态建设作为长期战略,与业内企业展开深度合作,推动智能化应用在多个领域的规模化落地。
算力布局具有前瞻性,尽管模型、Agent及应用的发展已成共识,但算力基建必须先于应用浪潮部署,导致项目建设与算力消纳之间存在时间上的错配。
为加快解决这一难题,九章云极发起“AI-STAR企业生态联盟”,首期注资1.8亿元,打通产业源头的供需链路。
方磊表示,未来三年,九章云极将在AI高端算力、模型、低门槛工具链、智能体应用、工程化交付等领域,采用“开放服务市场+生态基金投资”模式,构建中国繁荣的AI智算云开放生态。
“AI-STAR企业生态联盟”将根据合作伙伴产品成熟度,提供从技术到商业化所需的云端资源及算力支持,助力企业在AI领域探索创新,实现从场景探索到规模化、商业化的跨越,为各行业客户提供AI算力支持和服务。
截至目前,九章智算云Alaya NeW Cloud平台已兼容大多数国际主流基座大模型,开源社区衍生模型也取得里程碑式进展。正如方磊所言,开源开放是加速AI普及与规模化的核心驱动力。
以上就是百万级Token秒生成,九章智算云如何突破算力性能瓶颈?的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号