Scaling Law撞墙?预训练终结?亚马逊云科技为什么还在做基础大模型

花韻仙語
发布: 2024-12-19 08:31:34
原创
447人浏览过

亚马逊云科技在re:invent 2024大会上发布了令人瞩目的nova系列大模型,引发业界热议。此举尤其令人意外,因为亚马逊此前已重金投资anthropic。然而,本文将阐述亚马逊持续投入基础大模型的战略考量,以及其对市场和创业者的深远影响。

亚马逊总裁兼CEO安迪·贾西宣布Nova系列模型
*亚马逊总裁兼CEO安迪·贾西(Andy Jassy)发布了Nova系列模型,包含Micro、Lite、Pro和Premier四个版本,其中后三个为多模态模型。*
尽管亚马逊并非首次发布基础大模型(此前已有Titan系列),但面对“Scaling Law撞墙论”的争议,许多人认为继续投入基础模型训练并不经济。然而,亚马逊云科技显然并未因此止步。从re:Invent大会后的研讨会讨论可见,亚马逊坚信基础大模型潜力巨大,并认为其对自身及AI创业者都具有重要价值。
**“Scaling Law撞墙”并非阻碍,基础大模型仍有巨大潜力**
关于Scaling Law是否撞墙的争论持续不断,直接影响着AI领域的资源分配。然而,目前尚未得出明确结论。亚马逊云科技的Nova系列模型发布,正体现了其对基础大模型前景的乐观态度。亚马逊云科技大中华区产品部总经理陈晓建认为,基础大模型仍处于早期阶段,远未成熟。
Sam Altman和Ilya Sutskever对Scaling Law的不同观点
*OpenAI CEO Sam Altman坚信“没有墙”,而著名研究者Ilya Sutskever则认为“我们所知的预训练将会终结”。*
事实上,亚马逊并非孤例。苹果、微软、谷歌、Meta以及国内的字节跳动、阿里巴巴和腾讯等巨头都在积极布局基础大模型。陈晓建表示,亚马逊内部对发展基础大模型高度一致。
关于Scaling Law撞墙的担忧主要集中在数据方面。有研究预测,以目前的LLM发展速度,到2028年左右,现有数据将被耗尽。Ilya Sutskever也认为数据如同化石燃料,终将枯竭。然而,公共互联网数据并非全部数据。大量未数字化或未公开的数据,如纸质文献、机密数据、物联网数据和行业数据等,依然存在。
论文《Will we run out of data?》
*论文《Will we run out of data? Limits of LLM scaling based on human-generated data》*
此外,人类每天都在产生大量新数据,虽然大部分质量不高或重复,但新技术的广泛应用也会创造高质量数据。量子计算、生物技术等新兴领域都可能成为下一代AI的重要数据来源。因此,即使公共互联网数据耗尽,基础大模型的发展也不会停滞。
陈晓建也强调了数据的重要性:“数据资产才是实现业务差异化的关键。” 此外,现有数据是否被充分利用也值得探讨。随着模型规模扩大和编码技术进步,基础大模型或许能从现有数据中挖掘更多价值。利用AI合成高质量数据也是一个重要的探索方向。
亚马逊云科技开源项目架构
*亚马逊云科技开源的利用Amazon Bedrock生成合成数据集的项目架构*
因此,“Scaling Law撞墙论”并不能动摇亚马逊等科技巨头对基础大模型的投入。亚马逊不仅看到了基础模型的当前价值,更看到了未来突破的可能性。
在re:Invent大会上,亚马逊发布了多款与数据相关的产品,包括Kendra Index、结构化数据检索能力、GraphRAG技术、数据增强功能以及升级版的SageMaker。陈晓建表示,这些工具旨在帮助用户更方便地将私有数据与大模型整合。
下一代Amazon SageMaker概况
*下一代Amazon SageMaker概况,来自亚马逊云科技re:Invent 2024*
亚马逊云科技还在积极探索其他技术方向,例如思维链推理能力和Automated Reasoning checks服务,以减少大模型幻觉并提高准确性。
**利己也利创业者:提供市场选择**
亚马逊投入基础大模型首先是为了自身利益。中小企业缺乏资源自主训练大模型,因此To B的大模型市场需求旺盛。亚马逊作为云服务巨头,自然不会错过这一机遇。
亚马逊云科技在云市场的领先地位
*亚马逊云科技继续维持在云市场的领先地位,来自Statista*
对用户,特别是创业者而言,亚马逊的基础模型提供了强有力的替代选项,降低了进入门槛。Nova Pro和Nova Lite等不同规模的模型满足不同需求。对于预算有限的创业公司来说,这是快速部署和创新的解决方案。
使用Nova Pro执行文档分析示例
*使用Nova Pro执行文档分析示例,来自亚马逊云科技博客*
此外,替代选项也增强了业务安全性和多样性,从而激发创新。亚马逊云科技中国区技术合作伙伴总监李奔也提到了这一点。
亚马逊云科技通过Nova系列为企业用户带来了新的可能性,并推动了市场的良性竞争。从亚马逊自身角度来看,其战略考量还包括:强化云服务生态、数据和技术的长远布局、参与行业标准定义、增强内部服务和产品以及应对竞争压力。
**基础大模型体现了亚马逊的长期主义**
“长期主义”是亚马逊的企业文化。构建基础大模型需要大量资源,亚马逊的持续投入展现了其责任感和前瞻性。Nova系列模型的推出,不仅体现了亚马逊的技术创新,更降低了开发者和企业的进入门槛,为创业公司提供了灵活的替代方案,这正是“长期主义”的体现。
《长期主义》
亚马逊云科技在基础大模型道路上的坚持,不仅能巩固自身市场地位,还能帮助更多企业进入AI应用生态,提升市场活力和创造力。这是亚马逊云科技的重要贡献。

以上就是Scaling Law撞墙?预训练终结?亚马逊云科技为什么还在做基础大模型的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号