
“Vibe Coding”概念提出者Andrej Karpathy近日发布年度复盘长文——《2025 LLM Year in Review》,系统梳理了2025年大模型领域最具突破性的六大技术进展,语言平实、洞察犀利:
1. RLVR(可验证奖励强化学习)
过去一年前,主流大模型训练范式始终围绕三大支柱展开:
1️⃣ Pretraining(预训练):从全网抓取海量文本,训练模型预测下一个词;
2️⃣ SFT(监督微调):靠人工标注高质量问答对,引导模型向“标准答案”靠拢;
3️⃣ RLHF(基于人类反馈的强化学习):让模型生成多个候选输出,再由人打分排序,逐步校准偏好。
而RLVR另辟蹊径:它不依赖主观评价,而是将模型投入具备唯一正确解的高难度数学推理任务中——先推演,再验算,用“对错分明”的结果反向驱动策略进化。这种机制首次让模型在无监督试错中自发构建起链式推理能力。
更关键的是,RLVR已成为今年算力消耗的绝对主力,并悄然解锁了一个全新控制维度:“思考时长调节”。OpenAI的o1是该路径的探路者,而o3则标志着其真正走向成熟与规模化落地。
2. 智能的锯齿曲线
2025年我们终于看清一个事实:大模型并非类人智能体,而是一种高度特化的“应召幽灵”。
人类智能是在漫长演化中为生存而打磨出的通用适应力;但大模型的“聪明”,却是被精心设计出来的——只为更像人类说话、更擅长解题拿分、更能在基准测试里刷出漂亮数字。于是它呈现出一种诡异的“智能波动”:既能攻克IMO压轴题,又会在数清“strawberry”里有几个r时翻车。
这也意味着传统评测体系正快速失效——所有厂商都在针对榜单刷题,甚至把训练数据直接锚定在特定benchmark上。当能力演进变成一场应试竞赛,通往AGI的道路只会越走越窄。
3. Cursor
Cursor真正的意义,远不止于一款成功产品本身。今年,“XX行业的Cursor”已成为创业圈高频标签,这背后折射出一个清晰信号:大模型正加速下沉至垂直应用层。
Cursor验证了一种新商业模式——不做底层模型,而是做“模型封装师”:面向特定职业场景(如前端开发、数据分析),把通用大模型能力打包成开箱即用的生产力套件,就像一位懂技术的产品经理。
未来的生态分工或将如此:基础模型厂商负责培养“通识型毕业生”,而Cursor这类公司,则承担起“岗前实训导师”的角色,把理论派快速转化为实战派。
4. Claude Code
Claude Code是当前最接近理想形态的本地化Agent,它运行于用户设备之上,理论上,你能用键盘鼠标完成的操作,它同样可以接管。
相比之下,OpenAI的路径略显激进:过度聚焦ChatGPT这一统一入口,将Codex、Agent等关键能力全部收编至云端。诚然,“在一个对话框里搞定一切”极具AGI浪漫主义色彩,但现实是——当前模型能力仍处于“上限极高、下限极低”的不稳定区间。此时,端侧可控、响应即时、隐私友好的智能体,反而更具实用价值。
这不是云端 vs 本地的技术路线之争,而是对用户真实工作流的理解差异:代码、密钥、项目上下文、生产环境……这些核心资产,绝大多数仍牢牢驻留在本地。Anthropic选择将Claude Code嵌入简洁优雅的CLI界面,跳脱浏览器依赖,正是抓住了这一本质。真正能干活的大模型,就该是那种默默守候、随叫随到的“田螺姑娘”。
5. Vibe Coding
这个词最初只是我在社交平台上的即兴调侃,没想到迅速引爆全网,此处必须鼓掌?。
Vibe Coding的本质,是让编程能力彻底去专业化——不再需要理解语法、记忆API、调试环境,普通人只需描述需求,即可瞬时获得可用代码。这不只是效率提升,更是权力的再分配:“代码权”第一次真正回归大众。
与以往技术革命不同,本轮红利的最大受益者并非巨头或专家,而是亿万普通用户。软件生产的边际成本趋近于零,正推动我们迈向真正的“软件自由”。
举个例子:我曾为定位一个隐藏Bug,临时用Vibe Coding生成一段诊断脚本,问题解决后,这段代码便完成了使命,随即被删除,如同一张擦完汗就丢掉的纸巾。
这场静默革命,正在重新定义程序员的核心价值与岗位边界。
6. Nano Banana
外界普遍将其视为又一个惊艳的多模态图像生成模型,但在我的视角中,Nano Banana是大模型迈向GUI时代的第一块里程碑,直指人机交互的终极形态。
语言模型天生偏爱文本对话,但人类不是。我们是会本能喊出“TL;DR”的物种——比起逐字阅读冗长回复,我们更习惯用视觉快速捕获信息:看图、扫表、盯动画、点网页。
这恰如当年DOS让位于Windows的历史重演。
未来的大模型,必须走出文本舒适区,主动适配人类的信息消费习惯:用图表替代长段落,用简报代替推理链,用动态可视化呈现逻辑,用可交互网页交付结果。Nano Banana首次实现了“理解—推理—图形化表达”的闭环融合,是2025年最具颠覆性、也最不容忽视的标志性突破。
总而言之,这是浪潮迭起、惊喜与困惑并存的一年。大模型展现出的能力令人惊叹,其暴露的短板也同样刺眼。整个行业,恐怕连10%的潜力都尚未释放。前方道路漫长,系好安全带,准备出发。
来源:https://www.php.cn/link/4b248b100c56121adb90cc61ff6f3cbb
源码地址:点击下载
以上就是2025 年 AI 大模型行业最重要的 6 大技术成果的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号