nanochat— Karpathy开源的低成本自建ChatGPT全栈项目-人工智能-PHP中文网

nanochat— Karpathy开源的低成本自建ChatGPT全栈项目

聖光之護

发布： 2025-10-15 13:37:14

原创

735人浏览过

nanochat是什么

nanochat是由ai领域知名专家andrej karpathy推出的开源项目，旨在以极低的成本和简洁的流程训练出具备类chatgpt对话能力的小型语言模型。该项目仅需约100美元（使用8张h100 gpu训练4小时），即可完成一个能进行基础对话、创作故事或诗歌、回答常见问题的小模型训练。若将预算提升至1000美元（训练时长约41.6小时），模型能力显著增强，可处理简单的数学题、编写代码并参与多项选择测试。整个项目涵盖从数据准备、预训练、中期训练、监督微调（sft）、强化学习（rl）到推理部署的全流程，代码总量约8000行，结构清晰、易于理解，非常适合用于学习与实践。

乐尚团购

乐尚团购系统，是一项基于PHP+MYSQL为核心开发的一套免费 + 开源专业团购系统。软件具执行效率高、模板自由切换、后台管理功能方便等诸多优秀特点。本软件是基于Web应用的B/S架构的团购网站建设解决方案的建站系统。它可以让用户高效、快速、低成本的构建个性化、专业化、强大功能的团购网站。从技术层面来看，本程序采用目前软件开发IT业界较为流行的PHP和MYSQL数据库开发技术，基于面向对象的编程，

查看详情

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
nanochat的主要功能

分词器训练：采用Rust语言实现分词器训练，负责将原始文本转换为模型可处理的符号序列。
预训练阶段：在FineWeb数据集上对基于Transformer架构的语言模型进行大规模预训练，并通过CORE指标评估其基础性能。
中期训练：利用SmolTalk用户-助手对话数据集、选择题任务数据集及工具调用数据集进行中期训练，使模型逐步适应对话交互场景。
监督微调（SFT）：在ARC-E/C、MMLU等知识类选择题数据集，以及GSM8K（数学）、HumanEval（代码）等任务上进行监督式微调，提升特定任务表现力。
强化学习微调（RL）：引入“GRPO”算法，在GSM8K数据集上实施强化学习优化，进一步提升模型输出质量。
推理与部署：构建高效推理系统，支持KV缓存机制、快速预填充与解码流程，并集成轻量级沙箱环境中的Python解释器以支持工具调用；用户可通过CLI命令行或类似ChatGPT的WebUI界面与模型互动。
成绩单生成：自动生成一份Markdown格式的综合报告卡，全面总结训练与推理过程，结果以“游戏化”形式呈现，便于评估与展示。