AI大模型入门（一）：什么是大模型？ - 人工智能 - php中文网博客

讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 博客列表 > AI大模型入门（一）：什么是大模型？

博主信息

博文 530

粉丝 0

评论 0

访问量 122390

专题推荐

更多>

相关推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

AI大模型入门（一）：什么是大模型？

霍格沃兹测开学社

原创

431人浏览过

一、大模型定义

狭义定义

特指ChatGPT等大语言模型（LLM），通过千亿级参数训练，具备文本生成、逻辑推理等通用能力。

广义定义

涵盖CV/语音等领域的通用模型范式，演进路径：专用小模型 → 预训练+微调 → 大模型+人类对齐

核心价值

传统AI需为每个任务单独训练模型（如翻译模型、摘要模型），而大模型如同「瑞士军刀」，单模型应对多任务。

二、AI技术分层架构

关键差异对比：

技术层级	数据需求	特征提取	典型应用
机器学习	标注数据	人工设计	垃圾邮件分类
深度学习	部分标注	半自动提取	人脸识别
大模型	无标注海量文本	完全自主提取	多轮对话系统

三、语言模型的五次进化

统计语言模型（1950s）

基于词频预测，如同查字典写作文

神经语言模型（2013）

RNN/LSTM网络，实现上下文记忆

预训练模型（2018）

BERT/GPT-1开启「预训练+微调」范式

大模型萌芽（2020）

GPT-3展现零样本学习能力

人类对齐时代（2022）

ChatGPT通过RLHF技术理解人类意图

技术拐点：2017年Transformer架构问世，突破长文本处理瓶颈。

四、核心概念

生成式AI vs 决策式AI

AIGC三大特征：

内容原创性（非简单拼接）
多模态输出（图文/音视频）
可控生成（通过提示词引导）

五、技术生态

中国大模型「三梯队」格局：

通用底座

百度文心一言
阿里通义千问
深度求索DeepSeek
智谱AI（ChatGLM系列）

垂直领域

医疗：腾讯觅影、医渡云
法律：幂律智能、华宇元典
金融：度小满轩辕、恒生LightGPT

大模型不是替代人类的「对手」，而是放大能力的「杠杆」

本博文版权归博主所有，转载请注明地址！如有侵权、违法，请联系admin@php.cn举报处理！

全部评论文明上网理性发言，请遵守新闻评论服务协议

0条评论

作者最新博文

名企测试管理大咖解析沟通管理，多维度经验分享

2024-11-21 15:15:02

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部

登录PHP中文网，和优秀的人一起学习！

全站2000+教程免费学