登录  /  注册
博主信息
博文 352
粉丝 0
评论 0
访问量 59283
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
AI大模型入门 (一):什么是大模型?
霍格沃兹测开学社
原创
61人浏览过

一、大模型定义

狭义定义

特指ChatGPT等大语言模型(LLM),通过千亿级参数训练,具备文本生成、逻辑推理等通用能力。

广义定义

涵盖CV/语音等领域的通用模型范式,演进路径:专用小模型 → 预训练+微调 → 大模型+人类对齐

核心价值

传统AI需为每个任务单独训练模型(如翻译模型、摘要模型),而大模型如同「瑞士军刀」,单模型应对多任务。

二、AI技术分层架构

关键差异对比:

技术层级 数据需求 特征提取 典型应用
机器学习 标注数据 人工设计 垃圾邮件分类
深度学习 部分标注 半自动提取 人脸识别
大模型 无标注海量文本 完全自主提取 多轮对话系统

三、语言模型的五次进化

  1. 统计语言模型(1950s)

基于词频预测,如同查字典写作文

  1. 神经语言模型(2013)

RNN/LSTM网络,实现上下文记忆

  1. 预训练模型(2018)

BERT/GPT-1开启「预训练+微调」范式

  1. 大模型萌芽(2020)

GPT-3展现零样本学习能力

  1. 人类对齐时代(2022)

ChatGPT通过RLHF技术理解人类意图

技术拐点:2017年Transformer架构问世,突破长文本处理瓶颈。

四、核心概念

生成式AI vs 决策式AI

AIGC三大特征:

  1. 内容原创性(非简单拼接)
  2. 多模态输出(图文/音视频)
  3. 可控生成(通过提示词引导)

五、技术生态

中国大模型「三梯队」格局:

通用底座

  • 百度文心一言
  • 阿里通义千问
  • 深度求索DeepSeek
  • 智谱AI(ChatGLM系列)

垂直领域

  • 医疗:腾讯觅影、医渡云
  • 法律:幂律智能、华宇元典
  • 金融:度小满轩 辕、恒生LightGPT

大模型不是替代人类的「对手」,而是放大能力的「杠杆」

本博文版权归博主所有,转载请注明地址!如有侵权、违法,请联系admin@php.cn举报处理!
全部评论 文明上网理性发言,请遵守新闻评论服务协议
0条评论
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

  • 登录PHP中文网,和优秀的人一起学习!
    全站2000+教程免费学