我特别喜欢的三个DeepSeek版本

爱谁谁
发布: 2025-07-02 12:50:02
原创
455人浏览过

我特别喜欢的三个deepseek版本图片大家好,我是 ai 学习的老章

最近工作非常繁忙,写一篇简短的文章

分享三个我经常使用的 DeepSeek 模型DeepSeek-R1-0528-Qwen3-8B

这是最新版的 DeepSeek-R1-0528,通过思维链蒸馏提取后对 Qwen3-8B-Base 进行了训练:DeepSeek-R1-0528 蒸馏 Qwen3:8B 大模型,使用双 4090 显卡本地部署,效果非常好

这个模型有几个特点让我非常喜欢:

成本极低,模型文件大小仅 16GB,默认参数下,两张 4090 显卡即可流畅运行性能很强,无论是各种 Bench 测试结果还是个人体验,都能轻松应对参数和模型文件是其四倍大小的 Qwen32-B速度非常快,启动时两张 4090 显卡能达到 90Tonken/s目前 DeepSeek-R1-0528-Qwen3-8B 我主要用来做知识库意图识别、问题改写、问题分类

缺点:无法关闭思考功能,我用 vllm 启动,在 Dify 中即使直接关闭或者在提示词中加 no_think 都没用

DeepSeek-R1-0528R1 的小版本更新,但是提升明显,性能和推理能力都增强了不少:DeepSeek R1 最新版本模型,排名第三

这个模型应该算是可以免费使用的最强大的模型之一了吧

网页版我倒是很少用,主要是调 API 接口,主要用于 Obsidian 上查资料,译,写文章

我特别喜欢的三个DeepSeek版本图片以及在 Cursor 上写代码

我特别喜欢的三个DeepSeek版本图片缺点:响应速度较慢,在 Cursor 上写代码也不支持 Agent 模式

DeepSeek-V3-Fast近期发现的一个小众版本DeepSeek-V3-Fast,它是基于 DeepSeek V3 0324 版本优化后的极速版本

API 申请地址:

https://www.sophnet.com/#?code=IXFCAK

最大的优势就是推理速度,可以说是快如闪电⚡️

我特别喜欢的三个DeepSeek版本图片目前我主要把它用于 Obsidian 做内容总结,还有沉浸式插件中当工具(确实非常快)

我特别喜欢的三个DeepSeek版本图片缺点是能力略逊于 R1,表现不太稳定

以上就是我特别喜欢的三个DeepSeek版本的详细内容,更多请关注php中文网其它相关文章!

DeepSeek (深度求索)
DeepSeek (深度求索)

DeepSeek (深度求索)杭州深度求索(DeepSeek)官方推出的AI助手,免费体验与全球领先AI模型的互动交流。它通过学习海量的数据和知识,能够像人类一样理解和处理信息。多项性能指标对齐海外顶尖模型,用更快的速度、更加全面强大的功能答疑解惑,助力高效美好的生活。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号