微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 科技周边 > 人工智能 > 正文

让「GPT-4V」跑在手机上，这家中国大模型公司做到了

星夢妙者

发布： 2025-01-09 11:29:33

原创

941人浏览过

面壁科技发布minicpm-v 2.6：端侧多模态能力超越gpt-4v

面壁科技近日发布了MiniCPM-V 2.6，这款端侧模型在单图、多图和视频理解等多模态核心能力上全面超越了GPT-4V，并在20B参数以下取得了SOTA成绩。 MiniCPM-V 2.6的单图理解能力甚至比肩Gemini 1.5 Pro和GPT-4o mini。

MiniCPM-V 2.6 的优势在于其高效的知识压缩：视觉token数量相比上一代降低30%，比同类模型低75%，从而实现了比GPT-4o高两倍的单token编码像素密度（token density）。这使得模型运行效率更高。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

让「GPT-4V」跑在手机上，这家中国大模型公司做到了

端侧首发功能：实时视频理解与多图联合理解

MiniCPM-V 2.6 首次在端侧实现了实时视频理解，让模型能够实时“观看”真实世界，这对于实现具身智能和提升人机交互自然度至关重要。此外，它还能直接处理视频文件，自动总结重点信息，无需用户手动观看。

该模型还首次将多图联合理解和多图ICL（上下文少样本学习）功能集成到端侧。例如，它可以处理多张小票图片，自动识别金额并计算总和。

让「GPT-4V」跑在手机上，这家中国大模型公司做到了

强大的多模态推理能力

MiniCPM-V 2.6 展现了强大的多模态推理能力，能够理解梗图背后的含义，并进行复杂的逻辑推理。例如，它可以根据多张图片和文字信息，推断出“WFH员工”的真实工作状态。

360 AI助手

360 AI助手

360公司推出的AI聊天机器人聚合平台，集合了国内15家顶尖的AI大模型。

360 AI助手

68

360 AI助手

让「GPT-4V」跑在手机上，这家中国大模型公司做到了

MiniCPM-V 2.6 还支持多图ICL，能够快速适应特定领域和任务，提高输出稳定性。它可以根据给定的示例，学习“答题模板”，并给出符合逻辑的答案。

让「GPT-4V」跑在手机上，这家中国大模型公司做到了

性能指标与技术优势

MiniCPM-V 2.6 以8B参数实现了与GPT-4V相媲美的性能，在多个权威评测平台上取得了领先的成绩，包括OpenCompass、Mantis-Eval和Video-MME。其OCR性能也达到了开源和闭源模型的SOTA水平，并且幻觉率极低（8.2%）。

MiniCPM-V 2.6 的高性能源于其统一高清视觉架构，以及Ultra系列对齐技术，这使得模型能够高效地进行知识压缩和能力迁移。

让「GPT-4V」跑在手机上，这家中国大模型公司做到了

MiniCPM-V 2.6 的发布标志着端侧多模态大模型技术取得了显著进展，为AGI的实现迈出了重要一步。国内其他大模型团队也在积极发展多模态技术，例如上海人工智能实验室、联汇科技和商汤科技等。

以上就是让「GPT-4V」跑在手机上，这家中国大模型公司做到了的详细内容，更多请关注php中文网其它相关文章！

相关标签：

gemini 2025 架构 Token 人工智能 ocr gpt agi

大家都在看：

谷歌Gemini AI助手登陆电视端，预计覆盖超3亿台设备！ Gemini频发自我厌恶评论，Google紧急修复，AI竞赛暗潮涌动谷歌Gemini 击败 ChatGPT登顶 iOS 榜！马斯克的Grok能否逆袭？如何用Gemini规划健身计划_Gemini制定个性化健身方案 GoogleBard现在叫什么_GoogleBard更名为Gemini详情介绍

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：从 Moonshot 崛起看中国大模型：资本其实没有大家想的那么急下一篇：理想汽车：第20万辆理想L6下线

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

怎么快速去除地板上的口香糖_生活小妙招教你用花生酱轻松处理

2025-11-14 10:51:07
苹果邮箱怎么登录qq邮箱苹果邮箱登录qq邮箱的方法介绍

2025-11-14 10:53:14
小红书在线访问页面_小红书网页版快速进入

2025-11-14 10:55:49
OpenAI聊天入口2026 OpenAI互动AI入口直达官网

2025-11-14 11:05:15
PHP如何实现AJAX交互_PHP与AJAX交互的实现方法与代码实例

2025-11-14 11:15:07
Bing官网地址链接 Bing搜索引擎登录教程

2025-11-14 11:15:46
炉石传说标准冲锋德卡组怎么搭配-炉石传说美服600冲锋德卡组代码2025

2025-11-14 11:25:23
php网站怎么部署到yafapi_php网站yafapi高性能接口部署与配置方法教程

2025-11-14 11:30:08
重返未来1999卡戎抽取建议-重返未来卡戎复刻要不要抽

2025-11-14 11:45:08
如何配置php网站用户等级体系_经验值与等级晋升配置方法

2025-11-14 11:49:02

最新问题

百度ai官网最新网址入口_百度ai平台链接直达智能体验百度AI官网最新网址入口是https://ai.baidu.com/，该平台依托文心大模型提供多种AI能力体验与服务接入方式。

2025-11-14 19:55:08

651

前10月汽车厂商零售销量排行榜揭晓：吉利远超一汽大众近日，乘联会发布了2025年1-10月国内汽车厂商零售销量榜单。数据显示，比亚迪汽车以2838110辆的销量稳居榜首，尽管同比微降2.1%，仍占据14.7%的市场份额。吉利汽车表现突出，累计销量达2140721辆，位居第二，同比增长高达56.2%，市场占有率达到11.1%，展现出强劲的增长势头。一汽大众以1250545辆的销量位列第三，但同比下滑3.9%，市场份额为6.5%。长安汽车与奇瑞汽车紧随其后，分别排名第四和第五，销量为1184267辆和1113213辆，同比增幅分别为10.9%和13.

2025-11-14 19:54:11

636

华为AI眼镜如何使用离线地图_华为AI眼镜离线地图下载与导航使用教程答案：使用华为AI眼镜在无网络环境下导航需提前下载离线地图。首先确认设备兼容性，确保眼镜连接HarmonyOS2.0以上系统，智慧生活APP版本不低于12.0.3.315，并更新相关应用；接着在智慧生活APP中进入设备卡片，选择“离线地图管理”，下载目标区域地图包，建议Wi-Fi下操作；下载完成后，通过语音指令启动导航，系统将调用本地数据提供语音指引；注意离线模式无实时路况，需定期更新地图并提前下载多区域地图包以保障连续性，适用于山区、国际旅行等场景，同时关注GPS信号强度以提升定位精度。

2025-11-14 19:51:52

911

天宫AI官方在线平台地址_天宫AI官网主页直达访问链接天宫AI官方在线平台地址是https://search.tiangong.cn/，该平台提供流畅中文对话、多轮交互、内容生成及专业领域知识服务，支持网页端直接访问。

2025-11-14 19:51:05

678

朱雀大模型平台官网腾讯朱雀AI检测工具网页版腾讯朱雀大模型检测平台官网为https://matrix.tencent.com/ai-detect，提供文本与图像AI生成内容检测功能，用户可直接访问网页使用，无需注册，支持中文场景下的高准确率识别，适用于内容审核、学术评估等应用。

2025-11-14 19:50:32

924

官方称“加速性能遭禁”系误读：只是重新定义安全起步 11月14日，针对“乘用车每次上电或启动后应处于百公里加速时间不小于5秒的默认状态”这一规定，官方作出回应。机动车运行安全技术条件意见稿起草工作组相关负责人指出，公众对此条款存在明显误解。该负责人澄清，“默认工作状态”才是重点所在，而非限制车辆本身拥有更快的加速性能。换句话说，汽车是否具备3秒、4秒甚至更短的百公里加速能力，并不受此规定影响；真正被规范的是车辆在通电或点火瞬间的动力输出初始模式。那么，为何将默认加速阈值设定为5秒？该负责人解释称，这一数值是由起草组联合全国汽车标准化技术委员会，结

2025-11-14 19:47:17

552

即梦4.0如何设置画笔工具_即梦4.0画笔类型大小与透明度调节方法切换画笔类型、调节大小与透明度可解决即梦4.0画笔表达不准确问题。首先点击画笔图标选择合适类型，长按预览效果；随后通过右侧滑块或输入数值调整画笔大小；再在参数区拖动滑块设置透明度，推荐50%~80%以获得自然叠色；最后进入编辑页面自定义流量、硬度等参数并保存为新画笔，提升绘制表现力。

2025-11-14 19:43:02

991

Talkie官方网站链接地址 Talkie智能对话功能主页直达入口 Talkie智能对话功能主页直达入口是https://www.talkie.io，该平台采用先进语音识别技术，支持多轮连贯对话，并提供个性化应答与简洁操作界面。

2025-11-14 19:41:33

656

天宫AI能做视频吗_天宫AI视频内容生成与编辑功能天宫AI支持视频生成与剪辑辅助功能。首先确认平台是否提供“视频生成”或“多模态生成”选项，输入详细场景描述可生成短视频；若无直接生成能力，可利用其智能字幕、AI配乐推荐等功能辅助剪辑；还可将AI生成的图像、文案、语音等素材导出，结合Premiere、剪映等第三方软件完成最终视频制作。

2025-11-14 19:39:05

327

讯飞火星AI怎样进行科技创新提案撰写_讯飞火星AI创新项目提案与设想智能生成方法讯飞火星AI可通过结构化输入项目信息，调用预训练模型生成科技创新提案初稿，并支持数据增强与多人协作优化。

2025-11-14 19:34:02

298

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部