0

0

AI首次超越人类!腾讯、阿里的NLP模型,比你更懂中文

WBOY

WBOY

发布时间:2023-04-09 08:31:02

|

2246人浏览过

|

来源于51CTO.COM

转载

​在AI科技圈,「中文语言理解」一直是一个难以攻克的问题。因为在全世界所有的语言中——中文的难度系数是最高的。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

举例来讲,就下面这句简简单单20个字的句子,都绝对能让不少外国人深感崩溃。

下雨天,我骑车差点摔倒,好在一把把把把住了。​

图片

然而,在最新的中文语言理解领域权威榜单CLUE中,腾讯和阿里的AI模型却先后超越了人类的成绩!实在让人不禁感慨:这年头,还有什么是AI做不了的吗?

图片

最新一期CLUE最新排名

CLUE的全称是Chinese Language Understanding Evaluation,即「中文语言理解测评基准」。

就像英语的GLUE和SuperGLUE,CLUE是一组评估机器能够像人类一样理解和响应中文文本的任务,上线于3年前,也是第一个大规模的中文语言评估基准,旨在推动NLP技术的不断进步和突破。

在CLUE的官网上,有语料库、排行榜、预训练模型和代表性的数据集等资料可供选择。包括文本相似度、分类、上下文推理、阅读理解在内的17项测评任务,其介绍在官网上都有很详尽的展示。

图片

今年11月22日,阿里巴巴的AI模型「AliceMind」获得了86.685的高分,稳居总排行榜首位的同时,也一举打破了由人类(HUMAN)在该系列测试中保持的纪录。

值得一提的是,这也是人工智能在该系列测试中——首次超越人类。

巧合的是,短短4天后,腾讯的「混元AI大模型」在测试中以86.918的高分再次刷新了纪录——这甚至比AliceMind的成绩还要高0.233分。

中国两大互联网巨头你方唱罢我登场,说明人工智能在不同领域和方面都有超越人类的能力。

上周五,阿里云计算部门也在一篇文章中表示,「这标志着中国对AI模型的理解,达到了一个新的水平」。

改图鸭AI图片生成
改图鸭AI图片生成

改图鸭AI图片生成

下载

中国的大型科技公司正努力改进他们的自然语言处理 (NLP) 系统,这些系统被用于支持如阿里巴巴的语音激活虚拟助手,腾讯的小微和AliGenie,以及机器翻译和垃圾邮件检测等其他功能。

今年早些时候,由百度研发的AI模型「度晓晓」写出的作文,尽管错误地使用了不少互联网俚语和生僻词,但仍在高考得分中高于绝大多数学生。

此外在最新排行榜上,中国智能手机制造商OPPO和外卖巨头美团的人工智能模型,也分别排在第四和第五位。

尽管如此,一些研究人员表示:虽然机器在某些语言任务上可以比人类做得更好,但大多数人工智能模型在真正理解语言的复杂性之前,还有很长的路要走。

去年,由美国阿拉巴马州奥本大学和Adobe的研究部门联合研究发现,许多在某些理解任务上表现优于人类的AI,仍无法分辨出单词被随机打乱的句子。

参考资料:

https://www.cluebenchmarks.com/rank.html

https://www.scmp.com/tech/big-tech/article/3201294/tencent-and-alibabas-ai-models-understand-chinese-better-humans-new-rankings-show

https://www.techtimes.com/articles/284084/20221128/tencent-alibaba-ai-tech-tops-chinese-language-comprehension-humans-ranks.htm

https://english.newstracklive.com/news/ai-models-from-tencent-and-alibaba-are-superior-to-humans-at-understanding-chinese-sc71-nu355-ta355-1259160-1.html

相关专题

更多
微信聊天记录删除恢复导出教程汇总
微信聊天记录删除恢复导出教程汇总

本专题整合了微信聊天记录相关教程大全,阅读专题下面的文章了解更多详细内容。

36

2026.01.18

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

99

2026.01.16

全民K歌得高分教程大全
全民K歌得高分教程大全

本专题整合了全民K歌得高分技巧汇总,阅读专题下面的文章了解更多详细内容。

148

2026.01.16

C++ 单元测试与代码质量保障
C++ 单元测试与代码质量保障

本专题系统讲解 C++ 在单元测试与代码质量保障方面的实战方法,包括测试驱动开发理念、Google Test/Google Mock 的使用、测试用例设计、边界条件验证、持续集成中的自动化测试流程,以及常见代码质量问题的发现与修复。通过工程化示例,帮助开发者建立 可测试、可维护、高质量的 C++ 项目体系。

57

2026.01.16

java数据库连接教程大全
java数据库连接教程大全

本专题整合了java数据库连接相关教程,阅读专题下面的文章了解更多详细内容。

40

2026.01.15

Java音频处理教程汇总
Java音频处理教程汇总

本专题整合了java音频处理教程大全,阅读专题下面的文章了解更多详细内容。

19

2026.01.15

windows查看wifi密码教程大全
windows查看wifi密码教程大全

本专题整合了windows查看wifi密码教程大全,阅读专题下面的文章了解更多详细内容。

107

2026.01.15

浏览器缓存清理方法汇总
浏览器缓存清理方法汇总

本专题整合了浏览器缓存清理教程汇总,阅读专题下面的文章了解更多详细内容。

44

2026.01.15

ps图片相关教程汇总
ps图片相关教程汇总

本专题整合了ps图片设置相关教程合集,阅读专题下面的文章了解更多详细内容。

12

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
10分钟--Midjourney创作自己的漫画
10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合
Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号