0

0

LinkedIn在利用大型语言模型服务十亿用户中的收获

WBOY

WBOY

发布时间:2024-04-26 16:49:11

|

531人浏览过

|

来源于51CTO.COM

转载

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

LinkedIn在利用大型语言模型服务十亿用户中的收获

在全球拥有超过10亿用户的linkedin,不断挑战当今企业技术的极限。很少有公司能够太像linkedin那样运营,或者拥有类似的大量数据资源。

这个专注于商业和就业的社交媒体平台将合格的候选人与潜在雇主联系起来,帮助填补职位空缺是其核心业务。同样重要的是确保平台上的帖子反映了雇主和消费者的需求。在LinkedIn的模式下,这些匹配过程一直依赖于技术。

到了2023年夏天,当GenAI第一次高涨时,LinkedIn开始考虑是否利用大型语言模型(LLMs)来匹配候选人与雇主,并使信息流更加有用。

因此,这家社交媒体巨头开启了一段GenAI的旅程,并现在正在报告其利用Microsoft的Azure OpenAI服务的经验结果。各行各业的CIOs都可以从LinkedIn中在此过程中学到的一些经验。

起伏跌宕

正如大多数CIO所经历的那样,采用新兴技术伴随着试验和挫折。LinkedIn的情况也不例外,据该公司的首席软件工程师和技术负责人Juan Bottaro所说,其走向LLM协同的道路一点也不平坦。

Bottaro表示,最初的成果“感觉不够完善”,“连接的点还不够多。”

围绕GenAI的首波炒作并没有帮助。

“LLM是新事物,感觉它能解决所有问题,”Bottaro说。“我们开始时对LLM能做什么并没有一个非常清晰的概念。”

例如,早期版本的改进型职位匹配工作可以说是相当的,用一个不太恰当的词来说,粗鲁。或者至少过于直白。

“点击‘评估我是否适合这份工作’后得到‘你完全不适合’并不实用,”Bottaro说。“我们希望[回应]既事实准确,同时也要有同理心。有些会员可能正在考虑转行到他们目前并不十分适合的领域,需要帮助了解差距和下一步该怎么做。”

因此,LinkedIn初步学到的一个重要经验是调整LLM以满足观众的期望——并帮助LLM理解如何以一种或许不是人类,但至少是人性化的方式来回应。

速度问题

尽管LinkedIn拥有超过十亿会员,依靠LinkedIn的LLM工作的大部分求职功能最初是针对高级会员的,这是一个相对较小的群体。(LinkedIn拒绝透露其拥有多少高级会员。)

在如此大的规模运作时,速度是至关重要的,特别是在与相关职位匹配候选人这样细致的事务上。这里,人们认为LLM会有所帮助,因为LLM的一个经常被提及的优点是其速度,使它们能够迅速完成复杂的步骤。但Bottaro表示,LinkedIn的部署并非如此。

“我不会说LLM很快。我不认为速度是一个优势,”他说。

速度可以有多种定义。虽然在操作上LLM可能没有像希望的那样快,但Bottaro表示整体部署过程的加速令人震惊。“这项新技术的超能力在于你可以非常快速地创建原型,大约在两到三个月之间。在这项技术出现之前,这是不可能的,”他说。

当被问及如果没有LLM,项目的各个方面需要多久时,Bottaro表示有些可能根本无法完成,而其他元素“可能需要几年时间。”

作为一个例子,Bottaro提到了旨在理解意图的系统部分。没有LLM,这可能需要两到三个月,但LLM在“不到一周”的时间内就掌握了它。

成本考虑

Bottaro称之为“障碍”的一个方面是成本。同样,成本在项目的不同阶段意味着不同的东西,正如LinkedIn的经验所示。

“我们用于开发的金额微不足道,”Bottaro说。但当涉及到向LinkedIn的客户提供数据时,成本激增。

TalkMe
TalkMe

与AI语伴聊天,练习外语口语

下载

“即便只是针对几百万会员,”Bottaro说,这可能暗示了高级会员的数量,价格也飙升了。这是因为LLM的定价——至少是LinkedIn与Microsoft(其LLM提供商及母公司)达成的许可协议——是基于使用量的,具体来说是输入和输出令牌的使用量。

一位AI供应商的首席执行官Tarun Thummala在一篇与此项目无关的LinkedIn帖子中解释说,LLM的输入和输出令牌大约相当于0.75个单词。LLM供应商通常按成千上万或成百万卖令牌。例如,LinkedIn使用的Azure OpenAI在美国东部地区收费标准为每100万个8K GPT-4输入令牌30美元,每100万个8K GPT-4输出令牌60美元。

评估挑战

LinkedIn为其项目设定的另一个功能目标是自动评估。LLM在准确性、相关性、安全性和其他关注点方面的评估一直是个挑战。领先的组织和LLM制造商一直在尝试自动化一些工作,但据LinkedIn称,这种能力“仍然是在进行中”。

没有自动化评估,LinkedIn报告称“工程师们只能靠目测结果,并在有限的样本集上进行测试,且通常会有超过1天的延迟才能知道指标。”

该公司正在构建基于模型的评估器,以帮助估计关键的LLM指标,如整体质量得分、幻觉率、连贯性和负责任的AI违规情况。这样做将能够加快实验的速度,公司的工程师说,尽管LinkedIn的工程师在幻觉检测方面取得了一些成功,但他们还没有完成该领域的工作。

数据质量

LinkedIn在其职位匹配努力中遇到的部分挑战归结为双方的数据质量问题:雇主和潜在雇员。

LLM只能使用提供给它的数据,有时候职位发布并不精确或全面地说明雇主所寻求的技能。另一方面,一些求职者发布的简历表述不佳,无法有效反映他们在解决问题等方面的丰富经验。

在这方面,Bottaro看到了LLM帮助雇主和潜在雇员的潜力。通过改善雇主和LinkedIn用户的书写,双方都能受益,因为公司的职位匹配LLM在数据输入质量更高时能够更有效地工作。

用户体验

在处理如此庞大的会员基础时,准确性和相关性指标可能“给人一种虚假的安慰感,”Bottaro说。例如,如果LLM“90%的时间都做得对,这意味着十分之一的人会有糟糕的体验,”他说。

使这种部署更加困难的是,提供有用、有帮助且准确答案所涉及的极端细微差别和判断。

“你如何定义什么是好的,什么是坏的?我们花了很多时间与语言学家一起制定关于如何提供全面代表性的指导。我们也做了很多用户研究,”Bottaro说。“你如何训练人们撰写正确的回应?你如何定义任务,规定回应应该是什么样的?产品可能试图建设性或有帮助。它不试图假设太多,因为那是幻觉开始的地方。我们对回应的一致性感到非常自豪。”

实时运营

LinkedIn庞大的规模为职位匹配带来了另一个挑战。在拥有十亿会员的情况下,一个职位广告在发布几分钟内可能会收到数百甚至数千个应聘回应。如果看到已经有数百人申请,许多求职者可能就不会再费心申请了。这就要求LLM非常迅速地找到匹配的会员,在资质较低的申请者提交材料之前做出反应。之后,会员是否看到通知并及时做出反应仍然是一个问题。

在雇主方面,挑战在于找到最合适的应聘者——不一定是反应最快的人。一些公司不愿公布薪资范围,这进一步复杂化了双方的努力,因为最合格的应聘者可能对职位的薪酬不感兴趣。这是一个LLM无法解决的问题。

API和RAG

LinkedIn庞大的数据库包含了关于个人、雇主、技能和课程的许多独特信息,但其LLM尚未接受过这些数据的培训。因此,根据LinkedIn工程师的说法,它们目前无法使用这些资产进行任何推理或生成响应的活动,因为这些资产是如何存储和提供的。

在这里,检索增强生成(RAG)是一个典型的解决方案。通过建立内部API的管道,企业可以用额外的上下文“增强”LLM提示,以更好地指导和限制LLM的响应。LinkedIn的大部分数据通过RPC API公开,公司的工程师说这“方便人类以编程方式调用”,但“对LLM并不友好”。

为了解决这个问题,LinkedIn的工程师围绕其API“封装了技能”,给它们提供了一个“对LLM友好的API功能描述以及何时使用它”,以及配置细节、输入和输出架构以及将每个API的LLM版本映射到其底层(实际)RPC版本所需的所有逻辑。

LinkedIn的工程师在一份声明中写道:“像这样的技能使LLM能够执行与我们产品相关的各种操作,如查看个人资料、搜索文章/人员/职位/公司,甚至查询内部分析系统。”他们还提到,“同样的技术也用于调用非LinkedIn的API,如Bing搜索和新闻。”这种方法不仅提高了LLM的功能性,还增强了其与现有技术基础设施的整合能力,使得LLM能够更广泛地应用于企业的各个方面。

相关专题

更多
数据库三范式
数据库三范式

数据库三范式是一种设计规范,用于规范化关系型数据库中的数据结构,它通过消除冗余数据、提高数据库性能和数据一致性,提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

349

2023.06.29

如何删除数据库
如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构,作用包括:1、释放存储空间;2、确保数据的安全性;3、提高数据库的整体性能,加速查询和操作的执行速度。尽管删除数据库具有一些好处,但在执行任何删除操作之前,务必谨慎操作,并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构,无法回滚。

2074

2023.08.14

vb怎么连接数据库
vb怎么连接数据库

在VB中,连接数据库通常使用ADO(ActiveX 数据对象)或 DAO(Data Access Objects)这两个技术来实现:1、引入ADO库;2、创建ADO连接对象;3、配置连接字符串;4、打开连接;5、执行SQL语句;6、处理查询结果;7、关闭连接即可。

347

2023.08.31

MySQL恢复数据库
MySQL恢复数据库

MySQL恢复数据库的方法有使用物理备份恢复、使用逻辑备份恢复、使用二进制日志恢复和使用数据库复制进行恢复等。本专题为大家提供MySQL数据库相关的文章、下载、课程内容,供大家免费下载体验。

255

2023.09.05

vb中怎么连接access数据库
vb中怎么连接access数据库

vb中连接access数据库的步骤包括引用必要的命名空间、创建连接字符串、创建连接对象、打开连接、执行SQL语句和关闭连接。本专题为大家提供连接access数据库相关的文章、下载、课程内容,供大家免费下载体验。

323

2023.10.09

数据库对象名无效怎么解决
数据库对象名无效怎么解决

数据库对象名无效解决办法:1、检查使用的对象名是否正确,确保没有拼写错误;2、检查数据库中是否已存在具有相同名称的对象,如果是,请更改对象名为一个不同的名称,然后重新创建;3、确保在连接数据库时使用了正确的用户名、密码和数据库名称;4、尝试重启数据库服务,然后再次尝试创建或使用对象;5、尝试更新驱动程序,然后再次尝试创建或使用对象。

410

2023.10.16

vb连接access数据库的方法
vb连接access数据库的方法

vb连接access数据库方法:1、使用ADO连接,首先导入System.Data.OleDb模块,然后定义一个连接字符串,接着创建一个OleDbConnection对象并使用Open() 方法打开连接;2、使用DAO连接,首先导入 Microsoft.Jet.OLEDB模块,然后定义一个连接字符串,接着创建一个JetConnection对象并使用Open()方法打开连接即可。

398

2023.10.16

vb连接数据库的方法
vb连接数据库的方法

vb连接数据库的方法有使用ADO对象库、使用OLEDB数据提供程序、使用ODBC数据源等。详细介绍:1、使用ADO对象库方法,ADO是一种用于访问数据库的COM组件,可以通过ADO连接数据库并执行SQL语句。可以使用ADODB.Connection对象来建立与数据库的连接,然后使用ADODB.Recordset对象来执行查询和操作数据;2、使用OLEDB数据提供程序方法等等。

219

2023.10.19

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

3

2026.01.19

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
麻省理工大佬Python课程
麻省理工大佬Python课程

共34课时 | 5.1万人学习

国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号