Linkedin以AI配对求职与招聘,提升职缺配对成功几率

Linkedin现在将人工智能用在配对求职者与招聘者,通过让合格申请(Qualified Applicant,QA)模型,学习招聘者过去与应征候选者的交互,了解招聘者认为应征者该具备的技能与经验,推荐应征者适合的工作,并为招聘者依适合程度排名申请人。

Linkedin使用这个模型,协助应征者找到最有可能获得回应的工作,同时也为招聘者标出适合的申请人选。在部署QA模型后,Linkedin平台各项指标都获明显的提升。

官方提到,求职者积极的申请了许多工作,但通常只有少数得到回应,另一方面,招聘者需要利用有限的时间,筛选大量的申请,因此常会忽略真正适合的人选。因此Linkedin决定用人工智能来解决这个问题,而这需要考虑几件事,首先是需要创建一个模型,要能够同时适用于所有应征者与招聘者,另外则是因为职位发布与申请的时效很短,因此需要不停训练模型避免过时,还有则是个性化模型的训练规模,QA模型拥有高达数十亿个系数,因此训练的可扩展性非常重要。

QA模型目的,是要预测成员申请某项工作后,能够获得回应的可能性,也就是说,QA模型会预测招聘者积极采取行动的几率,积极行动包括查看应征者的个人资料、发送消息、邀请参加面试,或是最终提供应征者工作。由于Linkedin求职市场庞大又多变,因此单一的全局模型可能不够理想,无法捕捉到足够的特质,所以模型需要针对每个应征者和每个职位进行调整,加入QA模型个性化组件来解决这个问题。

由于平台资料变动快速,模型可能很快就会过时,因此必需要频繁地重新训练模型。官方提到,每3周个性化模型的效果就会减半,而针对每个工作调整的个性化效果衰退得更快,因此模型需要频繁地进行训练,才能维持应有的性能,但求职者可能只花几周的时间积极寻找工作,而职缺发布的速度也很快,因此Linkedin必须用很快的速度更新模型,才能跟得上求职招聘节奏。

全局模型不需要频繁的训练,但QA模型个性化组件却可以经常更新,Linkedin每天都会产生新的训练标签,自动重新训练每个求职者与职位的个性化组件,并将其部署到生产中。

系统会收集招聘者每天与新的应征候选人交互的事件,并将这些事件转为训练标签,用来更新个性化组件。通常事件发生后,需要等上一段时间,系统才能得出正向标签或是隐性的负向标签,不过官方认为,最理想情况,还是将事件迅速地转成训练标签,才能减少整合到模型的时间。

一般的做法是在应征者申请工作一段时间后,根据参与度将其标记为正向或负向,另外,Linkedin也分析典型招聘者的反应,约在第一天就能确定30%为正向标签,而当招聘者回应了多数职缺应征者,剩下的申请人便会被系统标上负向标签,要是14天后还是没有任何参与,便会得出负向的结论。这样的方法让QA模型可以不断更新资料集,确保模型品质。

Linkedin使用资料流媒体处理工具Apache Samza和Apache Kafka,创建接近即时的资料收集与训练工作管线,能够异步训练和更新个性化模型组件,花费的时间从原本需要数小时,降低到数分钟就能完成更新。每天个性化模型都会使用新收集到的参与度资料重新训练,以确保模型维持更新状态,而全局模型因为变化慢,则是数周才会训练一次。

目前LinkedIn已经将这个模型用于Job Seekers、Premium和Recruiter三个用户等级,对Job Seekers用户来说,只要有符合的职位,系统便会特别标示出来,对于Premium等级的用户,还会显示比其他求职者更具竞争力的工作,而Recruiter用户,系统则会为招聘者依适合程度,排名申请人,并且在有高度符合需求的求职者应征时,主动发出通知。

新模型部署之后,根据各项指标变化,该模型确实发挥作用,Linkedin提到,招聘者与应征者的交互率有两位数增长,而且确认招聘的比例提升,这代表应征方与招聘方配对品质良好,另外,Premium等级的用户的点击率(CTR)也获得提升。