Linkedin以AI配对求职与招聘，提升职缺配对成功几率

Linkedin现在将人工智能用在配对求职者与招聘者，通过让合格申请（Qualified Applicant，QA）模型，学习招聘者过去与应征候选者的交互，了解招聘者认为应征者该具备的技能与经验，推荐应征者适合的工作，并为招聘者依适合程度排名申请人。

Linkedin使用这个模型，协助应征者找到最有可能获得回应的工作，同时也为招聘者标出适合的申请人选。在部署QA模型后，Linkedin平台各项指标都获明显的提升。

官方提到，求职者积极的申请了许多工作，但通常只有少数得到回应，另一方面，招聘者需要利用有限的时间，筛选大量的申请，因此常会忽略真正适合的人选。因此Linkedin决定用人工智能来解决这个问题，而这需要考虑几件事，首先是需要创建一个模型，要能够同时适用于所有应征者与招聘者，另外则是因为职位发布与申请的时效很短，因此需要不停训练模型避免过时，还有则是个性化模型的训练规模，QA模型拥有高达数十亿个系数，因此训练的可扩展性非常重要。

QA模型目的，是要预测成员申请某项工作后，能够获得回应的可能性，也就是说，QA模型会预测招聘者积极采取行动的几率，积极行动包括查看应征者的个人资料、发送消息、邀请参加面试，或是最终提供应征者工作。由于Linkedin求职市场庞大又多变，因此单一的全局模型可能不够理想，无法捕捉到足够的特质，所以模型需要针对每个应征者和每个职位进行调整，加入QA模型个性化组件来解决这个问题。

由于平台资料变动快速，模型可能很快就会过时，因此必需要频繁地重新训练模型。官方提到，每3周个性化模型的效果就会减半，而针对每个工作调整的个性化效果衰退得更快，因此模型需要频繁地进行训练，才能维持应有的性能，但求职者可能只花几周的时间积极寻找工作，而职缺发布的速度也很快，因此Linkedin必须用很快的速度更新模型，才能跟得上求职招聘节奏。

全局模型不需要频繁的训练，但QA模型个性化组件却可以经常更新，Linkedin每天都会产生新的训练标签，自动重新训练每个求职者与职位的个性化组件，并将其部署到生产中。

系统会收集招聘者每天与新的应征候选人交互的事件，并将这些事件转为训练标签，用来更新个性化组件。通常事件发生后，需要等上一段时间，系统才能得出正向标签或是隐性的负向标签，不过官方认为，最理想情况，还是将事件迅速地转成训练标签，才能减少整合到模型的时间。

一般的做法是在应征者申请工作一段时间后，根据参与度将其标记为正向或负向，另外，Linkedin也分析典型招聘者的反应，约在第一天就能确定30%为正向标签，而当招聘者回应了多数职缺应征者，剩下的申请人便会被系统标上负向标签，要是14天后还是没有任何参与，便会得出负向的结论。这样的方法让QA模型可以不断更新资料集，确保模型品质。

Linkedin使用资料流媒体处理工具Apache Samza和Apache Kafka，创建接近即时的资料收集与训练工作管线，能够异步训练和更新个性化模型组件，花费的时间从原本需要数小时，降低到数分钟就能完成更新。每天个性化模型都会使用新收集到的参与度资料重新训练，以确保模型维持更新状态，而全局模型因为变化慢，则是数周才会训练一次。

目前LinkedIn已经将这个模型用于Job Seekers、Premium和Recruiter三个用户等级，对Job Seekers用户来说，只要有符合的职位，系统便会特别标示出来，对于Premium等级的用户，还会显示比其他求职者更具竞争力的工作，而Recruiter用户，系统则会为招聘者依适合程度，排名申请人，并且在有高度符合需求的求职者应征时，主动发出通知。

新模型部署之后，根据各项指标变化，该模型确实发挥作用，Linkedin提到，招聘者与应征者的交互率有两位数增长，而且确认招聘的比例提升，这代表应征方与招聘方配对品质良好，另外，Premium等级的用户的点击率（CTR）也获得提升。