KDD2019 | Boss直聘聯合北京大學提出基於記憶的深度文本匹配技術用於人崗推薦

針對互聯網求職招聘場景的人崗匹配推薦問題，本文提出了一種建模求職者與招聘者雙方偏好的新型深度文本匹配模型。該模型通過引入記憶模塊，利用簡歷文檔和崗位描述文檔之間的信息交互來學習潛在偏好表示，並將偏好結合到匹配框架中構建端到端的深度神經網絡模型。

基於在線招聘平臺Boss直聘數據集的實驗結果表明，本文提出的模型效果超過state-of-the-art的人崗匹配推薦方法，各評價指標均有顯著提升。實驗證明，互聯網招聘場景中的求職者與招聘者雙方確實存在歷史行爲偏好，並且該偏好可以用來改善人崗匹配推薦系統。目前，該論文已被數據挖掘領域頂會KDD2019接收。

背景介紹

在線招聘服務的產生與發展不斷衝擊着就業市場上的傳統招聘模式。如今，互聯網上存在着數億規模的求職者簡歷以及崗位招聘信息。如此大規模的數據給互聯網招聘帶來了新的挑戰：如何能夠自動並準確地將合適的崗位描述文檔與簡歷文檔相匹配，以便高效地將合適的人才配置到與之相應的崗位上。因此，學習並構建完善的人崗自動匹配推薦系統顯得十分重要，這既有助於招聘人員找到合適的候選人，也有助於求職者能夠找到合適的崗位。現有針對人崗匹配推薦問題的研究通常集中在學習簡歷文檔以及崗位描述文檔自身的表示後計算雙方的匹配度。然而，在互聯網求職招聘場景下，除了求職者與招聘者雙方的文本信息之外，還存在大量的歷史交互行爲信息可以應用於人崗匹配推薦任務。

問題定義

在本文定義的人崗匹配推薦任務中，每個崗位文檔由多句崗位職責與任職要求組成，每個簡歷文檔由多句相關工作經驗組成。在實際應用場景下，求職招聘數據中的招聘者與求職者雙方天然帶有歷史行爲記錄信息。例如，一個求職者曾經面試過哪些崗位會被記錄，同時一個崗位曾經面試過哪些求職者也會被記錄。這些面試溝通記錄可以作爲標註數據供模型學習雙方的偏好。本文的目標是給定一個求職者及其歷史面試記錄，以及一個招聘崗位及其歷史面試記錄作爲輸入，去預測求職者與招聘崗位之間的匹配分數，從而判斷將求職者推薦給該崗位是否合適。

方法描述

如圖所示，文本提出的模型由招聘者與求職者雙邊對稱的表示學習網絡，以及匹配網絡三部分組成。

在崗位描述表示學習網絡中，模型利用崗位描述文檔以及該崗位歷史上曾經面試過的求職者的簡歷文檔，通過引入記憶模塊來計算帶有偏好的崗位向量表示。

1）初始化：

初始階段，模型首先對崗位描述文檔裏的各個句子，以及該崗位歷史面試過的求職者的簡歷文檔內的各個句子經過層級GRU網絡進行編碼，得到各個帶有上下文信息的句子表示。

同時，模型將崗位文檔中的各個帶有上下文信息的句子表示作爲記憶模塊的初始化。

2）記憶模塊迭代：

給定一個崗位描述文檔J，按照時間順序遍歷與該崗位發生過面試的簡歷文檔， {R1，R2，…}，對記憶模塊M進行更新與讀取的迭代操作：

a. 利用J和各個R對M進行更新（記憶模塊更新）。
b. J從M中讀取偏好信息（記憶模塊讀取）。

記憶模塊更新：

每步迭代的更新操作中，模型利用歷史面試記錄中的一個簡歷文檔對崗位文檔的記憶模塊進行更新。模型引入‘注意力機制’計算更新到當前狀態下的記憶模塊裏各個向量表示與崗位文檔及簡歷文檔各個句子表示的相似度，並以此來計算用來更新記憶模塊的偏好信息向量。

更新計算中，模型利用記憶模塊中當前狀態下的各個向量表示，以及每個向量表示對應的當前步驟的偏好信息向量，通過 ‘門控機制’ 對記憶模塊中各個向量表示進行更新。

記憶模塊讀取：

在每輪迭代的記憶模塊更新操作後，崗位描述文檔的各個帶上下文信息的句子向量表示從記憶模塊中讀取偏好信息。讀取操作採用與更新操作中相似的‘注意力機制’來計算偏好信息向量。

並且利用“門控機制”來完成信息讀取。

通過對記憶模塊的更新與讀取的迭代操作，得到最終帶有偏好信息的崗位描述表示。

採用對稱的方式，在求職者的簡歷文檔的表示學習中，模型遍歷該求職者歷史曾經面試過的崗位描述文檔，得到最終的簡歷表示。

3）匹配

對記憶模塊的更新讀取迭代操作完成後，模型對求職者的簡歷文檔中各個帶有上下文信息的句子表示通過max-pooling得到簡歷的文檔向量表示。採用同樣的方式可以得到帶有偏好信息的崗位描述文檔表示。以上述兩個文檔表示爲輸入，模型利用MLP網絡計算匹配分數。優化的目標是極大化發生面試的崗位描述與簡歷文檔之間的得分，極小化不匹配樣本對之間的得分。

實驗效果

本文基於在線招聘平臺Boss直聘的數據集對所提出的模型進行實驗驗證，比較的方法包括：

LR：邏輯迴歸模型
DT：決策樹模型
NB：樸素貝葉斯模型
RF：隨機森林模型
GBDT：梯度提升決策樹模型

上述模型是基於傳統機器學習的方法，此外我們還引入了基於深度匹配模型的方法PJFNN[1]和AAPJF[2]進行實驗比較。
6. HRNNM：基於層級GRU編碼的文檔匹配模型
7. PJFNN：[1]中提出的基於卷積神經網絡的匹配模型
8. AAPJF：[2]中提出的基於層級注意力機制的匹配模型

實驗結果顯示本文提出的模型在各個指標上均優於state-of-the-art的模型，並且指標的提升通過了顯著性檢驗。此外，對記憶模塊的消融實驗進一步驗證了對求職者與招聘者的歷史行爲偏好建模均有助於提升人崗匹配推薦系統的效果。

參考文獻

[1] Zhu C, Zhu H, Xiong H, et al. Person-Job Fit: Adapting the Right Talent for the Right Job with Joint Representation Learning[J]. ACM Transactions on Management Information Systems (TMIS), 2018, 9(3): 12.

[2] Qin C, Zhu H, Xu T, et al. Enhancing person-job fit for talent recruitment: An ability-aware neural network approach[C]//The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval. ACM, 2018: 25-34.

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

KDD2019 | Boss直聘聯合北京大學提出基於記憶的深度文本匹配技術用於人崗推薦

背景介紹

問題定義

方法描述

1）初始化：

2）記憶模塊迭代：

3）匹配

實驗效果

參考文獻

KDD2019 | Boss直聘聯合北京大學提出基於記憶的深度文本匹配技術用於人崗推薦

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結