Deep-IRT: Make Deep Learning Based Knowledge Tracing Explainable Using Item Response Theory

Deep-IRT: Make Deep Learning Based Knowledge Tracing Explainable Using Item Response Theory

Student Ability and Difficulty Networks

DKVMN\text{DKVMN}的模型架構可以被很容易的增強,進一步提供其他的有意義的信息。首先,每個潛在知識點的狀態可以被拓展爲學生能力。具體而言,當DKVMN\text{DKVMN}模型接收一個知識點qtq_t時,會形成特徵向量ftf_t。由於特徵向量ftf_t是由讀向量rtr_t和知識點嵌入向量ktk_t拼接而成,它包含了學生知識點狀態在qtq_t的信息和qtq_t的嵌入信息。我們相信ftf_t可以用於推斷學生能力通過神經網絡進一步處理ftf_t。類似的,qtq_t的難度信息也可以被提取通過把知識點嵌入向量ktk_t送入神經網絡。

根據神經網絡的作用,我們稱這兩個網絡分別叫做學生能力網絡和難度網絡。使用單一的全連接層,表達爲:
θtj=tanh(Wθft+bθ)βj=tanh(Wβqt+bβ) \theta_{tj}=\text{tanh}(W_{\theta}f_t+b_{\theta}) \\ \beta_{j}=\text{tanh}(W_{\beta}q_t+b_{\beta})
其中θtj,βj\theta_{tj},\beta_{j}被分別解釋爲在知識點jj在時間tt的學生能力,知識點jj的難度。對於兩個網絡,我們使用tanh\text{tanh}作爲激活函數,使得輸出介於(1,1)(-1, 1)。之後,兩個傳入項目反映理論計算學生在知識點jj上作答的正確概率:
pt=σ(3.0θtjβj) p_t = \sigma(3.0 * \theta{tj}-\beta_{j})
因爲實踐的原因,學生能力網絡輸出乘放縮因子3,以便值域爲(0,1)(0, 1)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章