BERT的[CLS]有什麼用

[CLS]就是classification的意思,可以理解爲用於下游的分類任務。

主要用於以下兩種任務:

  • 單文本分類任務:對於文本分類任務,BERT模型在文本前插入一個[CLS]符號,並將該符號對應的輸出向量作爲整篇文本的語義表示,用於文本分類,如下圖所示。可以理解爲:與文本中已有的其它字/詞相比,這個無明顯語義信息的符號會更“公平”地融合文本中各個字/詞的語義信息。

  • 語句對分類任務:該任務的實際應用場景包括:問答(判斷一個問題與一個答案是否匹配)、語句匹配(兩句話是否表達同一個意思)等。對於該任務,BERT模型除了添加[CLS]符號並將對應的輸出作爲文本的語義表示,還對輸入的兩句話用一個[SEP]符號作分割,並分別對兩句話附加兩個不同的文本向量以作區分,如下圖所示。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章