TextRank

關鍵字

嗯,模型比較簡單,限定一個窗口(比如一個詞前後k個詞,認爲他們具有連接),然後計算PageRank
這裏寫圖片描述
得到的就是這段話裏的關鍵字,據說比TFIDF要靠譜點

關鍵句

主要也是句子間連接關係的限定,paper裏計算句子的相似度:
這裏寫圖片描述
然後一樣計算:
這裏寫圖片描述
看清楚累加的下標 Vj 是 In(Vi) 的集合,分母是 Out(Vj) 的集合

參考信息

參考1
參考2
代碼
論文

發佈了147 篇原創文章 · 獲贊 12 · 訪問量 25萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章