一種讀者圖書借閱二分網絡中的優質圖書迭代識別算法

原創

2018-09-05 04:43

爲了給圖書館讀者用戶提供更滿意的個性化推薦圖書，我們必須在兩方面做出有效的工作：一是如何來準確的識別用戶可能感興趣的圖書主題或者類別，不像圖書，讀者用戶一般沒有完整直接的興趣特徵標識。常用的方法往往是採用讀者所借圖書的主題信息來間接表達讀者的興趣特徵，然而我們也注意到，讀者在借閱時並非始終對某種既定主題保持着濃厚的興趣，有時也因爲能力和專業水平的差距，大量的所借圖書可能並非自己最終所要的圖書，甚至還有可能借到一些質量並不高的相關圖書。這些圖書在很大程度上並不能很好的代表着用戶的興趣特徵，因此直接利用所借圖書的主題信息來間接識別讀者信息存在着需要改進的環節；二是如何有效識別不同圖書的質量，從而爲讀者推薦更可能使其滿意的圖書。傳統的方法一般藉助於借閱量這個指標，也就是說那些被更多人所借的圖書通常也可能會被當前用戶所借閱，然而我們認爲具有較高專業知識背景的讀者應該比一般隨便借閱的讀者對所借圖書具有更高的認可能力，所以傳統做法顯然忽略了不同讀者對自己所借圖書的不同推薦能力。同時，由於讀者興趣的廣泛性，使得某些專業性較強的圖書一般在借閱量上極大的低於某些通俗類圖書，這也從另一方面給以單純使用借閱量爲主的推薦方法帶來不利影響。
從一定程度上講，上述第二個問題的解決方法也有助於對第一個問題的解決，正是我們無法探知圖書的真正質量所以我們無法準確的從現有的讀者借閱信息中識別出最有價值的所借圖書信息。

基於該算法，可以提出三種可以應用在個性化圖書服務中的推薦模式，分別是特定主題的圖書推薦、現有所借圖書的修正型推薦和新書推薦。測試網址爲：http://www.njmars.net:8088/libs。

一）特定主題的圖書推薦實驗結果
我們對常見的幾種圖書類別和關鍵詞進行了查詢測試，實驗表明對於某主題領域下的高質量圖書而言，本文所設計的方法能夠比簡單藉助借閱量方法，對於專業性較強的圖書，具有更好的識別效果，尤其在某個特定的主題領域所涉及的圖書總數不多的情況，更易於發現該主題領域的高質量圖書。

“信息檢索”主題相關的圖書推薦結果截圖

二）現有所借圖書的修正型推薦實驗結果

如對“搜索引擎”相關圖書而言，我們得到了5條初始圖書記錄，如果選中第一本《搜索引擎廣告：網絡營銷的成功之路》，並將調節參數設定爲8，即表示只取標題相似度最高的前8本圖書，得到的修正型推薦結果皆與搜索引擎和廣告營銷密切相關

與搜索引擎和廣告營銷密切相關“搜索引擎”推薦結果截圖

而如果選中第四本《搜索引擎與信息獲取技術》，則獲得的修正型推薦結果完全和前者不一樣，更側重於搜索引擎技術方面的介紹

與搜索引擎技術密切相關“搜索引擎”推薦結果截圖

三）新書推薦實驗結果
在實驗中，我們僅對讀者用戶進行了用戶個性化模式的表達能力測試。如“A023”讀者，該讀者共有226條借閱記錄，在按照新書推薦算法得到的相關讀者興趣模式中，主要的讀者興趣特徵有“TP311”類和“TP312”類等，其中每個最能反映用戶興趣特徵的關鍵詞

讀者“A023”的用戶個性化模式的展示效果截圖

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

一種讀者圖書借閱二分網絡中的優質圖書迭代識別算法

sm4加密工具類

利用自動構建語義本體來實現查詢擴展

2011年SSCI收錄信息科學與圖書館學學科期刊86種

簡柏特學生員工的交流體會——崑山調研體會

學術研究文獻的關鍵路徑發現系統——以計算機類文獻爲例

基於Apache的HTTPClient的網頁獲取方法

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結