原创 基本機器學習sklearn接口

下面列舉了常見的機器學習算法的sklearn接口。 1、LinearRegression from sklearn.datasets import load_iris from sklearn.model_selection

原创 Sklearn簡單學習筆記

下面是學習了莫煩大佬 sklearn 教程的筆記,是供我自己查閱的,不是很詳細,介意的勿看~ 莫煩大佬的教程鏈接在最後一點學習資料裏面。 這是目錄一、下載與安裝二、選擇合適的機器學習方法三、通用的學習模式四、sklearn 的

原创 推薦系統常見問題(一):數據集按照用戶行爲比例進行劃分的問題?

問題:數據集按照用戶行爲比例進行劃分的問題? 推薦系統若按照每個用戶的交易記錄按比例進行數據集的劃分,比如每個用戶留下80%的數據作爲訓練集,20%的數據作爲測試集,那麼對於一個有5個交易記錄的用戶來說,訓練集應該有4個,測試集應

原创 LibRec 學習筆記(四):LibRec 中的默認配置項裏面的參數是什麼意思?

我們知道在 librec 中有許多已經實現的推薦算法,因爲每種推薦算法的參數不一定一樣,而又有大部分參數是一樣的,比如都會涉及到劃分數據集的方式、評估方式等等。所以 librec 項目爲了方便,把大部分推薦算法都有的參數配置都固定

原创 LibRec 學習筆記(三):LibRec 如何使用命令行和參數或者配置文件運行指定推薦算法?

這是目錄一、第一部分:演示如何使用命令行運行指定推薦算法二、仔細解釋 librec 命令中參數的意思1、可執行的兩個命令2、全局選項3、與任務相關的選項三、小結如何使用命令行和參數或者配置文件運行指定算法 首先,這個是官方關於這個

原创 【代碼問題集錦】UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 0-1: invalid continuati

我代碼裏面出現這個問題的原因是,我讀取的文件不是utf-8編碼格式,後來我用notepad++打開,在編碼格式裏面把這個文件的格式改成utf-8之後就好了

原创 【代碼問題集錦】服務器運行代碼出現ModuleNotFoundError: No module named 'Utility'

代碼在本地的IDE上運行沒有出錯,但是在服務器端出現了ModuleNotFoundError: No module named 'Utility’錯誤,後來發現原因是因爲我的代碼裏面引入了其他文件的包,是import那個語句出現錯

原创 LibRec 學習筆記(一):如何在自己的項目中導入第三方包:LibRec ?

如果需要使用第三方包,LibRec ,一般有以下兩種常用做法(若想導入其他第三方包,做法類似): 一、直接使用官方提供的 maven 依賴代碼進行下載使用:這是網址 依賴代碼: <dependency> ​ <groupId

原创 服務器使用筆記(四):後臺如何直接運行服務器代碼?

最近用服務器跑實驗碰上了一些很頭疼的問題: 我要跑的實驗很多,我需要打開很多個服務器的終端窗口去運行不同的實驗; 每次自己的電腦要開着才能繼續跑實驗,關閉了,就連接不上遠程服務器了。 基於這兩點痛點,目前找到了一個解決的方法,

原创 LibRec 學習筆記(二):如何成功運行 LibRec 官方提供的code snippet?

首先,Librec官方針對librec-core 2.0 提供的code snippet鏈接在此,該代碼只適用於2.0。 我這裏直接使用的是librec-core 3.0,官方提供的針對3.0 提供的code snippet鏈接在

原创 LibRec 學習筆記(五):使用 LibRec 快速復現 BPR 算法以及對比它的改進算法

這是目錄一、BPR 的介紹二、近年來在 BPR 上的經典改進算法1、WBPR2、GBPR3、SBPR4、AoBPR5、MBPR三、實驗比較BPR算法以及它的改進算法1、使用數據集 Filmtrust 進行實驗2、使用數據集 Epi

原创 推薦系統常見問題(二):可以使用評分預測方法去做TopN推薦嗎?

問題:可以使用評分預測方法去做TopN推薦嗎? 專業回答:是可以的,但是效果可能沒有直接使用排序方法進行推薦的好,並且有官方文檔的說法是“Ranking recommended rating procedures using th

原创 LibRec 學習筆記(九):如何利用已有輪子 LibRec 庫實現自己的推薦算法?

在我看來,東北大學郭貴兵老師的 LibRec 推薦算法開源庫真的是幫了我這種學術小菜鳥很多忙,它幫助我們復現了很多學術論文的方法,同時給予我們很大的方便去自主復現頂會論文。那作爲學術小菜鳥的我如果想要寫自己的推薦算法,怎麼辦呢?

原创 【工具使用】設置Spyder的緩衝區域大小

每次想要看完整的輸出內容,而sypder的輸出框不能夠完全顯示出來,所以可以設置它的緩衝區域大小 設置上面這個地方,然後重啓運行就OK

原创 【工具使用】Git、GitHub常用操作總結

之前一直分不清楚Git和GitHub的區別,最近仔細的學習了一下:Git是分佈式版本控制工具,而GitHub是託管代碼的地方,我們可以使用Git工具將自己的代碼上傳到遠程服務器,也就是GitHub上面進行託管。 Git軟件下載: