原创 工業界常用推薦算法的升級之路

本文將介紹常見推薦算法的升級之路,覆蓋多數工業界中常用的各類模型。 線性模型 邏輯迴歸LR 簡介 邏輯迴歸算法是一種監督學習分類算法,對特徵進行線性加權求和,通過Sigmoid變換將結果映射到0-1。 模型結構 假設n個特徵爲線性關係

原创 C++設計模式之工廠模式實例

工廠模式 工廠模式屬於創建型模式,大致可以分爲三類,簡單工廠模式、工廠方法模式、抽象工廠模式。 簡單工廠模式 簡單工廠模式的實質是由一個工廠類根據傳入的參數,動態決定應該創建哪一類產品類(這些產品類繼承自一個父類或接口)的實例。假設有一個

原创 Linux 三劍客之awk實戰

基本介紹 awk是Linux開發下常用的一種對文本進行處理的工具,具有十分強大的功能。數據可以來源於標準輸入、文件及外部變量,支持用戶自定義函數和動態正則表達式等高級功能,且擁有許多內置的功能和函數,是開發中的一件利器。 通常,awk是以

原创 LR損失函數推導

LR的推導 LR邏輯迴歸是一種監督學習分類算法,其實現了給定數據集到0,1的一種映射。 給定數據集D={(x1,y1),(x2,y2),...,(xm,ym)},其中(xi,yi)表示第i個樣本,其中,xi=(xi1,xi2,...,xi

原创 基於CentOS 搭建gRPC框架

1. 簡介 RPC(remote procedure call 遠程過程調用)框架實際是提供了一套機制,使得應用程序之間可以進行通信,而且也遵從server/client模型。使用的時候客戶端調用server端提供的接口就像是調用本地的函

原创 mac iterm2 自動登錄服務器

由於mac還不支持xshell,xshell有按鈕功能能快速登錄服務器,iterm2是mac常用的ssh客戶端,下面,介紹如何利用iterm2快速登錄服務器。 1. 登錄遠程服務器 #!/usr/bin/expect set timeo

原创 解決iterm2使用vim亂碼亂行

在~/.vimrc中加入以下代碼 set fileencodings=utf-8,ucs-bom,gb18030,gbk,gb2312,cp936 set termencoding=utf-8 set encoding=utf-8

原创 推薦算法的升級之路

本文將介紹常見推薦算法的升級之路,從最初的LR到業界常用的DIN、DIEN等模型。 1. 線性模型 1.1 邏輯迴歸LR 簡介 邏輯迴歸算法是一種監督學習分類算法,對特徵進行線性加權求和,通過Sigmoid變換將結果映射到0-1。 模型結

原创 Xgboost與Gbdt的區別

GBDT以CART作爲基分類器,CART以gini指數選擇特徵,gini指數越小,純度越高。離散特徵會依次將每個取值作爲分割點計算gini係數,連續特徵會依次將連續兩個值的中間值作爲分割點,將數據分割爲S1和S2兩部分,並計算該分割點的g

原创 Visual Studio Code快捷鍵

通用 Ctrl+Shift+P, F1 打開命令面板 Ctrl+P 快速打開文件 Ctrl+Shift+N 打開新窗口/實例 Ctrl+Shift+W 關閉窗口/實例 基礎編輯 Ctrl+X 剪切當前行 Ctrl+C 複製當前行 Alt+

原创 g++ 常用鏈接參數

Linux上開發C++時,常需要添加第三方依賴,有以下幾種常用的參數: 1. -l(小寫L)      當庫文件在/lib、/usr/lib、/usr/local/lib三個目錄下時,可直接用-l鏈接。-l參數後緊跟庫名,庫名和庫文件名的

原创 Linux三劍客之sed實戰

基本介紹 sed是Linux中一種流編輯器,是文本處理非常有力的工具,支持將數據進行替換、刪除、新增、選取等功能。首先將決定選取哪些行進行編輯,規則可以是數字、正則表達式等,若沒有限制,則將處理輸入文件的所有行。在處理時,將當前行存儲在臨

原创 STL 源碼剖析之Vector

1. Vector 概念 作爲STL中常用的序列式容器,vector的數據安排與操作方式,與array都十分相似,它們唯一的差別是對於空間運用的靈活性。array稱爲靜態數組,一旦初始化則不能改變大小,而vector稱爲動態數組,隨着元素

原创 anaconda 安裝package提示PackagesNotFoundError

Linux下使用anaconda安裝package時,有時候會提示“PackagesNotFoundError: The following packages are not available from current channels

原创 Linux 三劍客之grep實戰

基本介紹 grep是Linux中一種強大的文本搜索工具,用於查找文件裏符合條件的字符串。grep全稱是Global Regular Expression Print,表示全局正則表達式版本,它的使用權限是所有用戶。若不指定任何文件名稱,或