原创 序列特徵的處理方法之一:基於注意力機制方法

前言 之前兩篇講過稠密特徵和多值類別特徵加入CTR預估模型的常用處理方法,這篇介紹一下針對序列特徵採用的最基本的注意力機制方法。 我們都知道用戶在使用APP或網站的時候,用戶會產生一些針對物品的行爲,比如點擊感興趣的物品,收藏或購買物品等

原创 推薦算法相關名詞解釋(updating)

Click-through rate:點擊率 dense vector:稠密矩陣,例如 embedding vector etc. sparse vector: 稀疏矩陣,例如 one-hot vector etc.一般通過embeddi

原创 序列特徵的處理方法之二:基於卷積神經網絡方法

前言 上一篇文章介紹了基本的基於注意力機制方法對序列特徵的處理,這篇主要介紹一下基本的基於卷積神經網絡方法對序列特徵的處理,也就是TextCNN方法。序列特徵的介紹,背景以及應用可以參考上一篇的詳細介紹,這裏簡單回顧一下定義,用戶在使用A

原创 CTR預估模型的發展有這樣的規律

前深度學習時代 在深度學習還沒有引入到點擊率(Click-Through Rate,CTR)預估之前,CTR預估的模型大概經歷了三個階段:邏輯迴歸(Logistic Regression,LR),因子分解機(Factorization M

原创 利用rsync和ssh實現文件在本地和服務器之間批量傳輸

該種在服務器和客戶端之間傳送文件方法的好處是可以批量傳送文件,只要你想down下整個服務器都可以,沒有文件大小的限制。步驟如下: (1)先設置ssh免密登錄,具體步驟看我的博客:https://blog.csdn.net/m0_37922

原创 多值類別特徵加入CTR預估模型的方法

我們都知道一般單值類別特徵加入到CTR預估模型的方法是先對單值類別特徵進行one-hot,然後和embedding 矩陣相乘轉換成多維稠密特徵,如下圖 1 所示: ▲ 圖1. 單值類別特徵處理方法  上篇文章稠密特徵加入CTR預估模型的

原创 apt-get 常見操作

apt-get update 軟體資料庫同步:apt-get update 會根據 /etc/apt/sources.list 中設定到 APT Server 去更新軟體資料庫,在任何更新之前最好都先做這一個動作,讓軟體資料保持在最新的狀

原创 git和github的入門學習

學習的重要性: 要成為一個真正的軟體工程師(Software Engineer)除了掌握基礎開發能力外,更重要的是和其他工程師和開發者團隊合作和溝通的能力,所以若你能培養出掌握 Git 等版本控制操作和 Git server 架設的能力,

原创 sensetime 常用命令筆記

在pytorch下用 tensorboard: 安裝tensorboardX tensorflow   tensorflow-gpu 版本安裝:1.13.0 cuda 8.0 torch 0.4.1.post2 torchvision 0

原创 微信小程序授權登錄問題總結

明確微信小程序登錄流程 首先對於新用戶來說,後臺數據庫裏沒有用戶信息,因此首先用button讓用戶授權基本微信信息,然後調用wx.login()獲取臨時code,然後通過臨時code獲取用戶唯一openid,然後在數據庫建議一個表 裏面有

原创 推薦系統學習筆記與感悟(結合商湯做CV產品)

(1)深入理解推薦需求比算法更重要 (2)深入理解業務目標比算法更重要 (3)對數據的理解和處理比算法更重要 (4)對用戶的理解比算法更重要 (5)多個模型的融合可以提高預測準確性,但實際應用中需要權衡成本 (6)一個推薦系統應該從多個指

原创 微信小程序前端

前端中經常想把搜索框和tab分類框固定在頂端,而內容需要滑動。 因此可以把固定的組件放一個view 把滑動的放一個view 這時出現一個問題,發現滑動的內容view上面被固定的view擋住了, 這是就要用magin_top解決。首先查看固

原创 ssh 免密登錄方法步驟

主要分爲以下幾個步驟。 客戶端生成密鑰,包括私鑰和公鑰。 在服務器中配置客戶端的公鑰。 在客戶端配置服務器登錄相關參數。 1.客戶端生成密鑰,包括私鑰和公鑰 ssh-keygen -t rsa ssh-keygen -t rsa -C

原创 mmdetection 安裝與部署(針對cuda 9.0版本 sensetime服務器環境)

conda create -n open-mmlab python=3.6 -y source activate open-mmlab 代理設置:export http_proxy=http://172.16.16.251:8888;e

原创 tar命令分割文件方便上傳百度雲盤

要將data.tar分割成多個2G的文件,這樣不用會員就可以上傳到百度雲盤,可以用下面的命令:  tar cjf - data.tar |split -b 2048m - data.tar.bz2. 完成後會產生下列文件:  data.t