原创 經典算法·求解:決策樹

經典算法·求解系列(2)1、決策樹1.1 前置知識1.1.1 純度、信息熵1.1.2 信息增益1.1.3 信息增益率1.1.4 基尼係數1.2 代碼(以CART爲例)1.2.1 基尼係數1.3 使用場景 1、決策樹 1.1 前置知

原创 經典算法·求解:K-Means

經典算法·求解系列(3)1、K-Means1.1 K-Means的工作原理1.2 K的確定1.3 評估指標1.4 其他變種1.5 使用場景 1、K-Means 1.1 K-Means的工作原理 初始化常數 k ,隨機初始化 k 個

原创 數倉、畫像和推薦系統(4):精準營銷、用戶畫像

數倉、畫像和推薦系統(4)什麼是用戶畫像什麼是互聯網廣告廣告精準推送系統需求開發效果知識點睛 什麼是用戶畫像 用戶畫像:通過收集與分析用戶的社會屬性、生活習慣、消費行爲等數據,通過標籤化全面抽象出用戶的信息全貌 什麼是互聯網廣告

原创 數倉、畫像和推薦系統(3):數倉的一個案例

數倉、畫像和推薦系統(3)電商數倉項目ods層(原始數據層)用戶行爲業務數據dwd層(明細數據層)用戶行爲業務數據維度表事實表dws(數據服務層)ads(數據應用層)知識點睛 電商數倉項目 ods層(原始數據層) 用戶行爲 od

原创 2020·記錄阿里的一次面試(一)

2020·記錄阿里的一次面試(一)1、第2-N小時2、第24個小時以後(第二天上午10:36)3、電話面試前的最後1小時(第二天中午13:00)4、面試開始(第二天中午14:00)4.1 一問一答式4.2 你有什麼要問我的嗎?4.

原创 Flink Learning Project :基於Flink的實時熱門商品統計和訂單支付模塊

基於Flink的實時熱門商品統計和訂單支付模塊1、 版本&語言2、實時熱門商品統計(窗口聚合、窗口分組、TopN)2.1 需求2.2 數據2.2.1 數據來源2.2.2 數據存儲2.2.3 數據格式2.3 實現2.3.1 核心邏輯

原创 CTR預估模型演進史 · Deep&Cross、DIN、ESMM

CTR預估模型演進史 · Deep&Cross、DIN、ESMM1、Deep&Cross1.1 cross_layer2、DIN2.1 Dice激活函數2.2 Attention3、ESMM3.1 多任務學習3.2 多任務學習在推

原创 XGboost高頻面試

XGboost高頻面試1. 簡單介紹一下XGBoost2. XGBoost與GBDT有什麼不同3. XGBoost爲什麼使用泰勒二階展開4. XGBoost爲什麼可以並行訓練5. XGBoost爲什麼快6. XGBoost防止過擬

原创 知識分享·NLP中一些有趣的trick

知識分享·NLP中一些有趣的trick1、計算文本相似度1.1 編輯距離1.2 傑卡德係數(Jaccard 相似係數)1.3 詞頻統計1.4 餘弦相似度1.5 Word2Vec2、LDA3、文本聚類 1、計算文本相似度 1.1 編

原创 數據賦能·餐飲門店選址

數據賦能·餐飲門店選址1、賣什麼2、在哪裏 1、賣什麼 人均消費適中,性價比和口味得分較高的餐品 2、在哪裏 實際中要考慮小區、辦公樓、購物中心、房租、轉讓費、裝修費等多個因素(開源數據集中沒提供,所以此處僅考慮了 人流和

原创 Encoder-Decoder、Attention、Transformer

Encoder-Decoder、Attention、Transformer1、Encoder-Decoder2、Attention2.1 Soft Attention 公式求解2.2 代碼2.2.1 Encoder2.2.2 At

原创 基於時空序列的地鐵廣告投放和商業選址(KMeans+ROI)

基於時空序列的地鐵廣告投放和商業選址(KMeans+ROI)1、數據2、特徵3、項目展示 1、數據 數據用的是2020年3月天池公開賽《智慧物流:新冠期間餓了麼騎士行爲預估》 2、特徵 只對POI數據和時間數據進行特徵工程

原创 201X年度·微信個人收藏精選集(一)

201X年度·微信個人收藏精選集(一)1、DIKW金字塔2、爲什麼你的月薪一直破不了萬?3、選擇Offer要考慮哪些因素3.1 職業價值觀3.2 影響Offer選擇和將來發展的若干因素4、工作後該如何學習?5、技術精進之道6、程序

原创 201X年度·微信個人收藏精選集(二)

201X年度·微信個人收藏精選集(二)1、我20歲時不明白的事1.1 爲什麼我們上學時在找工作的時候總是如此管中窺豹,卻又執迷不悟。1.2 校招和社招2、單身是最好的升值期3、每個職場人都該知道的「30:30:30:10法則」4、

原创 1點兒優化:比較兩個List中是否有相同的String

一般寫法(雙層for循環+if語句)複雜 for(int i = 0; i < list2.size(); i++){ for(int j = 0; j < list3.size(); j++){ if(l