原创 AI Challenger 2018 農作物病害細粒度分類-----Pytorch 深度學習實戰

AI Challenger 2018 農作物病害細粒度分類 1 前言 2 代碼組織結構 3 完整流程解析      3.1 EDA      3.2 參數定義      3.3 數據加載過程      3.

原创 機器學習基石------Hazard of Overfitting

對於需要擬合的數據(x1,x2,x3…) 我們可以使用一個多項式取擬合這些數據 如果這些數據分佈 f(x) 爲二次函數 當我們使用一個好的VC dimension 即和原始分佈相似的VC dimension 那麼我們可以較好的擬合

原创 EDA 中常用函數總結----以科大訊飛營銷算法大賽爲例

PipeLine: 新增加的特徵: day:日期 hour:小時時間 user_tag_len: user_tag 進行split之後統計字段的數目 creative_area:長和寬的乘積 creative_area_type

原创 TensorFlow 模型保存,加載

文章目錄1.問題分析 1.問題分析 在使用中遇到模型保存和加載問題場景如下: 1.在我們訓練模型的過程中,經過若干個step,或者滿足某些條件(比如當前模型優於最優模型時)時,我們會在訓練過程中對模型進行保存,方便之後在此基礎上進

原创 TensorFlow常用總結

文章目錄1.計算圖節點與Tensor2.tf.py_func使用 1.計算圖節點與Tensor TensorFlow計算圖中每一個節點都定義了一個計算,而計算的結果都通過Tensor 來保存,因此Tensor和計算圖中節點對應的計

原创 2019大數據挑戰賽

文章目錄1.前言2.基礎知識準備2.1 語義相似度度量2.2 representation based model(表示模型)和 interaction based model(交互模型)2.3 point-wise,pair-w

原创 筆試總結----位運算

https://blog.csdn.net/xiaochunyong/article/details/7748713 Java中位運算主要包括 & (與) |(或)~(非) ^ (異或 ) >> (左移) >>(右移) >>

原创 面試算法總結----回溯(subset i, subset ii , permutation i , permutation ii, )

subset class Solution { List<List<Integer>> result=new ArrayList<>(); public List<List<Integer>> subsets(in

原创 面試問題總結----GBDT&LightGBM&Xgboost

1.信息熵 信息增益 信息增益率 基尼係數 在信號中每種信號出現的可能爲pi (對應到最簡單的二分類爲 0 出現的可能爲p0,1出現的可能爲p1) 我們使用-log pi 來表示這種不確定性 ,那麼對於所有信號的不確定性 很明顯需

原创 面試準備----深度學習

ResNet的網絡結構以及 ResNet和之前的網絡創新的地方 ResNet爲什麼要使用小的卷積核 反向傳播的推導 BN層以及DropOut層的作用 average pooling 和max pooling的意義和區別

原创 面試準備---- 交叉熵,相對熵(KL散度),softmax

1.信息熵 在信源中有n個獨立取值的信號,每種信號出現的可能性分佈爲 p1,p2 ,…pn,且各個符號的出現相互獨立,那麼整體信源的不確定性爲單個符號不確定性的統計平均值(單個信號不確定性爲 log(1/p)) 稱爲信息熵 即 H(U

原创 面試總結------SVM

SVM基本思想 SVM解決的是一個二分類問題 ,在特徵空間中尋找一個最優的超平面 將樣本能夠正確分開 同時使得樣本點到該超平面的距離最大 函數間隔與幾何間隔 給定數據集T和超平面 w,b 函數間隔可以表示爲 yi(wxi+b)

原创 CTR預估系列文章------NFFM

文章目錄NFFM文章解讀與源碼分析NFFM文章解讀輸入層Dense Embeddings 層 NFFM文章解讀與源碼分析 NFFM文章解讀 輸入層 首先 將用戶特徵,媒體特徵,上下文特徵等全部轉化爲特徵向量,如下所示: X=[x1,

原创 面試準備------筆試中的算法題

數組中有n個正整數,每次可以選擇其中一個數進行乘2或者除以2的操作(對於奇數除以2取其整數部分),求使得數組中的n個數變成相同的數的最小操作次數 樣例: 2,4,8 輸出 2(對2進行乘2操作,對8進行除以2操作) 3,7,14

原创 面試算法總結------動態規劃

動態規劃 動態規劃中最重要的兩點就是 1.確定狀態的定義,即將一個問題準確的定義爲某一個狀態方程 2.確定狀態轉移方程的定義 即將上述定義的狀態方程與其之前的狀態進行關聯 3.將狀態轉移過程中的中間變量進行保存 避免多次重複運算 1