台部落SemolyChen

這個問題被面試官問到的概率極其高。網上給多解釋都是幾何理解。個人感覺有些牽強（或者是作者沒get到點）。總之，爲了避免再次被問到卡殼。搜了很多解釋。終於，找到了一個最好理解的答案。從數學角度去理解。原始的損失函數：Loss(w)。設其在

2020-05-04 16:38:52

準備知識（可選擇跳過） momentum 參數初始化：m:momentum 係數；lr：learning rate 學習率；權重w 計算梯度和更新數度：g(t);v(t) = m*v(t-1)+lr*g(t) 更新參數：w(t) = w

2020-05-01 21:09:14

爲什麼sgd不能在線預估學習 sgd是用一小批樣本計算梯度，在線小批樣本的梯度很容易導致模型學偏。而ftrl用了累計的梯度，在線學習不會導致模型學偏點贊收藏分享文章舉報

2020-02-21 12:42:13

hive 中的union all 必須保證兩張表的字段名需一致！否則就會報語法錯誤。

2018-11-04 09:51:17

這個問題算是很多公司面試初級算法工程師時經常提的問題，可以輕鬆的檢測面試的的算法基礎能力。根據這兩種算法理論以及應用場景總結有主要有以下幾種區別：1.損失函數不同LR：log lossSVM：hinge loss（常用來求解間距最大化問題

2018-09-06 03:41:24

要知道分類和聚類的區別，瞭解一下有監督學習和無監督學習。這兩個概念算是算法基礎，同時也是面試官經常會問到的(小姐姐我就被問到了，當然我回答上來了--)有監督學習訓練數據包括輸入（features）和輸出（lable）。常見的如：邏輯迴歸，

2018-09-06 03:41:24

2018-09-06 03:41:24

2018-09-06 03:41:24

信息熵是描述信息的混亂程度，也叫不確定程度。計算公式如下：根據公式可以得出以下2個重要的結論（理解這兩個結論，爲後續理解決策樹很有幫助哦）：1.信息熵事件可能出現的結果數量有關，在概率均等的情況下，存在的可能越多，信息熵越大，即事件的不確

2018-09-06 03:41:23