原创 【校招面經】機器學習與數據挖掘常見面試題整理 part3

四十一、請簡要說說EM算法 有時候因爲樣本的產生和隱含變量有關(隱含變量是不能觀察的),而求模型的參數時一般採用最大似然估計,由於含有了隱含變量,所以對似然函數參數求導是求不出來的,這時可以採用EM算法來求模型的參數的(對應模型參數個數可

原创 【數據應用案例】美團外賣語音助手

案例來源:@美團技術團隊 案例地址:https://tech.meituan.com/herenqing_ai_con.html   0. 背景:騎手在配送時打電話有三個困難:     1)決策複雜:什麼時候打電話?打晚了影響配送速度,打

原创 【數據應用案例】醫院裏的男性就是醫生,女性就是護士?NLP 模型的性別偏見到底有多大?

案例來源:@WBLUE @Ben Packer @Yoni Halpern 案例地址:https://www.leiphone.com/news/201805/UPjA3tnsC9HY4SLx.html; https://chinagdg

原创 【校招面經】機器學習與數據挖掘常見面試題整理 part2

三十、隨機森林如何評估特徵重要性 衡量變量重要性的方法有兩種,Decrease GINI 和 Decrease Accuracy: 1) Decrease GINI: 對於迴歸問題,直接使用argmax(VarVarLeftVarRigh

原创 【數據應用技巧】阿里UC視頻推薦優化

案例來源:@阿里技術 案例地址:https://mp.weixin.qq.com/s/lb5b-7ImTI0hlFwIBkpqxQ   0. 背景:     視頻優化目標     1)感知相關性優化:CTR爲目標     2)真實相關性優

原创 【數據應用案例】隱私保護與PATE方法

案例來源:@百度安全實驗室 @AI科技評論 @雷鋒網 案例地址:http://www.freebuf.com/column/147115.html,https://mp.weixin.qq.com/s/k-nACTv7IhTgfevkdD

原创 【數據應用案例】AI算法與道德規則如何平衡?IBM推出AI推薦技術

案例來源:@雷鋒網 案例地址: https://www.leiphone.com/news/201807/b1qadmWOWgBYVs1b.html   1. 背景:現有推薦算法(如今日頭條、netflix)容易讓用戶進入“過濾泡泡”,高

原创 【校招面經】機器學習與數據挖掘常見面試題整理 part4

五十一、Hinge loss Hinge loss 的叫法來源於其損失函數的圖形,爲一個折線,通用的函數表達式爲: L(mi)=max(0,1−mi(w))   表示如果被正確分類,損失是0,否則損失就是 1−mi(w) 。 在機器學習

原创 【數據應用案例】微軟小冰英語作文改錯——通過全新學習和推斷機制提升seq2seq模型的語法改錯性能

案例來源:@微軟研究院AI頭條 案例地址:https://www.jiqizhixin.com/articles/2018-07-22-10   1. 目標:實現對英文作文的自動改錯(見:https://mp.weixin.qq.com/

原创 【數據應用技巧】基於快速GeoHash,實現海量商品與商圈的高效匹配

案例來源:@阿里技術 案例地址:https://mp.weixin.qq.com/s/vwhetMpQllczILptBNcoWg   0. 背景:閒魚每天都有海量商品位置(點數據)與大量商圈(面數據)的匹配問題,如果計算每個點落在哪個面

原创 【校招面經】統計與概率基礎 part1

注:以下是本人春招時看面經時收集的常見面試題,答案部分是由網上多個信息源整理而成,部分是個人解答。當時整理時只是自己看的,很多沒有註明來源地址,後續有時間補上來源,如有侵權請告知。   一、p值的含義 其實理解起來很簡單,基本原理只有3個

原创 【數據應用案例】騰訊知文團隊負責人鍾黎:從 0 到1 打造下一代智能對話引擎

案例來源:@AI科技評論 案例地址:https://mp.weixin.qq.com/s/621j43q_rTWYm3EupgsSGw   1. 目標:打造通用智能問答平臺   2. 智能問答平臺的三種類型:     1)任務驅動型:如查

原创 【數據應用案例】阿里巴巴客服助手_人機協作提高客服效率

案例來源:@阿里巴巴機器智能 案例地址:https://weibo.com/ttarticle/p/show?id=2309404343904739692374   一、背景 1. 阿里每天客服進線量大,除了機器客服外,人工客服仍不可避免

原创 【數據應用案例】關係數據的隱私保護

案例來源:@關會華 阿里技術 案例地址:https://mp.weixin.qq.com/s/4Eqh4p0j3cDj_0M4VAG-aA   0. 背景:     1)關係數據描述的是實體與實體之間的聯繫,如人與人之間的交際關係、企業與

原创 【數據應用案例】人羣優選算法模型,挖掘品牌潛客

案例來源:@阿里巴巴機器智能 案例地址:https://mp.weixin.qq.com/s/OF51cPHD7C3rfw-WW5NA3Q   導讀: 爲A電商做年貨節品牌營銷,目標是識別目標受衆,廣告投放後由“機會人羣”轉向“興趣人羣”