原创 【校招面經】機器學習與數據挖掘常見面試題整理 part3
四十一、請簡要說說EM算法 有時候因爲樣本的產生和隱含變量有關(隱含變量是不能觀察的),而求模型的參數時一般採用最大似然估計,由於含有了隱含變量,所以對似然函數參數求導是求不出來的,這時可以採用EM算法來求模型的參數的(對應模型參數個數可
原创 【數據應用案例】美團外賣語音助手
案例來源:@美團技術團隊 案例地址:https://tech.meituan.com/herenqing_ai_con.html 0. 背景:騎手在配送時打電話有三個困難: 1)決策複雜:什麼時候打電話?打晚了影響配送速度,打
原创 【數據應用案例】醫院裏的男性就是醫生,女性就是護士?NLP 模型的性別偏見到底有多大?
案例來源:@WBLUE @Ben Packer @Yoni Halpern 案例地址:https://www.leiphone.com/news/201805/UPjA3tnsC9HY4SLx.html; https://chinagdg
原创 【校招面經】機器學習與數據挖掘常見面試題整理 part2
三十、隨機森林如何評估特徵重要性 衡量變量重要性的方法有兩種,Decrease GINI 和 Decrease Accuracy: 1) Decrease GINI: 對於迴歸問題,直接使用argmax(VarVarLeftVarRigh
原创 【數據應用技巧】阿里UC視頻推薦優化
案例來源:@阿里技術 案例地址:https://mp.weixin.qq.com/s/lb5b-7ImTI0hlFwIBkpqxQ 0. 背景: 視頻優化目標 1)感知相關性優化:CTR爲目標 2)真實相關性優
原创 【數據應用案例】隱私保護與PATE方法
案例來源:@百度安全實驗室 @AI科技評論 @雷鋒網 案例地址:http://www.freebuf.com/column/147115.html,https://mp.weixin.qq.com/s/k-nACTv7IhTgfevkdD
原创 【數據應用案例】AI算法與道德規則如何平衡?IBM推出AI推薦技術
案例來源:@雷鋒網 案例地址: https://www.leiphone.com/news/201807/b1qadmWOWgBYVs1b.html 1. 背景:現有推薦算法(如今日頭條、netflix)容易讓用戶進入“過濾泡泡”,高
原创 【校招面經】機器學習與數據挖掘常見面試題整理 part4
五十一、Hinge loss Hinge loss 的叫法來源於其損失函數的圖形,爲一個折線,通用的函數表達式爲: L(mi)=max(0,1−mi(w)) 表示如果被正確分類,損失是0,否則損失就是 1−mi(w) 。 在機器學習
原创 【數據應用案例】微軟小冰英語作文改錯——通過全新學習和推斷機制提升seq2seq模型的語法改錯性能
案例來源:@微軟研究院AI頭條 案例地址:https://www.jiqizhixin.com/articles/2018-07-22-10 1. 目標:實現對英文作文的自動改錯(見:https://mp.weixin.qq.com/
原创 【數據應用技巧】基於快速GeoHash,實現海量商品與商圈的高效匹配
案例來源:@阿里技術 案例地址:https://mp.weixin.qq.com/s/vwhetMpQllczILptBNcoWg 0. 背景:閒魚每天都有海量商品位置(點數據)與大量商圈(面數據)的匹配問題,如果計算每個點落在哪個面
原创 【校招面經】統計與概率基礎 part1
注:以下是本人春招時看面經時收集的常見面試題,答案部分是由網上多個信息源整理而成,部分是個人解答。當時整理時只是自己看的,很多沒有註明來源地址,後續有時間補上來源,如有侵權請告知。 一、p值的含義 其實理解起來很簡單,基本原理只有3個
原创 【數據應用案例】騰訊知文團隊負責人鍾黎:從 0 到1 打造下一代智能對話引擎
案例來源:@AI科技評論 案例地址:https://mp.weixin.qq.com/s/621j43q_rTWYm3EupgsSGw 1. 目標:打造通用智能問答平臺 2. 智能問答平臺的三種類型: 1)任務驅動型:如查
原创 【數據應用案例】阿里巴巴客服助手_人機協作提高客服效率
案例來源:@阿里巴巴機器智能 案例地址:https://weibo.com/ttarticle/p/show?id=2309404343904739692374 一、背景 1. 阿里每天客服進線量大,除了機器客服外,人工客服仍不可避免
原创 【數據應用案例】關係數據的隱私保護
案例來源:@關會華 阿里技術 案例地址:https://mp.weixin.qq.com/s/4Eqh4p0j3cDj_0M4VAG-aA 0. 背景: 1)關係數據描述的是實體與實體之間的聯繫,如人與人之間的交際關係、企業與
原创 【數據應用案例】人羣優選算法模型,挖掘品牌潛客
案例來源:@阿里巴巴機器智能 案例地址:https://mp.weixin.qq.com/s/OF51cPHD7C3rfw-WW5NA3Q 導讀: 爲A電商做年貨節品牌營銷,目標是識別目標受衆,廣告投放後由“機會人羣”轉向“興趣人羣”