原创 ESIM模型詳細解讀

由於最近2019中國高校計算機大賽——大數據挑戰賽使用到了ESIM模型,並且效果拔羣,所以在這裏特意寫一下,記錄下來。 感興趣代碼和比賽的:https://github.com/LiuYaKu/2019-rank5(我的top5代碼) 方

原创 解決機器學習問題的流程

確定問題類別 有監督或者無監督問題,是分類還是迴歸問題。 數據採集 使用爬蟲收集遠程監督數據,或者收集目前已有開源數據集。 數據清洗 對於收集來的數據進行清洗工作,比如異常值檢測(離羣點檢測),可以採用聚類方法k-means,找出離羣點,

原创 2019中國高校計算機大賽——大數據挑戰賽rank5總結

方案代碼及答辯ppt:https://github.com/LiuYaKu/2019-rank5 一、賽題分析: 評價指標qauc,qauc爲不同query下auc的平均值:                                

原创 2018騰訊廣告算法大賽總結

        這是本人寫的第一篇博客,小白一枚,如有錯誤的地方,歡迎大佬們批評指教。        首先這次的競賽讓人受益匪淺,那龐大的數據量,讓人感嘆這是一場有錢人的遊戲。感謝學校的服務器,幾乎沒休止的轉了一個多月,哈哈哈。