原创 自動調參工具--貝葉斯調參

一般的方法就是網格搜索(sklearn裏面的gridsearch)、貝葉斯調參(hyperopt工具)。 http://www.360doc.com/content/18/0707/15/7669533_768542933.shtml

原创 Stacking結構介紹+代碼實現

stacking是這兩年打數據比賽被人熟知的方法,看了幾篇,感覺有幾個寫的不錯。 1.介紹篇:https://blog.csdn.net/wstcjf/article/details/77989963   2.代碼篇: https://b

原创 無監督算法彙總

1.EM 算法 原理解釋 + 例子分析+應用(GMM講解1+GMM講解2) 2.孤立森林 博客

原创 概率論的一些討論

1.假設檢驗 1)顯著性水平α a.小概率事件:我們將發生概率小於某個閾值的事件稱爲小概率事件,一般讓這個閾值=0.05(或者0.01),在假設檢驗中常記這個閾值爲α,稱爲顯著性水平。如果某件事的概率超過這個值,我們認爲它不是小概率事件,

原创 Mac 安裝SecureCRT

網上搜了這麼多,還是這個同學的方法詳細可行 https://blog.csdn.net/hc_mm/article/details/82657037

原创 Mac 安裝lightgbm指南

版本:10.13.6 先是按照官方指南做,然後有3個坑注意:   brew install gcc --without-multilib   這一步,顯示without-multilib是無效命令,我就直接brew install gcc

原创 有監督算法

1.邏輯迴歸

原创 PU learning 算法

一.背景介紹 原本是02年提出的一個算法,但是到去年8月份,關於PU learning 的博客介紹都很少(可參考性很差),前幾天做畢設,忽然欣喜地發現這半年裏陸續出現了幾篇關於該算法的文章,挺不錯,和大家分享一下。 1.去年我只找到了一篇

原创 上傳本地代碼到git hub

先參考文章1,然後執行到第五步的時候,需要在把本地密鑰加到github上,參考文章2,直接按第二條開始做就好,最後再把文章1的第六七步做完就好。  

原创 神經網絡的諸多問題

1.激活函數簡介 2.爲什麼sigmoid容易出現梯度消失

原创 研究生初學機器學習的幾點建議

      通過我自己的這大半年的接觸和了解,結合找工作需要現對於如何入門機器學習提幾點自己的看法。如果你以後要想幹算法工程師、機器學習工程師,數據挖掘工程師。那麼請你好好看一下我下面說的話。 ======================

原创 IJCAI-2018--廣告銷量預測 19/5200 思路

這次比賽的最大感受就是:別掉以輕心,初賽和複賽開始我們成績一直在前邊,導致心態太翹,該嘗試的探索的其他模型沒有去做,光在特徵上按照初賽思路去做,沒有絕殺技,導致有後手的把我們ko了。慘痛教訓。。。---------------------

原创 深度學習--神經網絡基礎篇

轉自我的簡書1轉自我的簡書2

原创 機器學習--模型比較篇

1.bagging & boosting1)樣本選擇上:Bagging:訓練集是在原始集中有放回選取的,從原始集中選出的各輪訓練集之間是獨立的。Boosting:每一輪的訓練集不變,只是訓練集中每個樣例在分類器中的權重發生變化。而權值是根

原创 推薦一個很全面的python安裝包下載的網址

Unofficial Windows Binaries for Python Extension Packageshttps://www.lfd.uci.edu/~gohlke/pythonlibs/#pillow