原创 Deeplearning.ai課程筆記--彙總

從接觸機器學習就瞭解到Andrew Ng的機器學習課程,後來發現又出來深度學習課程,就開始在網易雲課堂上學習deeplearning.ai的課程,Andrew 的課真是的把深入淺出。當然學習這些課程還是要有一些基礎的。線性代數,高等數學的

原创 [機器學習] --- 參數優化與模型選擇

    一 交叉驗證 交叉驗證的目的 在實際訓練中,模型通常對訓練數據好,但是對訓練數據之外的數據擬合程度差。用於評價模型的泛化能力,從而進行模型選擇。 交叉驗證的基本思想 把在某種意義下將原始數據(dataset)進行分組,一部分做爲訓

原创 Keras 構建DNN 對用戶名檢測判斷是否爲非法用戶名(從數據預處理到模型在線預測)

一.  數據集的準備與預處理1 . 收集dataset (大量用戶名--包含正常用戶名與非法用戶名)包含兩個txt文件  legal_name.txt  ilegal_name.txt. 如下圖所示2. 用文件進行預處理# Data se

原创 資源 | 深度學習課程入門與介紹

【1】Andrew NG Deep Learning.ai http://deeplearning.ai/網易雲課堂(中文字幕):http://mooc.study.163.com/smartSpec/detail/1001319001.

原创 資源 | 普通程序員如何自學機器學習

機器學習工程師自學指南     本文將會介紹機器學習的方方面面,從簡單的線性迴歸到最新的神經網絡,你不僅僅能學會如何使用它們,並且還能從零進行構建。     以下內容以計算機視覺爲導向,這是學習一般知識的最快方法,並且你從中獲得的經驗可以

原创 [深度學習] 分佈式模式介紹 --- Tensorflow, Horovod

簡單介紹一下深度學習的分佈式訓練策略以及分佈式架構。 分佈式訓練策略 1.模型並行 所謂模型並行指的是將模型部署到很多設備上(設備可能分佈在不同機器上,下同)運行,比如多個機器的GPUs。當神經網絡模型很大時,由於顯存限制,它是難以在跑在

原创 通過keras例子理解LSTM 循環神經網絡(RNN)

博文的翻譯和實踐: Understanding Stateful LSTM Recurrent Neural Networks in Python with Keras正文一個強大而流行的循環神經網絡(RNN)的變種是長短期模型網絡(LS

原创 41 Essential Machine Learning Interview Questions (with answers)

Machine learning interview questions are an integral part of the data science interview and the path to becoming a data

原创 A Complete Machine Learning Walk-Through in Python

A Complete Machine Learning Project Walk-Through in Python: Part One A Complete Machine Learning Project Walk-Through i

原创 最優化方法:L1和L2正則化regularization

1. 正則化(Regularization) 機器學習中幾乎都可以看到損失函數後面會添加一個額外項,常用的額外項一般有兩種,一般英文稱作 ℓ1-norm和ℓ2-norm,中文稱作L1正則化和L2正則化,或者L1範數和L2範數。 L1正則化

原创 [機器學習] Boosting算法 --- AdaBoost、GBDT與XGBoost

一、提升算法概論 Boosting(提升)是一族可將弱學習器提升爲強學習器的算法。提升算法基於這樣一種思想:對於一個複雜的任務,將多個專家的判斷總和得出的結果要比任何一個專家單獨的判斷好。這族算法的工作機制類似:先從初始訓練集訓練出一個基

原创 [機器學習] 分類 --- Naive Bayes(樸素貝葉斯) 樸素貝葉斯理論推導與三種常見模型

Naive Bayes-樸素貝葉斯Bayes’ theorem(貝葉斯法則)在概率論和統計學中,Bayes’ theorem(貝葉斯法則)根據事件的先驗知識描述事件的概率。貝葉斯法則表達式如下所示P(A|B) – 在事件B下事件A發生的條

原创 [機器學習] AutoML --- 介紹

There are a number of auto-ml tools — H20, auto-sklearn, Google Cloud AutoML — and we will focus on TPOT: Tree-based Pi

原创 [機器學習]集成學習--bagging、boosting、stacking

集成學習簡介集成學習(ensemble learning)通過構建並結合多個學習器來完成學習任務。如何產生“好而不同”的個體學習器,是集成學習研究的核心。集成學習的思路是通過合併多個模型來提升機器學習性能,這種方法相較於當個單個模型通常能

原创 [機器學習] 分類 --- Support Vector Machine (SVM)

1. 基本概念 支持向量機(Support Vector Machine, SVM)的基本模型是在特徵空間上找到最佳的分離超平面使得訓練集上正負樣本間隔最大。SVM是用來解決二分類問題的有監督學習算法,在引入了核方法之後SVM也可以用來解