原创 深度學習-Caffe模型解析(不需要prototxt)和可視化

在模型訓練中,有時候需要把模型的權重可視化出來,檢查模型權重是否有問題。caffe模型中可視化往往需要一個prototxt文件,不是很方便,因此需要可以直接利用model解析的方法。 一、利用model和prototxt可視化 i

原创 機器學習-K-Means聚類算法的實現(含tensorflow實現版)

一、概述 K-means算法是集簡單和經典於一身的基於距離的聚類算法採用距離作爲相似性的評價指標,即認爲兩個對象的距離越近,其相似度就越大。該算法認爲類簇是由距離靠近的對象組成的,因此把得到緊湊且獨立的簇作爲最終目標。 二、k-m

原创 機器學習-邏輯斯特迴歸及其手寫實現梯度下降

一. 邏輯斯特迴歸簡介 本章介紹的另一種模型:模型斯特迴歸(logistic regression)。 它實質上是一個線性分類器。在之前介紹的線性分類器中,h(x)=Θ*x+Θ0,如果h(x)>0,則樣本x屬於正類,否定x屬於負類

原创 機器學習-樸素貝葉斯及其手寫實現

一、簡介 1、樸素貝葉斯的基本思想就是:給出一個分類問題,對於待求項,屬於哪個分類的概率最大,那這個待求項就屬於哪個分類。 2、如給出假設場景,要分類物有n個特徵,分別爲F1、F2、F3、…、Fn,現在有m個類別分別是C1、C2、

原创 機器學習-多元線性迴歸及其手寫實現梯度下降

一. 多元線性迴歸簡介 1.在迴歸分析中,如果有兩個或兩個以上的自變量,就稱爲多元迴歸。事實上,一種現象常常是與多個因素相聯繫的,由多個自變量的最優組合共同來預測或估計因變量,比只用一個自變量進行預測或估計更有效,更符合實際。因此

原创 Task3:特徵工程——二手車交易價格預測

一、特徵工程的常用方法 特徵工程的目的:通過上一步的特徵分析,去構建有效的特徵來擬合隱藏的規律。 常用方法: A. 異常處理: a) 通過箱線圖(或 3-Sigma)分析刪除異常值; b) BOX-COX 轉換(處理有偏分

原创 Task4:建模與調參——二手車交易價格預測

一、主要內容 線性迴歸模型: 線性迴歸對於特徵的要求; 處理長尾分佈; 理解線性迴歸模型; 模型性能驗證: 評價函數與目標函數; 交叉驗證方法; 留一驗證方法; 針對時間序列問題的驗證; 繪製學習率曲線; 繪製驗證曲線;

原创 Task2:數據的探索性分析(EDA)——二手車交易價格預測

數據的探索性分析(EDA)數據分析流程動手實踐 數據分析流程 目的: 主要爲了熟悉特徵。通過統計分析和可視化工具瞭解變量間的相互關係以及變量與預測值之間的存在關係,爲接下來的特徵工程作鋪墊。 載入數據 數據總覽: 通過descr

原创 Task5:模型融合——二手車交易價格預測

一、內容介紹 簡單加權融合: 迴歸(分類概率):算術平均融合(Arithmetic mean),幾何平均融合(Geometric mean); 分類:投票(Voting) 綜合:排序融合(Rank averaging),log

原创 李宏毅機器學習中文課程作業一:預測PM2.5值

一、作業要求 給定訓練集train.csv,要求根據前9個小時的空氣監測情況預測第10個小時的PM2.5含量。 訓練集介紹: CSV文件,包含臺灣豐原地區240天的氣象觀測資料(取每個月前20天的數據做訓練集,12月X20天=2

原创 李宏毅機器學習中文課程作業二:預測贏家還是輸家

一、作業要求 給定訓練集spam_train.csv,要求根據每個ID各種屬性值來判斷該ID對應角色是Winner還是Losser(收入是否大於50K),這是一個典型的二分類問題。 訓練集介紹: CSV文件,大小爲4000行X5

原创 有技巧的算法題

有技巧的算法題1. 快速矩陣冪運算計算遞推數列2. 遊戲裁判 1. 快速矩陣冪運算計算遞推數列 題目:遞推數列滿足規則:a[n] = a[n-1] + a[n-3] + a[n-4] 輸入數列爲:nums 求第n位的數 要求複雜度

原创 深度學習-常見的幾種Normalization算法

Batch Normalization (BN) Layer Normalization (LN) Instance Normalization (IN) Group Normalization (GN) 一、Batch No

原创 深度學習-CNN中池化層和卷積層的反向傳播

參考文獻: 1、 https://www.zhihu.com/question/58716267 2、 https://www.cnblogs.com/pinard/p/6494810.html 3、 https://blog.c

原创 機器學習-K-Means聚類算法的實現

一、概述 K-means算法是集簡單和經典於一身的基於距離的聚類算法採用距離作爲相似性的評價指標,即認爲兩個對象的距離越近,其相似度就越大。該算法認爲類簇是由距離靠近的對象組成的,因此把得到緊湊且獨立的簇作爲最終目標。 二、k-m