原创 機器學習項目基礎篇:Kaggle Titantic 生存預測比賽

https://zhuanlan.zhihu.com/p/30538352 https://mp.weixin.qq.com/s/86Wym8HFc55BnWN3qSMWwA https://mp.weixin.qq.com/s/FQjP

原创 一、語音特徵之基本特徵

一、短時平均過零率 理論分析:        過零率體現的是信號過零點的次數,體現的是頻率特性。因爲需要過零點,所以信號處理之前需要中心化處理。 作用:       1.可以用來初步判斷清音和濁音。       2.可以用於判斷寂靜無話段

原创 機器學習系列十五:集成學習之boosting:Adaboost

一.算法原理 Boosting的思路則是採用重賦權(re-weighting)法迭代地訓練基分類器,即對每一輪的訓練數據樣本賦予一個權重,並且每一輪樣本的權值分佈依賴上一輪的分類結果;基分類器之間採用序列式的線性加權方式進行組合。他通過迭

原创 機器學習系列十九:sklearn-GridSearchCV

一、簡介 GridSearchCV,它存在的意義就是自動調參,只要把參數輸進去,就能給出最優化的結果和參數。但是這個方法適合於小數據集,一旦數據的量級上去了,很難得出結果。這個時候就是需要動腦筋了。數據量比較大的時候可以使用一個快速調優的

原创 C++面試總結(六)雜記

1.malloc、free與new、delete的區別?  1)malloc是函數,而new是操作符  2)malloc申請內存時,需要我們指定申請的空間大小,且返回的類型爲void*,需要將其強制轉換爲所需類型指針;new申請內存時,會

原创 機器學習系列十四:集成學習之bagging

一、算法原理 1.算法描述 Bagging是Bootstrap AGGregatING的縮寫。Bagging基於自助採樣法(bootstrap sampling)。給定包含m個樣本的數據集,先隨機取出一個樣本放入採樣集中,再把該樣本放回初

原创 模型加速一:知識蒸餾(Knowledge Distillation)

一 背景 知識蒸餾(KD)是想將複雜模型(teacher)中的dark knowledge遷移到簡單模型(student)中去,一般來說,teacher具有強大的能力和表現,而student則更爲緊湊。通過知識蒸餾,希望student能儘

原创 機器學習系列十五:集成學習之boosting

1.算法原理 快寫完了,突然崩了~乾脆不寫了 https://blog.csdn.net/luanpeng825485697/article/details/79383492 1.Adaboost https://blog.csdn.ne

原创 加速卷積運算

解析卷積高速計算中的細節 超詳細的Tengine GEMM矩陣乘法彙編教程 Winograd,GEMM 卷積--加速的卷積運算

原创 深度學習框架學習一:深度學習框架介紹

現如今開源生態非常完善,深度學習相關的開源框架衆多,光是爲人熟知的就有caffe,tensorflow,pytorch/caffe2,keras,mxnet,paddldpaddle,theano,cntk,deeplearning4j,

原创 leetcode 9.迴文數

leetcode 9迴文數:判斷一個整數是否是迴文數。迴文數是指正序(從左向右)和倒序(從右向左)讀都是一樣的整數。 示例 1: 輸入: 121 輸出: true 示例 2: 輸入: -121 輸出: false 解釋: 從左向右讀

原创 機器學習系列十三:數據降維

一、算法原理 降維方法一般分爲線性降維方法和非線性降維方法,如下圖所示: 我們主要主要介紹PCA、LDA、LLE方法。 二、算法實踐 三、算法總結 四、面試題

原创 機器學習系列十二:支持向量機(SVM)

一、算法原理 二、算法實踐 三、算法總結 四、面試題

原创 機器學習項目入門篇:一個完整的機器學習項目

本部分,我們會作爲被一家地產公司僱傭的數據科學家,完整地學習一個項目。下面是主要步驟: 項目概述。 獲取數據。 發現並可視化數據,發現規律。 爲機器學習算法準備數據。 選擇模型,進行訓練。 微調模型。 給出解決方案。 部署、監控、維護系統

原创 目錄

C++面試 C++面試總結(一)常用關鍵字 C++面試總結(二)類 C++面試總結(三)模板與泛型編程 C++面試總結(四)標準庫 C++面試總結(五)C++ 11/14新特性 C++面試總結(六)雜記 Python之旅 Python之旅