原创 機器學習項目基礎篇:Kaggle Titantic 生存預測比賽
https://zhuanlan.zhihu.com/p/30538352 https://mp.weixin.qq.com/s/86Wym8HFc55BnWN3qSMWwA https://mp.weixin.qq.com/s/FQjP
原创 一、語音特徵之基本特徵
一、短時平均過零率 理論分析: 過零率體現的是信號過零點的次數,體現的是頻率特性。因爲需要過零點,所以信號處理之前需要中心化處理。 作用: 1.可以用來初步判斷清音和濁音。 2.可以用於判斷寂靜無話段
原创 機器學習系列十五:集成學習之boosting:Adaboost
一.算法原理 Boosting的思路則是採用重賦權(re-weighting)法迭代地訓練基分類器,即對每一輪的訓練數據樣本賦予一個權重,並且每一輪樣本的權值分佈依賴上一輪的分類結果;基分類器之間採用序列式的線性加權方式進行組合。他通過迭
原创 機器學習系列十九:sklearn-GridSearchCV
一、簡介 GridSearchCV,它存在的意義就是自動調參,只要把參數輸進去,就能給出最優化的結果和參數。但是這個方法適合於小數據集,一旦數據的量級上去了,很難得出結果。這個時候就是需要動腦筋了。數據量比較大的時候可以使用一個快速調優的
原创 C++面試總結(六)雜記
1.malloc、free與new、delete的區別? 1)malloc是函數,而new是操作符 2)malloc申請內存時,需要我們指定申請的空間大小,且返回的類型爲void*,需要將其強制轉換爲所需類型指針;new申請內存時,會
原创 機器學習系列十四:集成學習之bagging
一、算法原理 1.算法描述 Bagging是Bootstrap AGGregatING的縮寫。Bagging基於自助採樣法(bootstrap sampling)。給定包含m個樣本的數據集,先隨機取出一個樣本放入採樣集中,再把該樣本放回初
原创 模型加速一:知識蒸餾(Knowledge Distillation)
一 背景 知識蒸餾(KD)是想將複雜模型(teacher)中的dark knowledge遷移到簡單模型(student)中去,一般來說,teacher具有強大的能力和表現,而student則更爲緊湊。通過知識蒸餾,希望student能儘
原创 機器學習系列十五:集成學習之boosting
1.算法原理 快寫完了,突然崩了~乾脆不寫了 https://blog.csdn.net/luanpeng825485697/article/details/79383492 1.Adaboost https://blog.csdn.ne
原创 加速卷積運算
解析卷積高速計算中的細節 超詳細的Tengine GEMM矩陣乘法彙編教程 Winograd,GEMM 卷積--加速的卷積運算
原创 深度學習框架學習一:深度學習框架介紹
現如今開源生態非常完善,深度學習相關的開源框架衆多,光是爲人熟知的就有caffe,tensorflow,pytorch/caffe2,keras,mxnet,paddldpaddle,theano,cntk,deeplearning4j,
原创 leetcode 9.迴文數
leetcode 9迴文數:判斷一個整數是否是迴文數。迴文數是指正序(從左向右)和倒序(從右向左)讀都是一樣的整數。 示例 1: 輸入: 121 輸出: true 示例 2: 輸入: -121 輸出: false 解釋: 從左向右讀
原创 機器學習系列十三:數據降維
一、算法原理 降維方法一般分爲線性降維方法和非線性降維方法,如下圖所示: 我們主要主要介紹PCA、LDA、LLE方法。 二、算法實踐 三、算法總結 四、面試題
原创 機器學習系列十二:支持向量機(SVM)
一、算法原理 二、算法實踐 三、算法總結 四、面試題
原创 機器學習項目入門篇:一個完整的機器學習項目
本部分,我們會作爲被一家地產公司僱傭的數據科學家,完整地學習一個項目。下面是主要步驟: 項目概述。 獲取數據。 發現並可視化數據,發現規律。 爲機器學習算法準備數據。 選擇模型,進行訓練。 微調模型。 給出解決方案。 部署、監控、維護系統
原创 目錄
C++面試 C++面試總結(一)常用關鍵字 C++面試總結(二)類 C++面試總結(三)模板與泛型編程 C++面試總結(四)標準庫 C++面試總結(五)C++ 11/14新特性 C++面試總結(六)雜記 Python之旅 Python之旅