原创 python常用庫 - NumPy 和 sklearn入門

  Numpy 和 scikit-learn 都是python常用的第三方庫。numpy庫可以用來存儲和處理大型矩陣,並且在一定程度上彌補了python在運算效率上的不足,正是因爲numpy的存在使得python成爲數值計算領

原创 機器學習中特徵的處理及選擇

基礎概念 特徵工程是通過對原始數據的處理和加工,將原始數據屬性通過處理轉換爲數據特徵的過程,屬性是數據本身具有的維度,特徵是數據中所呈現出來的某一種重要的特性,通常是通過屬性的計算,組合或轉換得到的。比如主成分分析就是將大量的數據屬

原创 TensorFlow機器學習:如何實現線性迴歸?

設想你要繪製降雨頻率與農作物產量間的相關性圖。你也許會觀察到隨着降雨量的增加農業生產率也會增加。通過對這些數據擬合一條線,你可以預測不同降雨條件下的農業生產率。如果你能夠從幾個數據點發現隱式函數關係,那麼你就可以利用此學習到的函數來預測

原创 李航博士的《淺談我對機器學習的理解》 機器學習與自然語言處理

 實話說,機器學習很難,非常難,要做到完全瞭解算法的流程、特點、實現方法,並在正確的數據面前選擇正確的方法再進行優化得到最優效果,我覺得沒有個八年十年的刻苦鑽研是不可能的事情。其實整個人工智能範疇都屬於科研難題,包括模式識別、機器學習、搜

原创 無監督特徵學習(半監督學習+自學習)

綜述 如果已經有一個足夠強大的機器學習算法,爲了獲得更好的性能,最靠譜的方法之一是給這個算法以更多的數據。機器學習界甚至有個說法:“有時候勝出者並非有最好的算法,而是有更多的數據。” 人們總是可以嘗試獲取更多的已標註數據,但是這樣做

原创 離散型特徵編碼方式:one-hot與啞變量*

  在機器學習問題中,我們通過訓練數據集學習得到的其實就是一組模型的參數,然後通過學習得到的參數確定模型的表示,最後用這個模型再去進行我們後續的預測分類等工作。在模型訓練過程中,我們會對訓練數據集進行抽象、抽取大量特徵,這些特徵

原创 【機器學習】半監督學習

傳統的機器學習技術分爲兩類,一類是無監督學習,一類是監督學習。 無監督學習只利用未標記的樣本集,而監督學習則只利用標記的樣本集進行學習。 但在很多實際問題中,只有少量的帶有標記的數據,因爲對數據進行標記的代價有時很高,比如在生物學

原创 關於UEFI

什麼是UEFI 簡單來講,是在硬件及操作系統之間的接口,如下圖: UEFI的優點 開發效率高 採用C/C++語言編寫 軟件分層結 可擴展性 以module的形式,如Driver的模型 驅動、表、protocol有版本控制

原创 Deep Learning(深度學習)學習筆記整理系列

[email protected] http://blog.csdn.net/zouxy09 原作者:Zouxy 聲明: 1)該Deep Learning的學習系列是整理自網上很大牛和機器學習專家所無私奉獻的資料的。具體引用的資料請看參

原创 智能運維(AIOps)系統中的異常檢測方案

https://mp.weixin.qq.com/s/okKnaqJVV7bfS1_iUtdIWg 1.概覽 異常檢測是智能運維(AIOps)系統中一項基礎且重要功能,其旨在通過算法自動地發現KPI時間序列數據中的異常波動,爲後續的告警、

原创 隨機森林(Random Forests)介紹

1.決策樹(Decision Tree) 決策樹是一種樹形結構,其中每個內部節點表示一個屬性上的測試,每個分支代表一個測試輸出,每個葉節點代表一種類別。常見的決策樹算法有C4.5、ID3和CART。ID3算法用的是信息增益,C4.5算法用

原创 YOLOv2 論文筆記

論文地址:YOLO9000: Better, Faster, Stronger 項目主頁:YOLO: Real-Time Object Detection (最近博客下很多人請求Caffe 代碼,受人所託,已經不再提供,且關閉本文評

原创 隨機森林算法(有監督學習)

一、隨機森林算法的基本思想   隨機森林的出現主要是爲了解單一決策樹可能出現的很大誤差和overfitting的問題。這個算法的核心思想就是將多個不同的決策樹進行組合,利用這種組合降低單一決策樹有可能帶來的片面性和判斷不準確性。

原创 清華教授解密AIOps:智能運維如何落地?

隨着 AI 技術在各個應用領域的落地及實踐,IT 運維也將迎來一個智能化運維的新時代。算法的效率提升了 AIOps 的價值,通過持續學習,智能運維將把運維人員從紛繁複雜的告警和噪音中解放出來。 那麼,基於算法的 IT 運維與自動化運維的區

原创 主成分分析法Principal component analysis (PCA)介紹

1.簡介 Principal component analysis (PCA) is a statistical procedure that uses an orthogonal transformation to convert a