原创 梯度提升樹(GBDT)詳解之三:原理推導

本文是GBDT系列文章的最後一彈,它將側重梯度提升樹的原理及其中的數學推導。希望你在閱讀本文之前,對於將GBDT應用於迴歸和分類的技術細節都已經比較熟悉。對此,你可以參考系列文章中的前兩篇(參見文獻【1】和【2】)。 *本文是GBDT系列

原创 梯度提升樹(GBDT)詳解之二:分類舉例

在2006年12月召開的 IEEE 數據挖掘國際會議上(ICDM, International Conference on Data Mining),與會的各位專家選出了當時的十大數據挖掘算法( top 10 data mining al

原创 圖像處理中的數學修煉(第2版)上市:新舊版同時在售

自《圖像處理中的數學修煉》原書第一版於2017年2月上市以來,加印重印多次,在京東和噹噹等主流在線購書網站上已經累計有超過3200個有效購買評論,並且在這兩個網站上的好評度都超過99%。結合第一版書籍讀者給出的反饋,同時爲了適應相

原创 PRAM模型與Amdahl定律

PRAM 模型   並行計算中的並行隨機存取器(PRAM,parallel random access machine)模型是並行架構體系的一種理想化模型,最初由 Fortune 和 Wyllie 在 1978 提出。   PRAM 模型

原创 深度學習之Autoencoder及其在圖像去噪上的應用

導言:“自編碼器”(Autoencoder)是一種無監督的學習方法(更準確地用語應該是自監督),主要用於數據的降維或者特徵的抽取。在作用上有點類似於PCA、字典學習,或者壓縮感知。這裏的數據降維,也可以理解爲數據壓縮,總之就是給高維的原始

原创 孿生神經網絡(Siamese)比較兩個句子語義相似性

深度學習在自然語言處理(NLP)領域已經被廣泛應用,在傳統領域過去看似複雜的挑戰,也都已經取得了非常顯著的進步。本文主要從一道Kaggle實戰題目說起,並藉此爲例,展現深度學習在NLP上的一個應用。該實際問題可以被認爲是語義理解或神經翻譯

原创 清華出版社人工智能科學叢書:統計學習理論與方法

統計學習又稱統計機器學習或機器學習,是基於數據構建概率統計模型從而對數據進行預測與分析的一類方法。通常如果一個系統能夠通過執行某些步驟而實現自身性能上的改進,我們就稱該過程爲學習。而機器學習的目的就在於讓計算機系統能夠在數據之上結合統計方

原创 主定理(Master theorem)與Akra–Bazzi定理

一、主定理(Master theorem)   主定理是算法分析中的一個重要結論,它主要用於求解基於分治思想設計的遞歸算法的漸進複雜度。該結論最初由Jon Bentley, Dorothea Haken, 和James B. Saxe三位

原创 訂閱圖像處理專欄,獲取完整代碼

歡迎訂閱我的專欄【深入理解數字圖像處理】。本專欄是博客中圖像處理方面的精華文章集合,專注經典圖像處理算法的原理解析與編程實現,三十篇精華文章總計訪問量已超七十餘萬,熱門文章的主題包括(但不限於)自適應圖像去噪、圖像去霧(暗通道法、優化對比

原创 在Ubuntu 18.04中配置GPU環境:安裝CUDA 9.0等

前不久,國際計算機學會(ACM)決定將2018年度的圖靈獎授予Geoffrey Hinton、Yann LeCun,以及Yoshua Bengio,以表彰他們在深度學習領域所做出的開創性貢獻。事實上,在此前的三十年裏,這三人一直在神經網絡

原创 在Ubuntu 18.04安裝NVIDIA GPU驅動

隨着深度學習的持續火熱,Ubuntu系統得使用變得越來越廣泛。爲了配合深度學習的需求,現在Ubuntu系統也在持續提升它的方便性。通常,深度學習中需要使用GPU資源進行加速,但安裝和配置GPU計算環境往往比較複雜。幸運的是,在最新的 18

原创 在LLVM中編寫Backend Pass的詳細教程(2)

在上一篇文章中,我們已經講到編寫BackEnd Pass(或者說是Machine Pass)跟之前編寫普通Pass是有一定區別的。“Machine passes are determined by the backend code. Th

原创 逆向工具angr的快捷教程(1):安裝、排雷、CFG範例

Angr是一個基於Python開發的二進制程序分析(Binary analysis)框架,可以用於開展動態符號執行(Symbolic Execution)和多種靜態分析。作爲系列文章的第一篇,本文將介紹安裝angr的基本步驟,尤其是其中可

原创 樹(或有向無環圖)中根結點到所有葉子的路徑

問題:假設現在有一棵樹,注意這裏的樹不一定是二叉樹(也即可以是多叉樹),我們希望枚舉出從根結點到每一個葉子結點的路徑,這個算法該如何實現? 下面的例子主要採用Python來實現。爲了方便構建一棵樹(還有後面的有向圖),這裏直接使用Pyth

原创 Linux系統監控與分析工具Sysdig:安裝與使用

Sysdig是一個超級有用的系統工具,運行在Linux環境上,比 strace、tcpdump、lsof 加起來還強大。Sysdig可用來捕獲系統狀態信息,保存數據並進行過濾和分析。本文主要介紹在Linux上安裝Sysdig的基本步驟,然