原创 實踐雜談(2)-- 圖解 Google Customer Search API 使用全流程

在項目過程中,如果要用到搜索引擎的結果的話,Google提供的API無疑是強大的工具。本文便來詳細介紹如何使用Google Customer Search API 進行詞條搜索,並介紹在命令行 / 終端下調用該API的方法。API的官方網

原创 學習筆記 -- 斯坦福課程:CNN for Visual Recognition(一)

去年就想聽聽這“接地氣”的課程了,但最終也沒有堅持下來。今年既然有了在線的課程視頻,我也開個筆記系列,好好地從基礎開始學起吧。由於課程內容還是比較基礎,這裏只紀錄一些個人覺得有趣或者有用的點,更多的內容大家直接去網站上看吧,相信會有不少收

原创 重溫線性代數(3)——正交、投影

        線性代數是數學中的基礎,也是十分重要的數學工具。在接觸機器學習之後,我逐漸認識到了線性代數的重要性,矩陣運算,優化求解,都離不開線性代數的知識。同時,我也發現了自己數學基礎的嚴重不足,急需好好重學一遍線性代數,爲之後的學習

原创 七小時 Theano 入門(Day 2)

本文是“七小時Theano入門”系列的第二篇文章,第一篇請看這裏:七小時 Theano 入門(Day 1) 本文大部分參考資料來源於(其中介紹爲網絡評論): 1. theano_exercise:適合從零開始的學習,每個exercise

原创 七小時 Theano 入門(Day 1)

前言 下週又要開始實習了。想着在此之前再學一些實用的東西,臨陣磨磨槍,於是便有了這個專題。Theano 是現在熱門的幾個深度學習工具庫之一,基於python,簡單易用。雖然現在有不少好用的基於 Theano 的庫(如Keras, Lasa

原创 課程總結 -- 自然語言處理

這學期修了 Prof. Daniel Gildea 的 Statistical Speech and Language Processing 課程。作爲 machine learning 的進階課程,這門課的確難度不小。本文記錄了這兩天覆

原创 在博客中用latex寫公式

原文鏈接:Rachel Zhang 在博客中用latex寫公式 在博客中插入Latex 公式的方法: 1. 訪問Latex在線編輯器,將下方code複製到博客中的源代碼裏,如: [plain] view plainc

原创 三個角度看SVM(1)——最大間隔分類器

“橫看成嶺側成峯,遠近高低各不同。” 支持向量機(Support Vector Machine, SVM)作爲一個被廣泛應用的有監督機器學習算法,網絡上對它的介紹數不勝數,其中更有不少好文佳作。本文與它們的區別在於:並不着重於“教程式”地

原创 實踐雜談(3)—— Python實用技巧(一)

1. 異常處理 異常處理(exception handling)是編程中的一項重要技巧,也是容易被人忽視的一項。我們常常會忽視異常處理的重要性:它能使程序變得更具有魯棒性,減少程序發生嚴重突發問題的機率,也能使程序更易於調試。尤其是在以下

原创 MAC OS X10.10下Caffe無腦安裝(CPU ONLY)

最近心血來潮,想趁着實習之前一週空閒的時間玩玩各種 Deep Learning 的熱門工具(Caffe, Theano 之類),結果卻深陷安裝和配置環境的痛苦當中。。。安裝Caffe花費了我兩天時間,在各種文檔教程中繞了不少圈子。據不完全

原创 課程總結 -- CPU/GPU並行計算基礎(CPU篇)

上學期選修了Prof. Tolga Soyata的“GPU Parallel Programming using C/C++”課程。該課程主要分兩部分:前半部分通過講解CPU並行程序來介紹並行計算的原理和思路;後半部分講解如何用CUDA在

原创 學習筆記 ——深度學習和機器視覺

一直自稱研究方向是“機器視覺、機器學習和深度學習”,然而除了做過幾個相關的項目以外,感覺自己對這個領域並沒有足夠深入的認識和理解。趁着這個假期我要好好補補課了。今天先來看一些high level的內容,看看深度學習近期的最近進展以及其在機

原创 Jordan推薦機器學習書籍

最近閒下來了,開始重拾每天讀書的習慣。 先從刨書單開始!這個是之前收藏的據說是大神Jordan推薦的ML數據,其中包括了統計、Bayesian、優化等各方面的基礎知識,是打內功的必備書單。趁着還沒開始念碩士,趕緊補補習吧!我會從"St

原创 實踐雜談(1)—— Bash腳本實現並行化和進程數控制

在項目過程中,我們常常需要對大量文件進行批量處理。然而,如果每個文件都需要一定的處理時間,而文件數量又很大,逐個的處理會耗費大量的時間,大大影響工作的效率。這時,如果各個文件的處理是相互獨立的話,我們自然希望多個文件能夠並行化地進行處理,

原创 淺談NoSQL數據庫

這學期修的數據庫系統需要寫一篇有關NoSQL數據庫的文章。這兩天查閱了不少資料,終於憋出了2000字來。雖然理解並不深入,但也算對這方面內容有所瞭解了。文章先介紹了NoSQL數據庫興起的動機,以及在哪些場合下推薦或不支持使用NoSQL數據