原创 matlab 安裝 cvx 和 mosek 以及 gurobi

cvx 是一個凸優化的包(下載頁面:http://cvxr.com/cvx/download/),這裏介紹一下如何給 matlab 安裝 cvx,並且安裝 mosek 和 gurobi 求解器。當然,安裝 mosek 和 gurobi 求

原创 分詞註記

這篇文章主要記錄一下對各個分詞工具的配置問題,算是對自己踩過坑的一些總結和引導吧。 哈工大 LTP 哈工大 LTP 的主頁在 http://ltp.ai/index.html ,ltp 還出了語言云,也可以使用以下。這裏主要提一下 ltp

原创 用Python 爬蟲爬取貼吧圖片

之前一直在看機器學習,遇到了一些需要爬取數據的內容,於是稍微看了看Python爬蟲,在此適當做一個記錄。我也沒有深入研究爬蟲,大部分均是參考了網上的資源。 先推薦兩個Python爬蟲的教程,網址分別是http://cuiqingcai.c

原创 Python 3下Matplotlib畫圖中文顯示亂碼的解決方法

Matplotlib是Python的一個很好的繪圖包,但是其本身並不支持中文(貌似其默認配置中沒有中文字體),所以如果繪圖中出現了中文,就會出現亂碼。 在《用Python作科學計算》一書中,有一個最小二乘擬合的例子,我用Python 3.

原创 矢量繪圖工具 Ipe

安裝 關於 Ipe的介紹可見官網: http://ipe.otfried.org/ ,在 Windows 和 Mac 下均有安裝包安裝,在Ubuntu下,我一開始是下載了ipe-7.2.1-src.tar.gz 文件想編譯安裝,無奈遇到錯

原创 Python 批量刪除文件夾下面指定類型的所有文件

有時候需要刪除某個文件夾及其子文件夾下面的某個類型的所有文件, 比如所有的txt文檔,所有的非cpp文檔等等,這可以編寫 Python 腳本實現。 其實這個需求由來已久,因爲之前一直聽說編寫Python腳本能夠簡化日常工作,確實,要是自己

原创 詞向量註記

搞自然語言處理,肯定還是要涉及詞向量的,因此準備寫下這篇博客,把一些零散的東西做做記錄。 谷歌 word2vec 在 mac 下安裝的問題 word2vec 項目的主頁在:https://code.google.com/archive/p

原创 Word2016 中插入數學公式和代碼高亮

插入數學公式 在 Word 中插入數學公式始終是一件頭疼的事情,之前我用的是 MathType,後來發現 Word 自帶的公式編輯器也越來越好了,到了 Office 2016 ,已經還算可以了。所以儘量使用較新版本的 Office。 先來

原创 遠程給Linux 服務器安裝 Matlab R2014b

最近想給公司的服務器安裝一個 Matlab 試一下, 因此寫這篇博客把主要過程記錄下來。 安裝 我是通過 xshell 遠程連接的服務器, 然後通過 xftp 新建了一個 Softwares 文件夾, 並通過 xftp 把 Matlab

原创 讀書筆記---《集體智慧編程》第3章:發現羣組

1.關於聚類的理解 聚類實際上就是分類,對一些樣本(樣品)進行歸類分組。本章第一個例子是對99篇博客進行聚類,也就是說每一篇博客便是一個樣本。要分類就要有分類的標準(指標)。比如把人按地區、身高、體重分類,那地區、身高、體重就是指標。抽象

原创 使用 Adobe Acrobat 裁剪 PDF 白邊及其他操作

使用 adobe acrobat 可以很方便的對 pdf 文件進行一些操作,比如提取、刪除、合併頁面之類的。利用某些軟件畫圖時,生成的 pdf 文件可能有很多白邊,這樣在插入到文檔中的時候會有很大空白,這裏主要說一下給 pdf 文件裁剪白

原创 LaTeX 使用 minted宏包--代碼高亮

之前一直用 listings 宏包來設置代碼高亮,需要手動設置一下參數,比如我的如下: \usepackage{listings} \newfontfamily\courier{Courier New} \lstset{linewidth

原创 用Python實現牛頓法求極值

對於一個多元函數f(x)=f(x1,x2,⋯,xn) ,用牛頓法求其極小值的迭代格式爲 xk+1=xk−G−1kgk 其中g(x)=∇f(x) 爲函數f(x) 的梯度向量,G(x) 爲函數f(x) 的Hesse(Hessian)矩陣。

原创 用Python實現最速下降法求極值

對於一個多元函數f(x)=f(x1,x2,⋯,xn) ,用最速下降法(又稱梯度下降法)求其極小值的迭代格式爲 xk+1=xk+αkdk 其中dk=−gk=−∇f(xk) 爲負梯度方向,即最速下降方向,αk 爲搜索步長。 一般情況下,最優

原创 用Python 爬蟲批量下載PDF文檔

之前稍微看了用Python爬蟲爬取貼吧圖片的文章,發現用Python爬蟲確實方便。一個非常有用的東西便是自動下載網上的PDF文檔。下面就來舉兩個例子,程序主要參考自這篇文章:http://ddswhu.com/2015/03/25/pyt