进军Kaggle(二)

工具

为了管理python环境,需要使用conda,virtualenv之类的环境管理软件,方便切换各个版本,以及维护不同目的的环境。

选择深度学习软件

为了使用深度学习算法,我需要找到一个功能复杂、较新的深度学习软件。从框架角度,较好的选择是Theano和Caffe。Theano显得过于基础,Caffe又显得过于僵硬。
后来定下来使用Pylearn2,这是一个建立在Thenao之上的机器学习软件。
学习Pylearn2,从阅读tutorial开始。

Pylearn2 tutorial:

RBM with Gaussian function trained on cifar-10

Pylearn2官方在Quick-start中用到的例子就是在cifar-10数据集中使用高斯函数RBM训练模型。
简单按照教程走下来之后,完整的训练了一次模型。训练出来的filters结果如下:
filters

过程中遇到了PIL安装的困难,报错缺少文件。

error: no such file or directory: 'build/temp.macosx-10.10-intel-2.7/_imagingtk.o'

有人分析是因为pillow的bug造成的。另外有人指出可以通过以下办法解决:

sudo apt-get build-dep python-imaging

这个命令编译了python-imaging 的依赖项。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章