为了记录,也为了日后重温,更为了交学习报告,决定写下每天的学习情况
先贴点学习资料网站什么的:
http://www2.cs.uregina.ca/~dbd/cs831/index.html(刚好有weka,kdd的介绍,更刚好又C4.5)
"Quinlan" "C4. 5: programs for machine learning"的电子版,可惜不能下
关于C4.5的介绍暂时略。
本来想看weka的源码的,可以根本就是白费工,Java才刚学,杯具.....
第一天分析:
结合这个网页的资料:
http://www2.cs.uregina.ca/~dbd/cs831/notes/ml/dtrees/c4.5/tutorial.html
下载里面的源码:c4.5r8.tar.gz
因为是"C4.5 Release 8 Installation Instructions for UNIX"
所以只好弄到我的虚拟机里的linux(ubuntu)里了。
然后按照这个:
- Download the C4.5 source code.
- Decompress the archive:
- Type "tar xvzf c4.5r8.tar" (not universally supported), or, alternatively,
- Type "gunzip c4.5r8.tar.gz" to decompress the gzip archive, and then
Type "tar xvf c4.5r8.tar" to decompress the tar archive. - Change to ./R8/Src
- Type "make all" to compile the executables.
- Put the executables into a "bin" subdirectory and include it in the path for command-line usage.
弄好就可以用了。
源码就在 R8/Src里
先从 c4.5.c 这个文件开始吧。看着代码才发现自己的C/C++水平很菜!分析的不对请指出。
杯具一次插不完 - -! 略掉一部分不是很重要的继续插 - -!