原创 markdown中的冷僻符號

大括號(記得兩邊都加上$): p=\left{ \begin{aligned} x & = & \cos(t) \ y & = & \sin(t) \ z & = & \frac xy \end{aligned} \right. 效果

原创 pyspark讀寫SequenceFile

完整代碼如下: # -*- coding: utf-8 -*- import sys reload(sys) sys.setdefaultencoding('utf-8') # @Author: appleyuchi # @Date:

原创 Error Based Pruning剪枝算法、代碼實現與舉例

EBP(Error Based Pruning): 下列算法轉載自鏈接: https://login.sina.com.cn/crossdomain2.php?action=login&entry=blog&r=http%3A%2F%

原创 Pessimistic Error Pruning example of C4.5

This example is from 《An Empirical Comparison of Pruning Methods for Decision Tree Induction》 How to read these node

原创 Pessimistic error pruning illustration with C4.5-python implemention

------------------get the datasets----------------------------------- We use the following datasets: https://archive.

原创 U25%(1,16) and U25%(1,168)on《C4.5:programs for machine learning》

when calculating UCFU_{CF}UCF​(e,N) CF: Confidence Level(here is 25%) e:misclassifying counts of current subtree we f

原创 maven構建scala工程並最終運行的所有細節(scala maven helloworld)

琢磨了很久,網上雖然各種例子,但是好多都是依賴IDE的,要麼就是生成jar文件後沒有主清單目錄,寫這篇博客一次性全部解決掉。 1,文件目錄 (python2.7) appleyuchi@ubuntu:~/Desktop/test3/sca

原创 C4.5-Release8的代碼架構圖

代碼鏈接: http://www.rulequest.com/Personal/c4.5r8.tar.gz file_structure.dot digraph abc { "c4.5.c"; "besttree.c"; "buil

原创 sbt構建一個spark工程(scala+spark+sbt)

準備工作,文件結構如下: (python2.7) appleyuchi@ubuntu:~/Desktop/WordCount$ tree . ├── build.sbt ├── src │        └── main │       

原创 俞馳-人生履歷

怕自己忘記,記錄下自己一生的軌跡吧。。。 6歲~8歲:寧波市北侖霞浦鎮水俞村大胡小學(當時一個年級只有一個班),上小學的路很遠很遠,常被野孩子霸凌,還好對方沒有太大的惡意。 班主任是黃還是王老師,記不清是哪個字,因爲那個時候對老師很尊

原创 hive與spark的匹配版本彙總

版本信息來自於hive的源碼包的pom.xml文件中,彙總下: apache-hive-1.2.2-src <spark.version>1.3.1</spark.version> apache-hive-2.1.1-src <spark

原创 Unable to load native-hadoop library for your platform

環境: ubuntu-linux 16.04 spark-2.3.1-bin-hadoop2.7 hadoop-2.7.7 可能的原因: 1.so文件版本不對 查看命令: file libhadoop.so.1.0.0 libhadoo

原创 maven零基礎從配置到運行helloworld(java maven helloworld)

首先是maven的安裝和配置 下載apache-maven-3.5.4 解壓到~/bigdata/apache-maven-3.5.4 ---------------------------~/.bashrc配置-------------

原创 sbt安裝、配置、運行(scala sbt helloworld)

下載sbt-1.1.6.tgz -------------------------------------------------------------------------------------------------------

原创 歷史上最早的PEP剪枝算法原理與現有PEP剪枝算法的細微差別

PEP:Pessimistic Error Pruning 本文分爲兩部分: 第一部分:1986年的PEP剪枝算法原理 第二部分:1997年的PEP剪枝算法原理以及與前者的區別 ----------------------------