原创 Ubuntu 下,安裝 Go 及 第三方包管理工具 glide

從 https://golang.org/dl/ 下載最新版本的Golang 筆者用的操作系統是 Ubuntu 14.04 LTS,下載的是 go1.10.1.linux-amd64.tar.gz。 解壓該壓縮文件 blockch

原创 Ubuntu 安裝 Node.js

點擊 Node.js官網,選擇相應版本 解壓該壓縮文件 blockchain@ThinkPad-T460:~$ tar xvJf Downloads/node-v8.11.2-linux-x64.tar.xz 配置環境變量 e

原创 Ubuntu 下,安裝 Java8

下載Java8 http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 打開上述鏈接, , 下載 特定的 Java

原创 Ubuntu 下,Zookeeper 3.4.13 單機部署

目錄安裝 Java下載 Zookeeper解壓 Zookeeper修改 Zookeeper 配置文件啓動 ZookeeperZookeeper 客戶端 安裝 Java https://blog.csdn.net/yitengton

原创 Ubuntu 下,spark 2.4.0 單機僞分佈式 搭建

友情提示:需要先安裝Java,可參考 https://blog.csdn.net/yitengtongweishi/article/details/81946349 目錄下載 Spark解壓配置環境變量配置 Spark啓動集羣 下

原创 ID3 決策樹

目錄西瓜數據集2.0求信息熵第一次劃分第二次劃分最終結果 西瓜數據集2.0 編號,色澤,根蒂,敲聲,紋理,臍部,觸感,好瓜 1, 青綠,蜷縮,濁響,清晰,凹陷,硬滑,是 2, 烏黑,蜷縮,沉悶,清晰,凹陷,硬滑,是 3,

原创 解決:Spark DataFrame 讀取 text(文本文件)亂碼

目錄問題描述解決方法 問題描述 * Usage example: * {{{ * spark.read.text("/path/to/spark/README.md") * }}} 目前,Spark

原创 Spark DataSource Option 參數

目錄parquetorccsvtextjdbclibsvmimagejsonxmlexcel parquet https://spark.apache.org/docs/latest/sql-data-sources-parque

原创 決策樹

目錄ID3C4.5CART ID3 信息增益 對 可取值數目 較多的屬性 有所偏好 C4.5 增益率 對 可取值數目 較少的屬性 有所偏好 C4.5 先從 候選劃分屬性 中 找出 信息增益 高於 平均水平的屬性,再從中選擇