台部落菜鳥的征程

原创 Scala語言學習之環境安裝（1）

==> Scala語言簡介 --> Scala編程語言抓住了很多開發者的眼球。如果你粗略瀏覽Scala的網站，你會覺得Scala是一種純粹的面向對象編程語言，而又無縫地結合了命令式編程和函數式編程風格 --> 不

2019-09-30 14:44:27

原创 Storm 環境部署及簡單使用

===> 什麼是 Storm? --> Twitter將Storm正式開源了，這是一個分佈式的、容錯的實時計算系統,遵循 Eclipse Public License 1.0。 --> Storm是由BackTy

2019-07-05 14:42:52

原创 Spark SQL性能優化

==> 在內存中緩存數據 ---> 性能調優主要是將數據放入內存中操作 ---> 使用例子：// 從 Oracle 數據庫中讀取數據，生成 DataFrame val oracleDF = spark.read.format("

2019-02-22 18:57:28

原创 Spark 簡介

==> 什麼是 Spark ---> Spark 是一個針對大規模數據處理的快速通用引擎 ---> Spark 是 MapReduce 的替代方案，而且兼容 HDFS, Hive, 可容入Hadoop 的生態系統，彌補 MapR

2019-02-22 18:57:15

原创 Spark 算子

==> RDD是什麼? ---> RDD(Resilient Distributed Dataset) 彈性分佈式數據集，是 Spark 中最基本的數據抽象，它代表一個不可變，可分區，裏面的元素可並行計算的集合 ---> 特

2018-09-11 06:41:20

1

原创 Parquet介紹及簡單使用

==> 什麼是parquet Parquet 是列式存儲的一種文件類型==> 官網描述： Apache Parquet is a columnar storage format available to

2018-09-11 06:41:19

2

原创 SparkSQL簡單使用

==> 什麼是 Spark SQL？ ---> Spark SQL 是 Spark 用來處理結構化數據的一個模塊 ---> 作用：提供一個編程抽象（DataFrame）並且作爲分佈式 SQL 查詢引擎 ---> 運行原理

2018-09-11 06:41:19

原创 Scala 語言學習之泛型（7）

==> 泛型類 ---> T 可以代表任意類型class Person[T]{ private var name:T = _ def setName(name:T) = {this.name = name} de

2018-09-11 06:41:19

原创 Spark 環境部署

==> Spark 集羣體系結構 ---> ==> Spark安裝與部署 Spark 的安裝部署有四種模式：Standalone, YARN, Mesos, Amazon EC2, 這裏主要講解Standalone

2018-09-11 06:41:19

原创用 ipdb 調試 Python 程序

==> 安裝　　pip install ipdb==> 使用 ---> python -m ipdb xxx.py　　程序內部：　from ipdb import set_trace set_trace()==> 常用命令ENTER(

2018-09-11 06:41:19

5

7

原创 Scala語言學習之環境安裝（1）

原创 Storm 環境部署及簡單使用

原创 Spark SQL性能優化

原创 Spark 簡介

原创 Spark 算子

原创 Parquet介紹及簡單使用

原创 SparkSQL簡單使用

原创 Scala 語言學習之泛型（7）

原创 Spark 環境部署

原创用 ipdb 調試 Python 程序

原创 pycharm 遠程執行服務器代碼控制檯輸出亂碼問題

原创使用 Scala 寫WordContext程序

原创 git 創建本地倉庫與 gitcafe 關聯

原创 Scala語言之高階函數（4）

原创 redhat7.4修改yum 源爲CentOS網易yum源