台部落System

上一節，我們已經搭建好了HIVE，這一節我們來搭建Redis cluster集羣吧，現在都是環境搭建，後續的我們有了實際數據後會在這個集羣上來進行數據分析，讓我們一步一步的向錢推進吧?！ redis5.0.2集羣搭建（兩臺服務器6

2020-06-28 14:45:01

hiveserver2的配置和啓動在之前的講解中，我們已經安裝好啦Hive，那麼這次我們來配置好hiveserver2進行實際項目中操作Hive吧。 Hive安裝地址：Hive 安裝教程配置hive-site.xml 進入h

2020-06-28 14:45:01

特定區域人口變化模型（Scala+Hive）今天來寫一個新的模型，遇到一個問題。比如我想統計該數據源下一天內按時間分段求和，怎麼用SQL來搞定呢。之前也找過scala和java下的時間處理工具類，還是不如SQL來的方便。今天特此

2020-06-28 14:45:01

Scala方法的定義有參方法、無參方法 def fun (a: Int , b: Int ) : Unit = { println(a+b) } fun(1,1) def fun1 (a : Int , b :

2020-02-22 20:46:06

Shark 概念： Shark是基於Spark計算框架之上且兼容Hive語法的SQL執行引擎，由於底層的計算採用了Spark，性能比MapReduce的Hive普遍快2倍以上，當數據全部load在內存的話，將快10倍以上，因此S

2020-02-22 20:46:06

廣播變量和累加器廣播變量廣播變量理解圖廣播變量使用 val conf = new SparkConf() conf.setMaster("local").setAppName("brocast") val sc = ne

2020-02-22 20:46:06

Scala介紹 Spark1.6中使用的是Scala2.10。Spark2.0版本以上使用是Scala2.11版本。 Scala官網6個特徵。 1).Java和scala可以混編 2).類型推測(自動推測類型) 3).併發和分佈

2020-02-22 20:46:06

Scala字符串 String StringBuilder 可變 string操作方法舉例比較:equals 比較忽略大小寫:equalsIgnoreCase indexOf：如果字符串中有傳入的assci碼對應的值，返回下標

2020-02-22 20:46:06

Spark初始什麼是Spark Apache Spark Apache Spark 是專爲大規模數據處理而設計的快速通用的計算引擎。Spark是UC Berkeley AMP lab (加州大學伯克利分校的AMP實驗室)所開源

2020-02-22 20:46:06

Scala基礎數據類型變量和常量的聲明. /**定義變量和常量,變量 :用 var 定義，可修改常量 :用 val 定義，不可修改 */ var name = "zhangsan"

2020-02-22 20:46:06

Spark下Standalone和Yarn提交流程詳解 Yarn模式兩種提交任務方式 yarn-client提交任務方式提交命令 ./spark-submit --master yarn --class org.apac

2020-02-22 20:45:56

補充算子 transformations mapPartitionWithIndex 類似於mapPartitions,除此之外還會攜帶分區的索引值。 repartition 增加或減少分區。會產生shuffle。（多個分區分到

2020-02-22 20:45:56