原创 自定義實現二次排序
Java: package cn.spark.sparktest; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD;
原创 HBASE60010端口無法訪問web界面問題
搭建好Hadoop集羣以及HBASE之後,只用60010端口無法訪問HBASE web界面 集羣搭建 環境配置 文件配置 完全正確 解決方法:HBASE1.0之後 端口發生改變 現在的端口是 16010
原创 查詢學生成績在80之上的學生信息
Java: package cn.spark.sql; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import
原创 spark寬依賴以及窄依賴
spark寬依賴以及窄依賴
原创 idea使用jdbc連接hive的報錯總結
1、java.sql.SQLException: org.apache.thrift.transport.TTransportException: SASL authentication not complete 遇到這種錯誤,首先看
原创 Spark算子實戰transforma(Java)
map算子:將集合中的每個元素乘2 package cn.spark.sparktest; import java.util.Arrays; import java.util.List; import org.apache.sp
原创 Spark算子實戰action(Java)
1、reduce算子操作 package cn.spark.sparktest; import org.apache.spark.SparkConf; import org.apache.spark.SparkContext; im
原创 Spark算子實戰action(Scala)
1、reduce算子 package cn.spark.study.core import org.apache.spark.{SparkConf, SparkContext} object actionOpertion {
原创 Spark算子實戰transforma(Scala)
map算子:將集合中的每個元素乘2 package cn.spark.study.core import org.apache.spark.{SparkConf, SparkContext} object transformati
原创 使用idea開發Java的Wordcount程序並提交到spark集羣運行
首先,我們需要確保集羣已搭建好,win10安裝idea,打開idea,選擇創建maven項目 然後next,finish。 工程打開後再pom.xml中添加依賴,選擇啓動導入依賴 <?xml version="1.0" enco
原创 大數據學習之路(六)spark
spark 什麼是spark:spark是一個計算框架 MR是一個批量
原创 CentOS6.5中安裝Hadoop
安裝Hadoop包 1、使用課程提供的hadoop-2.4.1.tar.gz,使用WinSCP上傳到CentOS的/usr/local目錄下。 2、將hadoop包進行解壓縮:tar -zxvf hadoop-2.4.1.tar.gz 3
原创 CentOS6.5安裝Scala和kafka
安裝Scala2.11.4 1、將scala-2.11.4.tgz使用WinSCP拷貝到spark1的/usr/local目錄下。 2、對scala-2.11.4.tgz進行解壓縮:tar -zxvf scala-2.11.4.tgz。
原创 CentOS6.5安裝zookeeper
安裝zookeeper包 1、將zookeeper-3.4.5.tar.gz使用WinSCP拷貝到spark1的/usr/local目錄下。 2、對zookeeper-3.4.5.tar.gz進行解壓縮:tar -zxvf zookeep
原创 大數據學習之路(四)YARN
YARN YARN YARN是在Hadoop2.0出現的類似於手機操作系統的