原创 自定義實現二次排序

Java: package cn.spark.sparktest; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD;

原创 HBASE60010端口無法訪問web界面問題

搭建好Hadoop集羣以及HBASE之後,只用60010端口無法訪問HBASE web界面 集羣搭建  環境配置 文件配置 完全正確   解決方法:HBASE1.0之後 端口發生改變 現在的端口是 16010

原创 查詢學生成績在80之上的學生信息

Java: package cn.spark.sql; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import

原创 spark寬依賴以及窄依賴

                                                       spark寬依賴以及窄依賴

原创 idea使用jdbc連接hive的報錯總結

1、java.sql.SQLException: org.apache.thrift.transport.TTransportException: SASL authentication not complete   遇到這種錯誤,首先看

原创 Spark算子實戰transforma(Java)

map算子:將集合中的每個元素乘2 package cn.spark.sparktest; import java.util.Arrays; import java.util.List; import org.apache.sp

原创 Spark算子實戰action(Java)

1、reduce算子操作 package cn.spark.sparktest; import org.apache.spark.SparkConf; import org.apache.spark.SparkContext; im

原创 Spark算子實戰action(Scala)

1、reduce算子 package cn.spark.study.core import org.apache.spark.{SparkConf, SparkContext} object actionOpertion {

原创 Spark算子實戰transforma(Scala)

map算子:將集合中的每個元素乘2 package cn.spark.study.core import org.apache.spark.{SparkConf, SparkContext} object transformati

原创 使用idea開發Java的Wordcount程序並提交到spark集羣運行

首先,我們需要確保集羣已搭建好,win10安裝idea,打開idea,選擇創建maven項目   然後next,finish。 工程打開後再pom.xml中添加依賴,選擇啓動導入依賴 <?xml version="1.0" enco

原创 大數據學習之路(六)spark

                                                                  spark 什麼是spark:spark是一個計算框架                   MR是一個批量

原创 CentOS6.5中安裝Hadoop

安裝Hadoop包 1、使用課程提供的hadoop-2.4.1.tar.gz,使用WinSCP上傳到CentOS的/usr/local目錄下。 2、將hadoop包進行解壓縮:tar -zxvf hadoop-2.4.1.tar.gz 3

原创 CentOS6.5安裝Scala和kafka

安裝Scala2.11.4 1、將scala-2.11.4.tgz使用WinSCP拷貝到spark1的/usr/local目錄下。 2、對scala-2.11.4.tgz進行解壓縮:tar -zxvf scala-2.11.4.tgz。

原创 CentOS6.5安裝zookeeper

安裝zookeeper包 1、將zookeeper-3.4.5.tar.gz使用WinSCP拷貝到spark1的/usr/local目錄下。 2、對zookeeper-3.4.5.tar.gz進行解壓縮:tar -zxvf zookeep

原创 大數據學習之路(四)YARN

                                                                                YARN YARN  YARN是在Hadoop2.0出現的類似於手機操作系統的