原创 Redis的集羣創建步驟(非redis-trib.rb腳本方式)

本文目的僅用於測試驗證創建集羣的相關步驟,所以只是採用最簡單的配置在同一個服務器部署了由3個節點組成的Redis集羣 1. 創建集羣步驟,本文使用Redis 3.2.5版本 1.1 創建配置文件目錄,使用的端口分別爲5000,5001和5

原创 Spark命令行測試轉換RDD to DataFrame報Relative path in absolute URI錯誤-Win7

無聊玩了一下Spark命令行模式的命令,測試讀寫Parquet格式的操作,發現執行personRDD.toDF時候報以下錯誤: org.apache.hadoop.hive.ql.metadata.HiveException: java

原创 Kafka基礎-生產者發送消息

無論你是使用Kafka作爲隊列,消息總線還是數據存儲平臺,你都會用到生產者,用於發送數據到Kafka。下文介紹如何使用Java來發送消息到Kafka。1. 發送消息的主要步驟 首先創建ProducerRecord對象,此對象除了包括需要發

原创 Kafka基礎-流處理

1. 什麼是流處理? 首先,讓我們說一下什麼是數據流(也稱爲事件流)?它是無邊界數據集的抽象說法,無邊界意味着無限且不斷增長,因爲隨着時間的推移,新數據會不斷地到來。 除了無邊界的特性之外,事件流模型還有其它幾個屬性: 1.1 事件流是有

原创 Kafka基礎-可靠性數據傳輸

可靠的數據傳輸是系統的一個必要屬性,就像性能一樣,必須從一開始就設計到系統中。Apache Kafka在可靠的數據傳輸方面非常靈活,支持非常多的配置參數。 1. 可靠性保證 當我們討論可靠性時,通常會提到保證這個術語。最著名的可靠性保證A

原创 Kafka基礎-內部原理

理解Kafka的內部原理可以有助於故障的排除,因此本文會着重介紹以下三個部分: Kafka複製的工作原理 Kafka是怎樣處理生產者和消費者的請求 Kafka是怎樣儲存數據,例如文件格式和索引 1. 集羣成員 Kafka使用Apache

原创 Kafka基礎-消費者讀取消息

下文介紹如何使用Java從Kafka訂閱和讀取消息,它和從其它消息系統讀取消息有點不同,涉及到一些獨特的概念。所以我們要先了解這些概念: 1. Kafka消費者概念 1.1 消費者和消費者組 當你只有一個消費者而且生產者發送消息的速率比消

原创 Hadoop僞分佈式模式安裝配置步驟

最近要升級Hadoop的版本,需要重新安裝測試環境,特此記錄一下安裝配置步驟O(∩_∩)O 1. 依賴軟件   1.1 Java Hadoop 2.7及以上版本需要Java 7,之前的版本支持Java 6,本文使用Hadoop 2

原创 下載編譯安裝Apache HTTP Server 2.4.23以及配置HTTP/HTTPS反向代理

一,依賴軟件: 1.1 GCC和C++編譯器 - GCC - C++ Compiler1.1.1 如果沒有安裝以上依賴包請執行以下命令安裝: [root@xxx ~]# yum install -y gcc gcc-c++1.1.2 如果

原创 Redis的複製原理和配置參數

Redis使用的是master-slave主從複製模式,從2.8版本開始,這個過程是異步的。1. 工作原理 當一個slave首次或重新連接到mast

原创 Spark升級到2.0後測試stream-kafka測試報java.lang.NoClassDefFoundError: org/apache/spark/Logging錯誤

- 最近從Spark 1.5.2升級到2.0之後,運行測試代碼spark-stream-kafka報以下錯誤: java.lang.NoClassDefFoundError: org/apache/spark/Logging at

原创 Spark編程指南入門之Java篇一-基本知識

1. Spark的Java開發包 Spark提供Java的開發包,當前最新版本是2.0.2版本:spark-core_2.11-2.0.2.jar,可以從下面鏈接下載: http://central.maven.org/maven2/or

原创 Spark下載和配置-Win7

-下載 下載頁面的link:http://spark.apache.org/downloads.html 1,Choose a Spark release 選擇需要下載的Spark版本,我這裏使用最新的版本 2,Choose a pa

原创 Spark編程指南入門之Java篇四-常用Actions操作

8. 常用的Actions操作 T reduce(Function2<T,T,T> f) 使用指定的函數f聚合數據集中的元素,該函數把數據集中的每2個元素聚合成一個,一直遞歸直到得出最後一個元素 java.util.List<T> col

原创 Java7之try-with-resources語句自動關閉資源

1. 使用finally關閉資源 在Java 7之前,如果要關閉一個資源的話,可以使用finally語句,不管try語句裏面的代碼是否正常執行完畢或出現異常,例如: static String readFirstLineFromFile