原创 Java集合詳解(二):Map
Java集合詳解(二):Map Collection和Map比較 Collection<E> --->是一個單列的集合 Map<K, V> map中需要存放兩個元素一個是K:Key-->鍵一個是V:Value---
原创 Scala IO操作
Scala IO操作 Scala IO操作有執行常用的文件處理任務,比如從文件中讀取所有行或單詞,或者讀取包含數字的文件等。 讀取行 要讀取文件中所有行,可以調用scala.io.Source對象的getLine
原创 Hadoop HA(高可用)環境的搭建
Hadoop HA(高可用)環境的搭建: 集羣佈局: 集羣描述: 集羣中有兩個NameNode,兩個ResourceManager。實現了NameNode的HA方案以及ResourceManager單點故障的解決。 Ha
原创 Java簡介
Java簡介 Java語言概述 1. Java是由Sun公司推出的Java面向對象程序設計語言和Java平臺的總稱。由James Gosling和同事們共同研發,並在1995年正式推出。與傳統程序不同,Sun 公司在推出 Java 之初
原创 Java語言基礎
Java語言基礎 關鍵字 Java中一些賦以特定的含義、並用做專門用途的單詞稱爲關鍵字(keyword) 或保留字。如下表所示: 標識符 標識符用作給變量、類和方法命名。 標識符命名的要求如下: 1:可以使用26個大小寫字母以及數據0
原创 Scala流程控制
Scala流程控制 Scala 內建的控制結構屈指可數 ,僅有 if 、while 、for , try 、match 和語句塊而已。如此之少的理由是,Scala 從語法層而支持函數字面面量。因此 ,代之以在基本語法之上逐一
原创 Java集合詳解(一):Collection
Java集合詳解(一):Collection 1.集合簡介 集合類的由來: 對象用於封裝特有數據,對象多了需要存儲,如果對象的個數不確定。就使用集合容器進行存儲。 集合的特點: 用於存儲對象的容器。集合
原创 Spark簡介
Spark簡介 1. Spark概述 1. 什麼是Spark?Spark作爲Apache頂級的開源項目,是一個快速、通用的大規模數據處理引擎,和Hadoop的MapReduce計算框架類似,但是相對於MapReduce,Spark憑藉其可
原创 Scala類與對象
Scala類與對象 類簡介 簡介 類是對象的藍圖。一旦你定義了類,就可以用關鍵字new根據類的藍圖創建對象。在類的定義裏,可以放置字段和方法,這些被籠統地稱爲成員。對於字段,不管是val還是var定義的,都是指向對象的變量。
原创 在VMware Workstation 12 PRO上安裝CentOS 7 Minimal版
在VMware Workstation 12 PRO上安裝CentOS 7 Minimal版 測試的系統環境: Windows 7 Ultimate Sp1 x64 VMware Workstation 12 PRO
原创 Scala模式匹配
Scala模式匹配 模式匹配簡介 簡介 Scala模式匹配機制十分強大,可以應用在很多場合:switch語句、類型查詢,以及“析構”(獲取複雜表達式中不同的部分)。除此之外,Scala還提供了樣例類,對模式匹配進行
原创 PySpark處理數據並圖表分析
PySpark處理數據並圖表分析 PySpark簡介 官方對PySpark的釋義爲:“PySpark is the Python API for Spark”。 也就是說pyspark爲Spark提供的Python編程接
原创 Ganglia環境搭建並監控Hadoop分佈式集羣
Ganglia環境搭建並監控Hadoop分佈式集羣 簡介 Ganglia可以監控分佈式集羣中硬件資源的使用情況,例如CPU,內存,網絡等資源。通過Ganglia可以監控Hadoop集羣在運行過程中對集羣資源的調度,作爲簡單
原创 Redis主從複製和集羣配置
Redis主從複製和集羣配置 redis主從複製 概述 1、redis的複製功能是支持多個數據庫之間的數據同步。一類是主數據庫(master)一類是從數據庫(slave),主數據庫可以進行讀寫操作,當發生寫操作的時候自動將
原创 爬蟲程序定時執行和監控示例
爬蟲程序定時執行和監控示例 簡介 我們的爬蟲程序在執行過程中,可能需要滿足以下條件: 1、可以每天定時執行,爬取指定電商等網站內容。 2、可以對分佈式爬蟲進行監控,當爬蟲程序掛掉之後,可以通知管理員。 下面我們來介紹如