原创 Java集合詳解(二):Map

Java集合詳解(二):Map         Collection和Map比較 Collection<E> --->是一個單列的集合   Map<K, V> map中需要存放兩個元素一個是K:Key-->鍵一個是V:Value---

原创 Scala IO操作

Scala IO操作         Scala IO操作有執行常用的文件處理任務,比如從文件中讀取所有行或單詞,或者讀取包含數字的文件等。   讀取行   要讀取文件中所有行,可以調用scala.io.Source對象的getLine

原创 Hadoop HA(高可用)環境的搭建

Hadoop HA(高可用)環境的搭建: 集羣佈局: 集羣描述: 集羣中有兩個NameNode,兩個ResourceManager。實現了NameNode的HA方案以及ResourceManager單點故障的解決。 Ha

原创 Java簡介

Java簡介 Java語言概述 1. Java是由Sun公司推出的Java面向對象程序設計語言和Java平臺的總稱。由James Gosling和同事們共同研發,並在1995年正式推出。與傳統程序不同,Sun 公司在推出 Java 之初

原创 Java語言基礎

Java語言基礎 關鍵字 Java中一些賦以特定的含義、並用做專門用途的單詞稱爲關鍵字(keyword) 或保留字。如下表所示:   標識符 標識符用作給變量、類和方法命名。 標識符命名的要求如下: 1:可以使用26個大小寫字母以及數據0

原创 Scala流程控制

Scala流程控制       Scala 內建的控制結構屈指可數 ,僅有 if 、while 、for ,  try 、match 和語句塊而已。如此之少的理由是,Scala 從語法層而支持函數字面面量。因此 ,代之以在基本語法之上逐一

原创 Java集合詳解(一):Collection

Java集合詳解(一):Collection           1.集合簡介 集合類的由來: 對象用於封裝特有數據,對象多了需要存儲,如果對象的個數不確定。就使用集合容器進行存儲。       集合的特點: 用於存儲對象的容器。集合

原创 Spark簡介

Spark簡介 1. Spark概述 1. 什麼是Spark?Spark作爲Apache頂級的開源項目,是一個快速、通用的大規模數據處理引擎,和Hadoop的MapReduce計算框架類似,但是相對於MapReduce,Spark憑藉其可

原创 Scala類與對象

Scala類與對象       類簡介 簡介 類是對象的藍圖。一旦你定義了類,就可以用關鍵字new根據類的藍圖創建對象。在類的定義裏,可以放置字段和方法,這些被籠統地稱爲成員。對於字段,不管是val還是var定義的,都是指向對象的變量。

原创 在VMware Workstation 12 PRO上安裝CentOS 7 Minimal版

在VMware Workstation 12 PRO上安裝CentOS 7 Minimal版 測試的系統環境: Windows 7 Ultimate Sp1 x64 VMware Workstation 12 PRO

原创 Scala模式匹配

Scala模式匹配           模式匹配簡介   簡介 Scala模式匹配機制十分強大,可以應用在很多場合:switch語句、類型查詢,以及“析構”(獲取複雜表達式中不同的部分)。除此之外,Scala還提供了樣例類,對模式匹配進行

原创 PySpark處理數據並圖表分析

PySpark處理數據並圖表分析         PySpark簡介 官方對PySpark的釋義爲:“PySpark is the Python API for Spark”。 也就是說pyspark爲Spark提供的Python編程接

原创 Ganglia環境搭建並監控Hadoop分佈式集羣

Ganglia環境搭建並監控Hadoop分佈式集羣         簡介 Ganglia可以監控分佈式集羣中硬件資源的使用情況,例如CPU,內存,網絡等資源。通過Ganglia可以監控Hadoop集羣在運行過程中對集羣資源的調度,作爲簡單

原创 Redis主從複製和集羣配置

Redis主從複製和集羣配置         redis主從複製 概述 1、redis的複製功能是支持多個數據庫之間的數據同步。一類是主數據庫(master)一類是從數據庫(slave),主數據庫可以進行讀寫操作,當發生寫操作的時候自動將

原创 爬蟲程序定時執行和監控示例

爬蟲程序定時執行和監控示例         簡介 我們的爬蟲程序在執行過程中,可能需要滿足以下條件: 1、可以每天定時執行,爬取指定電商等網站內容。 2、可以對分佈式爬蟲進行監控,當爬蟲程序掛掉之後,可以通知管理員。   下面我們來介紹如