原创 Java基礎 - java容器

  Java的容器是用來存放對象數據,根據不同的業務需求選擇不同的容器類型(List、Set、Queue、Map)。   通過上述的圖可以瞭解到Java的容器大致分成兩類map類和Collection類 Collectio

原创 Hive - 簡介和安裝

一、產生背景 初代的hadoop的MapReduce寫起來非常的麻煩。 兼容RDBMS人員的“雲化”,方便使用類SQL操作大數據集。 二、架構   根據上圖可以知道,Hive的接口可以是命令行、JDBC(JDBC主要的作用

原创 java 反射

  Spring中往往一個註解(如@Controller@Service)就可以完成一些複雜的操作。註解應用於反射之上,反射是java的重中之重。反射強調的是運行時狀態,獲取類的方法和屬性的一些信息。 一、獲取類   通過反射獲取

原创 設計模式一

一、面向對象的設計原則: 1、單一原則:   高內聚,低耦合。簡單的說就是一個類儘可能只做一件事。dao.class就只是數據庫的操作;controller就只是對restfull的請求的接收;math.class只做數學上的計算

原创 fastjson轉換

public class JsonTest { @Test public void beanToString() { Animal animal = new Animal(); an

原创 kafka

  kafka是一個分佈式流平臺,kafka說到底其實就是一個數據緩存池的作用。在數據高峯的時候不至於數據處理堵塞,而是有所緩衝。 一、部署   kafka是依賴zookeeper,所以先要部署zookeeper。 1.1 部署zk的

原创 Spark Streaming - 基礎

一、概述   Spark Streaming是Spark對流式的計算框架,嚴格意義上說其實並不是真正實時性很高的流式計算,而是以時間片作爲批次進行計算。Spark Streaming底層是以Spark Core爲基礎。   如上圖所

原创 Spring @RequestBody和@RequestParam的請求方式get和post關係

  首先Spring的微服務是通過URL進行交互的。在http的請求中post和get的請求方式所帶的參數對於Spring的@Controller下的註解有一些不同。 一、URL和URI   先來理解一下什麼是URL和URI。   

原创 Java基礎-線程池

  Java應用程序需要運用線程,線程的出現使得程序能進行並行化操作。但如果遇上並行化量大,且運行時間短的場景來說,每個任務都創建一個線程,其實並不合適,啓動和銷燬線程佔用大量的資源,所以,用線程池,重複使用線程完成任務。 一、線程池

原创 Java-線程基礎

一、線程的狀態 New新建 Runnable可運行 Running運行 Blocked阻塞 Dead死亡   New新建,就是創建一個線程。   Runnable可運行,線程啓動start,等待cpu調度。   Running運行

原创 Java - 數據結構

  什麼是數據結構?數據結構是計算機存儲、組織數據的方式。數據的基本功能是對數據的增刪改查,不同的數據結構效率和側重點不一樣。 常見數據結構 數據結構 優點 缺點 數組 隨機訪問快 刪除、指定位置插入慢 鏈表 插入和

原创 Scala基礎一

  選用的Scala版本:2.11.8 一、申明值和變量   定義的規範“val name : String = null”,val 表示這個變量是常量,內容無法改變;你也可以使用var 標註變量爲可變內容。   常用的數據類型:

原创 Flume

  如果數據是在MySQL中的話,需要用到Sqoop工具將數據導入大數據平臺。如果是日誌類型的日誌,需要用到Flume導入大數據平臺。   Flume是一個分佈式、 基於流式數據。Flume的靈魂(Agent)就是採集(source)、

原创 spark 算子

  什麼是spark算子?可以理解成spark RDD的方法,這些方法作用於RDD的每一個partition。   因爲spark的RDD是一個 lazy的計算過程,只有得到特定觸發纔會進行計算,否則不會產生任何結果。大體上分: Tr

原创 Flume二

  一般的agent的數據源過來是從Source->Channel->Sink。在上一長講解的時候都是單Sink,單Channel,單Source,其實三個組件之間還有有一層架構。   在Source和Channel之間有一個選擇器,叫