原创 簡單概括 ==跟equals的區別

==   == :既可以比較基本類型,也可以比較引用類型,如果比較八大數據類型主要比較的是值,比較引用類型主要比較的是內存地址值 equals(沒有被重寫過) equals(父類是object,所以每個對象都會有equals):   oj

原创 基本數據類型 和 引用類型(簡單概述)

一、基本數據類型     java中一共分爲8種      基本數據類型:byte、short、int、long、float、double、char、boolean         byte、short、int、long是整型     

原创 如何選擇Apache/CDH/HDP版本???

框架基本選型       (1)Apache:運維麻煩,組件間兼容性需要自己調研。(一般適合大廠使用,技術實力雄厚,有專門的運維人員)(建議使用)       (2)CDH:國內使用最多的版本,但是CM不開源,今年(2020)開始收費,一

原创 簡單概述 什麼是重寫

 直接上代碼  一個簡單的person類  重寫就是把原來人家寫完的底層方法重新獲取然後修改一下 (alt+insert 裏面的 equals() and hashCode()  、toString() 等這些方法)如圖(下面代碼標紅色部

原创 大概瞭解一下離線項目(未完成)

數倉概念       數據倉庫(Data Warehouse),是爲企業所有決策制定過程,提供所有系統數據支持的戰略集合。       通過對數據倉庫中數據的分析,可以幫助企業,改進業務流程、控制成本、提高產品質量等。       數據倉

原创 初識kafka小結

第一部分:概述     1.1 Kafka的定義:       kafka是一個分佈式的基於發佈/訂閱模式的消息隊列(Message Queue),主要應用於大數據實時處理領域。     1.2消息隊列      1.2.1傳統消息隊列的

原创 spark知識點小總結

文章目錄**spark****什麼是Spark****Spark特點****Spark運行模式****Spark編寫代碼****SparkCore**什麼是RDD**RDD的主要屬性****RDD的算子分爲兩類:****Rdd數據

原创 錯誤信息:ERROR StreamMetadata:Error writing stream metadata StreamMetadata...

錯誤信息:ERROR StreamMetadata:Error writing stream metadata StreamMetadata...   原因(很多種,我的是這樣):電腦配置環境缺東西 下載一個 hadoop.dll 放

原创 用idea初測MapReduce框架

先配置pom文件 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi

原创 idea 鏈接 linux

  點贊 1 收藏 分享 文章舉報 lxpqxl 發佈了23 篇原創文章 · 獲贊 62 · 訪問量 1萬+ 私信

原创 HDFS數據寫入流程

1:Client 發起文件寫入請求,通過 RPC 與 NameNode 建立通訊,NameNode檢查目標文件,返回是否可以上傳; 2:Client 請求第一個 block 該傳輸到哪些 DataNode 服務器上; 3:NameNode

原创 克隆虛擬機後需要修改的設置

    1.打開新克隆的虛擬機的網絡適配器>高級>查看MAC值 (記住下面 MAC地址 後面的內容,這個是克隆後新生成的MAK值)        2.編輯配置文件,更新 HWADDR 設爲新的MAC值         [root@node

原创 磁盤分區(包含磁盤分區格式化)和磁盤掛載(包含自動掛載)

 1.先查看磁盤         [root@node01 ~]: lsblk -f                             ↓         sda                                  

原创 HDFS數據完整性如何保證?

數據寫入完畢以後進行校驗,對比判斷是否有數據丟失 數據讀取之前進行校驗,對比判斷是否有數據丟失 NameNode會週期性的通過DataNode彙報的心跳信息中獲取block塊的校驗和進行檢查數據完整性,如果發現校驗和不一致,會從其他副本節

原创 Namenode , DataNode 的作用

Namenode作用 一:管理,維護文件系統的元數據/名字空間/目錄樹               管理數據與節點之間的映射關係(管理文件系統中每個文件/目錄的block塊信息), 二:管理DataNode彙報的心跳日誌/報告 三:客戶端