原创 【2020】DBus,一個更能滿足企業需求的大數據採集平臺

功能遠超Sqoop、DataX、Flume、Logatash、Filebeat等採集工具   深知其他組件的侷限性,才能彰顯DBus的優越感 當前有很多數據採集工具(Sqoop、DataX、Flume、Logatash、Filebea

原创 Flink1.9重大改進和新功能

Flink1.9重大改進和新功能 二、重構 Flink WebUI Flink社區討論了現代化 Flink WebUI 的提案,決定採用 Angular 的最新穩定版來重構這個組件。從Angular 1.x 躍升到了 7.x 。重

原创 VMware虛擬機安裝

1.1虛擬機是什麼? 簡單地說,你可以把虛擬機理解爲虛擬的機器,這個虛擬的機器和真實的機器在功能實現上幾乎完全一樣,只是說虛擬機的硬盤是在一個磁盤文件中虛擬出來的。   1.2如何搭建虛擬機? 虛擬機的搭建實際上就是通過安裝虛擬化的軟件來

原创 Linux系統安裝

2.1Linux系統介紹 1.操作系統(英語:operating system,縮寫作OS)是管理計算機硬件與軟件資源的計算機程序,同時也是計算機系統的內核與基石。操作系統需要處理如管理與配置內存、決定系統資源供需的優先次序、控制輸入與輸

原创 大數據架構師+精英必備技能

(一)架構師技能樹 大數據基礎鞏固(錄播) HDFS分佈式文件系統 1.HDFS架構設計 2.HDFS設計思想 3.數據塊 4.機架感知 5.容錯策略 6.數據本地性策略 7.讀寫流程分析 8.HDFS高可用原理 MapReduce分佈式

原创 大數據運維:大數據平臺+海量數據

大數據開發獨攬大權 大數據技術很早就在BAT這些公司生根發芽,但直到14、15年大數據技術才廣泛應用在各大互聯網公司,大數據技術由此深入各行各業。 此時大數據開發人才非常緊缺,很多公司大數據從立項,到大數據平臺構建,到項目整個流程開發,

原创 【全集】大數據Linux基礎

課程介紹 本課程是由獵豹移動大數據架構師,根據公司大數據平臺的運維情況,精心設計和打磨的大數據必備Linux課程。通過本課程的學習大數據新手能夠少走彎路,快速掌握Linux常用命令及Shell編程,爲後續大數據課程的學習奠定了堅實的基礎。

原创 【總結筆記】kafka工作常見問題彙總

沒有禁用"自動創建topic"的功能 已經增加參數auto.create.topics.enable=false,否則任何人只要發數據給kafka,沒有對應的topic都會自動創建,一旦生產者多了會亂套。 數據保留週期過短 已經修改爲3天

原创 【全集】大數據Java基礎

課程介紹 本課程是由獵豹移動大數據架構師,根據Java在公司大數據開發中的實際應用,精心設計和打磨的大數據必備Java課程。通過本課程的學習大數據新手能夠少走彎路,以較短的時間系統掌握大數據開發必備語言Java,爲後續大數據課程的學習奠定

原创 【全集】IDEA入門到實戰

課程介紹   IDEA是一款功能強悍、非常好用的Java開發工具,近幾年編程開發人員對IDEA情有獨鍾。雖然IDEA功能很強大,但目前市面講解的不細緻、不繫統,導致很多IDEA初學者要麼無從下手,要麼耗費太多時間。本套課程分知識點進行錄製

原创 【數倉大全】傳統數倉、大數據數倉、離線數倉、實時數倉、數倉Lambda架構、Kappa架構、數據湖

  數倉架構演變(場景驅動) 離線大數據架構典型案例 離線數倉分層 離線大數據架構典型案例 Lambda架構 Lambda架構進一步理解 Lambda架構典型案例 Lambda架構典型案例(有贊廣告團,基於Druid)

原创 2019雲棲大會頭版頭條 六位大咖提到最多的字眼就是“數據”

        當我看到這個結果的時候,我是驚訝的。雖然我堅信數據對未來發展的重要性,但是這麼高頻次的提及。實屬震驚。         很顯然,未來已經很明確。未來的經濟發展需要大量數字或數據相關的人才,尤其是高級人才。當別人在這個方向

原创 15案例 + 3實戰 + 3項目,徹底講透基於大數據體系構建數據倉庫(有免費資料領取哦)

閒言碎語不多講,老鐵們,直接上硬菜! 一看老師背景就是實力派 某金融公司大數據團隊Leader、數據倉庫架構師,曾供職於滴滴出行大數據&機器學習研究院,6年大數據&數據倉庫領域一線研發經驗,在數據倉庫、BI、大數據架構方面有豐富的經驗,

原创 Apache Flink 漫談系列(14) - DataStream Connectors之Kafka

聊什麼 爲了滿足本系列讀者的需求,在完成《Apache Flink 漫談系列(14) - DataStream Connectors》之前,我先介紹一下Kafka在Apache Flink中的使用。所以本篇以一個簡單的示例,向大家介紹在A

原创 Apache Flink 漫談系列(13) - Table API 概述

什麼是Table API 在《Apache Flink 漫談系列(08) - SQL概覽》中我們概要的向大家介紹了什麼是好SQL,SQL和Table API是Apache Flink中的同一層次的API抽象,如下圖所示: Apache F