原创 【Linux】CentOS 6 相較於 CentOS 7的變化

【1】防火牆 [CentOS 6]:iptables 命令: service iptables start/stop/restart [CentOS 7]:firewalld 命令: systemctl start/stop/r

原创 【Kylin】Kylin入門解析(二)

(圖片來源於網絡,侵刪) 一、可視化 可以與Kylin結合使用的可視化工具很多,例如: ODBC:與Tableau、Excel、PowerBI等工具集成 JDBC:與Saiku、BIRT等Java工具集成 RestAPI:與

原创 【Hadoop】MapReduce高級案例

【1】倒排索引案例(多job串聯) 現有三個文件,內容如下 需要建立搜索索引,期望輸出數據如下👇 HBase b.txt->1 c.txt->1 Hadoop a.txt->2 Hello c.txt->2 a.txt-

原创 【Java】Java回顧之路(二)

【1】請你簡單描述一下String、StringBuffer、StringBuilder? String:不可變的字符序列,底層使用char[]存儲 StringBuffer:可變的字符序列,線程安全的,效率低,底層使用char[

原创 【Spark】SparkCore深入解析(一)

(圖片來源於網絡,侵刪) textFile() 與 sc.wholeTextFiles的區別 1)當指定的路徑是目錄且該目錄下全部都是文件時,textFile() 和 wholeTextFiles() 都正常讀取 2

原创 【Java】Java回顧之路(一)

【1】請你簡單描述一下正則表達式及其用途? 在處理字符串時,經常會有 查找符合 某些 複雜規則的字符串的需要,正則表達式就是用於 描述這些規則的工具 【2】請你說明一下,在Java中如何跳出當前的多重嵌套循環? 在最外層循環前加一

原创 【Kylin】Kylin入門解析(一)

(圖片來源於網絡,侵刪) 一、Kylin 概述 1.Kylin 簡介 Apache Kylin 是一個開源的分佈式分析引擎,提供 Hadoop/Spark 之上的 SQL 查詢接口及多維分析(OLAP)能力以支持超大規模數據,最

原创 【Linux】Get一個小技巧,將任務放到後臺!

我們知道,當我們運行一個交互式界面的時候,如果想要查看一點東西,就需要新開一個窗口或者退出交互式界面,這樣很不方便,所以我們可以讓任務放到後臺,等我們查看完成任務之後就可以調到前臺繼續使用,是不是很方便? 命令如下👇 # Ctrl

原创 【面試】非技術類面試常見問題

一、常見面試題目自測 1:請你介紹一下你自己 這是面試官常問的問題。一般人回答這個問題過於平常,只說姓名、愛好、工作經驗,這些簡歷上都有。其實,面試官最希望知道的是求職者能否勝任工作,包括:最強的技能、最深入研究的知識領域、個性中

原创 【Superset】Superset入門解析

(圖片來源於網絡,侵刪) 一、Superset概述 1、Superset簡介 Apache Superset是一個開源的、現代的、輕量級BI分析工具,能夠對接多種數據源、擁有豐富的圖標展示形式、支持自定義儀表盤,且擁有友好的用

原创 【項目】數倉項目(九)

(圖片來源於網絡,侵刪) 一、數倉搭建 - DWS 層 1.1 業務術語 1)用戶 用戶以設備爲判斷標準,在移動統計中,每個獨立設備認爲是一個獨立用戶。Android 系統根據 IMEI 號,IOS 系統根據 OpenUDID

原创 【項目】數倉項目(十)

(圖片來源於網絡,侵刪) 一、數倉搭建 - ADS 層 1.1 設備主題 1.1.1 活躍設備數(日、周、月) 需求定義: 日活:當日活躍的設備數 周活:當週活躍的設備數 月活:當月活躍的設備數 1)建表語句 drop tab

原创 【項目】數倉項目(八)

(圖片來源於網絡,侵刪) 1.1 DWD 層(業務數據) 1.1.1 商品維度表(全量表) 1)建表語句 DROP TABLE IF EXISTS `dwd_dim_sku_info`; CREATE EXTERNAL T

原创 【項目】數倉項目(六)

(圖片來源於網絡,侵刪) 一、數倉分層 1.1 爲什麼要分層 1.2 數據集市與數據倉庫概念 1.3 數倉命名規範 1.3.1 表命名 ODS層命名爲ods_表名 DWD層命名爲dwd_dim/fact_表名 DWS層命

原创 【項目】數倉項目(七)

(圖片來源於網絡,侵刪) 結束語 都看到這裏了,點贊評論一下吧!!! 點擊查看👇 敬請期待!