原创 MySQL之實現免密登錄(設置默認登錄用戶及密碼)

前言 MySQL版本:5.7.10 本文介紹的免密登錄方式的原理就是在配置文件中設置mysql客戶端命令行工具的默認參數,實現登錄時可以直接使用設置參數進行登錄,相當於設置了默認登錄用戶,並且只在修改了配置文件的主機上使用MyS

原创 YARN之配置Timeline服務

前言 hadoop:2.7.7 Timeline Service 官方文檔 簡介 Timeline Server基於YARN運行,能夠存儲和檢索應用程序的當前和歷史信息,其主要有兩個職責: 1)存儲應用程序的特定信息 收集和

原创 Hive中使用count(1)或count()統計行數時結果爲0的原因

前言 Hive:2.3.0 Hadoop:2.7.7 JDK:1.8.0_221 原因 因爲執行count(1)或count(*)統計行數時,默認會從Hive的元數據庫中查詢 rowsNum 對應值作爲結果返回,一般情況下,

原创 MySQL中distinct和group by去重性能對比

前言 MySQL:5.7.17 存儲引擎:InnoDB 實驗目的:本文主要測試在某字段有無索引、各種不同值個數情況下,記錄對此字段其使用DISTINCT/GROUP BY去重的查詢語句執行時間,對比兩者在不同場景下的去重性能,實

原创 YARN和MapReduce內存分配計算公式

前言 hadoop:2.7.7 本文內容均來自:HDP Command Line Installation 2.6.5 中第1.10節 HDP(Hortonworks Data Platform)是最常見的Hadoop的第三方發

原创 Linux之下載lz4壓縮工具

方法一:使用apt工具直接下載 apt-get -y install liblz4-tool 方法二:使用yum工具直接下載 yum -y install lz4 lz4-devel 方法三:編譯源碼 https://gi

原创 Hive之中文亂碼問題

前言 Hive:2.3.0 Hadoop:2.7.7 MySQL Server:5.7.10 OS:CentOS 7 本文主要演示如何解決Hive註釋內容(即COMMENT)中出現中文亂碼的問題 原因 Hive中的表字段等註

原创 CentOS修改yum工具安裝源

前言 OS:CentOS 7 本文主要演示在CentOS 7中如何修改yum軟件源爲國內下載源,提高yum下載速度 參考博客:https://www.cnblogs.com/Dleo/p/5758350.html

原创 Hadoop配置lzo壓縮

前言 OS:CentOS 7 hadoop:2.7.7 lzo:lzo-2.10 Apache Maven:3.6.0 JDK:1.8.0_221 hadoop-lzo是一個圍繞lzo壓縮算法實現的Maven項目,基於hadoo

原创 Linux之配置lzo壓縮

前言 OS:CentOS 7 lzo:lzo-2.10 make:4.1 本文主要演示如何編譯lzo源碼,生成lzo函數庫,然後安裝lzo工具lzop。 PS: 如果未安裝make,則可以執行 sudo yum -y grou

原创 Hive之配置和使用LZO壓縮

前言 OS:CentOS 7 Hive:2.3.0 Hadoop:2.7.7 MySQL Server:5.7.10 Hive官方手冊:LanguageManual LZO 在配置Hive使用lzo壓縮功能

原创 通過類名查找Maven依賴

前言 本文主要介紹兩個網站,可以用於查找Maven依賴。這兩個網站的優勢在於,一個能夠根據(全)類名查找Maven依賴,但提供的版本有限,另一個的優勢在於能夠根據關鍵字(如:groupId、artifactId)查找對應的Mav

原创 Hive2.3.0之入門級安裝教程

前言 Hadoop:2.7.7 Hive:2.3.0 MySQL:5.7.10 JDK:1.8.0_221 mysql-connector-java:5.1.38 下載地址 Apache軟件歸檔分發目錄 Apache Hiv

原创 Linux之邏輯卷LV(掛載點)擴容教程

目錄前言1. 創建分區而不進行格式化1.1 `lsblk`查看本系統內所有磁盤及其分區信息1.2 `parted`查看磁盤分區類型與分區信息1.3 根據磁盤分區表類型使用`fdisk/gdisk`工具創建分區1.4 更新Linux

原创 MySQL中Explain關鍵字輸出字段簡介

前言 本文中MySQL版本:5.7.10 MySQL 5.7官方參考手冊:EXPLAIN Output Format Explain輸出字段 id列 此列總是包含一個編號,可以簡單理解爲SELECT子句執行或者表的讀取順序,