台部落b1gx

一、spark-submit腳本內容分析 if [ -z "${SPARK_HOME}" ]; then source "$(dirname "$0")"/find-spark-home fi # disable rando

2020-06-26 13:26:45

AWK 一般用於對文本內容進行統計、按需要的格式進行輸出 AWK腳本的流程控制輸入數據前例程BEGIN{} 主輸入循環{} 所有文件讀取完成例程END{} AWK的字段每行稱作AWK的記錄使用分隔符（默認是空格）分

2020-06-26 13:26:45

問題：使用mysqlbinlog工具查看MySQL的binlog日誌時出現如下錯誤 bigdata:mysqladmin:/usr/local/mysql/arch:>mysqlbinlog mysql-bin.000001 >

2020-06-26 13:26:45

Rowkey的作用 Rowkey用於標識唯一的行 HBase中的數據都是根據Rowkey的字典序存儲的，比如memstore中的數據和HFile中的數據讀寫數據都需要通過Rowkey來定位Region Rowkey的設計原則

2020-06-26 13:26:45

一、支持lzo壓縮安裝 lzop native library [root@bigdata ~]# yum -y install lzo-devel zlib-devel gcc autoconf automake

2020-06-26 13:26:45

一、常用元字符簡介字符功能 \ 轉義字符 . 匹配除換行符（\n、\r）之外的任意一個字符 * 匹配前面的子表達式零次或多次 + 匹配前面的子表達式一次或多次 ? 匹配前面的子表達式零次或一次

2020-06-26 13:26:45

sed 一般用於對文本內容做替換 1. 基本使用 sed的基本工作方式將文件以行爲單位讀取到內存（模式空間）使用sed的每個腳本對該行進行操作處理完成後輸出該行 sed的替換命令s: sed ‘s/old/

2020-06-26 13:26:45

一、繼承Thread類通過自定義類繼承Thread類來創建 class MyThread extends Thread { @Override public void run() { for (i

2020-06-26 13:26:45

一、準備源碼下載 [hadoop@bigdata source]$ wget http://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.15.1-src.tar.gz

2020-06-26 13:26:45

1、 Hive 中的數據庫本質是一個目錄，通常數據庫保存在hive.metastore.warehouse.dir所指定的目錄下，以.db爲後綴，例如testDB.db，該數據庫中的表以這個數據庫目錄的子目錄存在。注：defa

2020-06-26 13:26:45

github下載對應版本的hadoop.dll 和 winutils.exe 下載地址配置環境變量步驟1下載的東西放到這個目錄裏面，在Path中添加如下 IDEA創建Maven項目 pom文件 <properties

2020-06-26 13:26:45

一、需求有如下數據 gifshow.com 2019/01/01 5 yy.com 2019/01/01 4 huya.com 2019/01/01 1 gifshow.com 2019/01/20 6 g

2020-06-26 13:26:45

將active namenode殺死，standby namenode進程無法自動切換爲active狀態，查看hadoop-hdfs-zkfc-ha-master01.log，出現如下錯誤信息 2020-01-14 01:07:5

2020-06-26 13:26:45

一、需求查詢每個產品top3的用戶信息，初始數據表如下 uid pid user9 e user2 a user14 e user6 b user12 a ... ... ... ... 二、實現 #每

2020-06-26 13:26:45

問題有kCount個線程，從1開始編號，順序打印1,2,3…，打印到n； eg：kCount = 3; n = 10; 輸出： Thread 1 -> 1 Thread 2 -> 2 Thread 3 -> 3 Thread 1

2020-04-05 21:02:00