台部落暗东方

1.導入maven <dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifactId> <version>2.9.0</version>

2020-07-01 13:44:19

1.導入maven <properties> <spark.version>2.1.1</spark.version> <scala.version>2.11.8</scala.version> <

2020-07-01 13:44:09

1.在/root目錄下創建bin目錄，並在bin目錄下創建文件xsync [root@hadoop100 ~]$ mkdir bin [root@hadoop100 ~]$ cd bin/ [root@hadoop100 bin]

2020-07-01 13:44:08

1.先導入maven <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>5.1.47</

2020-07-01 13:44:08

下載地址下載地址：https://github.com/alibaba/DataX 實際使用 python datax.py --jvm="-Xms5G -Xmx5G" ../job/test.json -p "-Ddt=201

2020-07-01 13:44:07

1.maven導入 <dependency> <groupId>com.github.eulery</groupId> <artifactId>opentsdb-java-sdk</artifactId> <version>

2020-07-01 13:44:07

import org.apache.spark.sql.SparkSession object HiveUtil { /** * 調大最大分區個數 * * @param spark

2020-07-01 13:44:06

1.canal 入門 1.1 什麼是 canal 阿里巴巴B2B公司，因爲業務的特性，賣家主要集中在國內，買家主要集中在國外，所以衍生出了杭州和美國異地機房的需求，從2010年開始，阿里系公司開始逐步的嘗試基於數據庫的日誌解析，獲

2020-07-01 13:44:06

1.在/root/bin目錄下創建腳本xcall.sh [root@hadoop100 bin]$ vim xcall.sh 2.在腳本中編寫如下內容 #! /bin/bash for i in hadoop100 hadoo

2020-02-24 21:37:44

1.導入maven <dependency> <groupId>org.apache.kafka</groupId> <artifactId>kafka-clients</artifactId> <version>0.11.

2020-02-24 21:37:44

概述 2019 年是大數據實時計算領域最不平凡的一年，2019 年 1 月阿里巴巴 Blink （內部的 Flink 分支版本）開源，大數據領域一夜間從 Spark 獨步天下走向了兩強爭霸的時代。Flink 因爲其天然的流式計算特

2020-02-24 21:37:44

1.聚合函數 approx_count_distinct count_distinct近似值 avg 平均值 collect_list 聚合指定字段的值到list collect_set 聚合指定字段的值到set corr

2020-02-24 21:37:44

1.scala讀文本文件 val bufferedSource = Source.fromFile("example.txt") for (line <- bufferedSource.getLines) { printl

2020-02-24 21:37:44

public class ProPertiesUtil { /** * @param fileName 文件名稱 */ public static Properties getProperti

2020-02-24 21:37:43

1.創建數據庫 1）創建一個數據庫，數據庫在HDFS上的默認存儲路徑是/user/hive/warehouse/*.db。 hive (default)> create database db_hive; 2）避免要創建的數據庫

2020-02-24 21:37:43