台部落不是猿是员

原创 Spark 遇到OOM怎麼解決

Spark中的OOM問題不外乎以下兩種情況 map執行中內存溢出 shuffle後內存溢出 Spark 內存模型： Spark在一個Executor中的內存分爲三塊：

2019-08-07 21:31:37

1

原创 Flink之window函數詳解

1、官網: https://ci.apache.org/projects/flink/flink-docs-release-1.7/concepts/programming-model.html#windows （建議大家多看

2019-07-31 21:45:44

原创 MySQL存儲程序中觸發器和存儲過程的使用

--最近在項目中總是用到MySQL的觸發器和存儲過程，爲了加

2019-07-30 22:40:10

原创 Spark SQL讀取HBase中數據的優化

在項目過程中中，我們會經常使用Spark SQL去查詢/分析HBase中的數據，內置的讀取數據源使用的是TableInputFormat ，這個TableInputFormat 有一些缺點：一個Task裏面只能啓動一個Scan

2019-07-30 22:40:10

3

原创 Python連接MySQL進行DML操作

1、安裝PyMySQL 本地：pip install pymysql Anaconda:conda install pymysql 2、插入數據 # coding=gbk import pymysql from pymysql.cu

2019-07-30 22:40:10

原创 HBase的優化（參數）

配置優化zookeeper.session.timeout默認值：3分鐘（180000ms）說明：RegionServer與Zookeeper間的連接超時時間。當超時時間到後，ReigonServer會被Zookeeper從RS集羣清單中

2019-07-08 22:14:30

原创 Shell常用操作

1、參數 shell語言，採用$0,$1,$2..等方式獲取腳本命令行傳入的參數，值得注意的是，$0獲取到的是腳本路徑以及腳本名，後面按順序獲取參數，當參數超過10個時(包括10個)，需要使用${10},${11}....才能獲取到

2019-06-26 23:16:23

原创 Vsql命令行命令詳解

基本格式： Vsql [連接選項] [常規選項] [輸入輸出選項] 1、常規選項： -d DBNAME指定要連接的數據庫名稱（默認值：“A”） -c COMMAND只運行單個命令（SQL或內部）並退出 -f FILE

2019-06-26 23:16:23

原创 Kafka中的分區分配（面試點）

“請你簡述一下Kafka中的分區分配” 以前在面試中遇到了這個問題，當時不太清楚balabala說了一大堆，現在總結下，希望對大家有用。在Kafka中，分區分配是一個很重要的概念，卻往往會被讀者忽視，它會影響

2019-06-24 22:18:50

1

原创 Oracle存儲過程的使用

最近在項目中需要寫存儲過程，於是在自己學習了一段時間，總結下，希望對大家學習有些幫助；先上模板： create or replace procedure 要創建的存儲過程名稱(入參a in varchar2, 出參

2019-06-24 22:18:50

原创 Flink版WordCount（Streaming and Batch）

Flink 程序開發步驟 1：獲得一個執行環境 2：加載/創建初始化數據 3：指定操作數據的transaction算子 4：指定把計算好的數據放在哪 5：調用execute()觸發執行程序注意：Flink程序是延遲計算的，只有最後調用

2019-05-07 15:22:02

原创 Vertica常用SQL操作

一、查詢與修改 1、查詢 --導出表的結構： select export_objects('','app_z.test') --收集統計信息 select analyze_statistics('app_z.test') --重置

2019-05-01 00:50:58

9

原创 Spark 遇到OOM怎麼解決

原创 Flink之window函數詳解

原创 MySQL存儲程序中觸發器和存儲過程的使用

原创 Spark SQL讀取HBase中數據的優化

原创 Python連接MySQL進行DML操作

原创 HBase的優化（參數）

原创 Shell常用操作

原创 Vsql命令行命令詳解

原创 Kafka中的分區分配（面試點）

原创 Oracle存儲過程的使用

原创 Flink版WordCount（Streaming and Batch）

原创 Vertica常用SQL操作

原创 linux 三大劍客之grep

原创 Flink數據流編程模型

原创深入理解Flink的核心技術