原创 【Sqoop】數據同步

HDFS數據導入Mysql實踐   源數據是SparkSQL job生成的,基於Sqoop將數據同步到Mysql HDFS文件類型默認是parquet 壓縮格式是snappy   SparkSQL寫入HDFS,如果路徑不存在,自動創建,

原创 【容器】ConcurrentHashMap

併發容器基礎 ConcurrentHashMap   https://www.pdai.tech/md/java/thread/java-thread-x-juc-collection-ConcurrentHashMap.html htt

原创 【Zookeeper】Zookeeper與一致性算法

一致性協議算法: 2PC 3PC   Paxos 節點角色: 1. Proposer 2. Acceptor 3. Learner          

原创 【Spark】存儲原理

    Spark內存管理: https://www.jianshu.com/p/2835d2c2c718

原创 【Spark】深入理解Spark本地化

    spark.locality.wait 3s How long to wait to launch a data-local task before giving up and launching it on a less-loc

原创 【Spark】Spark任務執行原理

DAGScheduler:根據寬依賴操作,劃分stage,將stage中的task封裝成tastset TaskScheduler:接收DAGScheduler提交的調度階段,並將任務發送到節點,在節點執行任務。 1)針對RDD做各種轉換

原创 【Flask】werkzeug版本問題

Flask1.1 中使用werkzeug1.0.0報錯。   查詢後得知這是因爲werkzeug新版本里需要顯式導入該模塊 在報錯的文件(我這裏是werkzeug/init.py)裏添加以下代碼可以解決該問題 from werkzeug

原创 【Spark】SparkSession基礎

  SparkSession = SparkContext + HiveContext + StreamingContext + SQLContext   val conf = new SparkConf().setMaster("ma

原创 【Zookeeper讀書筆記-3】客戶端原理

1 基礎概念 ClientCnxn是網絡連接器,管理客戶端與服務端的網絡交互。 ClientWatchManager保存客戶端的watcher HostProvider服務器地址列表管理器 outgoingQueue客戶端的請求發送隊列

原创 【Flask】Flask Werkzeug版本兼容問題

1 環境 Python3.6 Flask1.1.1 Werkzeug:1.0.0 2 報錯信息 3 解決辦法 Werkzeug新版本兼容問題。 3.1 解決辦法1 用到Werkzeug的源文件中,添加如下: from werkzeug

原创 【SVN】SVN常用命令

SVN常用命令 已經add的文件,如何取消add:svn  revert --recursive  apilog/ 克隆文件: 在SVN上傳一份新的工程:cas_sso_53目錄不能存在則,則新建 svn import cas_sso_5

原创 【Zookeeper讀書筆記-2】序列化框架Jute

1 Jute概念 ZK客戶端與服務端的網絡通信和數據傳輸,需要首先解決的事數據序列化與反序列化問題。 Jute前身是Hadoop Record IO,後來Hadoop框架採用Avro(跨語言特性好,數據結構豐富,對MR的支持),Recor

原创 【Zookeeper】01_系統模型

目錄1 數據模型2 節點類型3 狀態信息4 Watcher機制4.1 Watcher基礎4.2 Watcher事件4.3 process回調方法4.4 Watcher工作機制4.4.1 客戶端註冊Watcher4.4.2 服務端

原创 【RPC】01_RPC原理及應用

目錄基礎概念GRPC2 基礎概念 GRPC 2 引用

原创 【Mysql】SQL創建修改表信息

一.基礎知識 1.創建表的時候寫註釋 create table test1(    field_name int comment '字段的註釋' ) comment='表的註釋'; 2.修改表的註釋 alter table test