原创 Curator處理zookeeper會話過期session expired

1、什麼是zookeeper的會話過期? 通常使用zookeeper集羣模式,client和zookeeper集羣(3個實例)建立一個會話session。  所謂session即client隨機與其中一個zk provider建立的鏈接,

原创 如何停止CLOSE_WAIT端口:How do I remove a CLOSE_WAIT socket connection

104 56 I have written a small program that interacts with a server on a specific port. The program works fine,

原创 HttpServer:JDK 內置的輕量級 HTTP 服務器

1. 概述 官方https://docs.oracle.com/javase/9/docs/api/com/sun/net/httpserver/package-summary.html HttpServer 是 JDK 1.6 以後內置的

原创 TPC-DS tools生成數據:ERROR: Failed to open output file! File print.c Line: 490

   生成數據的目錄需要提前創建好 [root@felixzh tools]# mkdir /home/my_data_1G        

原创 Flink KeyBy分佈不均勻問題及解決方法

問題現象 當Key數量較少時,Flink流執行KeyBy(),並且設置的並行度setParallelism()不唯一時,會出現分到不同task上的key數量不均勻的情況,即: 某些subtask沒有分到數據,但是某些subtask分到了較

原创 HBase rowkey與預分區知識點

一、引言 HBase其存儲和讀寫的高性能,作爲Nosql數據庫的一員,HBase查詢只能通過其Rowkey來查詢(Rowkey用來表示唯一一行記錄),Rowkey設計的優劣直接影響讀寫性能。HBase中的數據是按照Rowkey的ASCII字

原创 gradle:secure protocol (like HTTPS) or allow insecure protocols

最近在編譯cruise-control-2.5.92,gradle提示 Using insecure protocols with repositories, without explicit opt-in, has been depre

原创 Configuring Kerberos with OpenLDAP back-end

Configuring Kerberos with OpenLDAP back-end Make sure the LDAP server is using local authentication (ldapi://) or TLS

原创 Kerberos and LDAP

Kerberos supports a few database backends. The default one is what we have been using so far, called db2. The DB Types d

原创 布隆過濾器BloomFilter概念、原理、實現

BitMap 現代計算機用二進制(bit,位)作爲信息的基礎單位,1 個字節等於 8 位。許多開發語言都提供了操作位的功能,合理地使用位能夠有效地提高內存使用率和開發效率。 Bit-map 的基本思想就是用一個 bit 位來標記某個元素對應

原创 哈希函數與哈希衝突

什麼是 Hash Hash(哈希),又稱“散列”。在某種程度上,散列是與排序相反的一種操作,排序是將集合中的元素按照某種方式比如字典順序排列在一起。而散列通過計算哈希值,打破元素之間原有的關係,使集合中的元素按照散列函數的分類進行排列。 在

原创 Bloom Filters by Example

Bloom filter 是一個數據結構,它可以用來判斷某個元素是否在集合內,具有運行快速,內存佔用小的特點。 而高效插入和查詢的代價就是,Bloom Filter 是一個基於概率的數據結構:它只能告訴我們一個元素絕對不在集合內或可能在集合

原创 Troubleshooting Apache Flink with Byteman

Introduction What would you do if you need to see more details of some Apache Flink application logic at runtime, but th

原创 How to Configure RocksDB Logging for Advanced Troubleshooting

Question RocksDB's LOG file comes in handy when troubleshooting Flink with RocksDB. How can I configure RocksDB logging?

原创 Apache Flink - is it possible to evenly distribute slot sharing groups?

We have a pipeline with operations, split into 2 workloads - Source -> Transform are in a first group and are CPU-in