台部落大海之中

代價函數 https://blog.csdn.net/sd9110110/article/details/52863390

2019-06-13 13:48:07

主要分成兩部分，yarn的安裝與flink的安裝，共3臺機器 10.10.10.12510.10.10.126 10.10.10.127 ------------------------------------------------

2019-06-11 13:44:28

今天寫了一個稍微複雜的例子，實現了類似mysql group_concat 功能，記錄一下MapToString 參考bug 那篇博客 public static void main(String[] arg) throws Excep

2019-05-23 13:44:24

羅列一下bug，備註一下，後續不斷完善註冊表時，請勿使用result tableEnv.registerTable("result_agg", talbe); 如上，如果你寫爲 tableEnv.registerTable(

2019-05-22 13:46:00

接着上一篇，將mysql的數據導入kafka中 public static void main(String[] arg) throws Exception { TypeInformation[] fieldTypes =

2019-05-17 13:46:27

private final static Logger logger = LoggerFactory.getLogger(GetData.class); public static void main(String[] arg)

2019-05-16 13:44:46

發現基於物品的協同過濾簡單，實用，而ALS算法計算不易，所以記錄一下。 https://blog.csdn.net/u011630575/article/details/78649331

2019-05-13 13:45:41

這兩天線上的ES集羣總是有問題，開始查找原因發現這段時間各個機器的負載都很高，本來希望通過jstack找到一些信息，但居然提示‘Unable to open socket file: target process not respondin

2019-05-11 13:46:01

今天找搜索專家聊了一下大廠的搜索引擎 1 如果數據量很大，可以擴大分片，比如建立32個分片，merge的時候可能耗時2 如果倒排拉鍊很長，可以建一個bitmap（ES貌似不支持）3 如果召回很大，比如只差status=1，可能有100w個o

2019-04-19 13:44:58

跳錶，求交集如何做到logn的複雜度 https://www.cnblogs.com/bonelee/p/6394451.html

2019-04-06 13:44:25

1 統計日誌中某個字段的情況 grep "productId" 1.csv | awk '{print $8}' | awk -F ':' '{print $11}' | awk -F ',' '{print $1}' | uniq -c

2019-04-01 13:40:47

kafka topic下的一個分區只能被同一個consumer group下的一個consumer線程來消費，但反之並不成立，即一個consumer線程可以消費多個分區的數據，比如Kafka提供的ConsoleConsumer，默認就只是一

2019-03-16 13:39:43

情感預測 https://blog.csdn.net/William_2015/article/details/72978387和他類似的還有一篇文章https://machinelearningmastery.com/use-word

2019-02-22 21:14:58

ConcurrentHashMap https://mp.weixin.qq.com/s?__biz=MjM5NzMyMjAwMA==&mid=2651478868&idx=1&sn=1aa298b9ba67ab33ea8af9c7627

2019-02-02 13:24:55

以前寫的一遍文章，被刪除了，現在補回來。首先安裝插件 dynamic-synonym，curl -XPOST "http://localhost:9200/*/" -d '{ "analysis": {

2019-02-02 13:24:55