原创 Elasticsearch檢索分類深入詳解—基礎篇

題記 Elasticsearch中當我們設置Mapping(分詞器、字段類型)完畢後,就可以按照設定的方式導入數據。 有了數據後,我們就需要對數據進行檢索操作。根據實際開發需要,往往我們需要支持包含但不限於以下類型的檢索: 1)精確匹配,

原创 spark+elasticsearch

環境:elasticsearch 1.7 java 1.8 scala 2.11.8 sbt 1.2.6 spark 2.3.2 代碼 package ex import org.apache.spark.sql.SparkSessi

原创 idea+sbt

1 idea新建sbt scala項目 https://blog.csdn.net/aliceyangxi1987/article/details/76423334 2 自己下載sbt集成到idea項目裏 https://www.cnbl

原创 idea

1 本人最近剛開始切換到 Intellij idea,發現一個問題,maven工程項目老是有紅色下劃線提示錯誤:Cannot Resolve Symbol ......,但是這些依賴都已經通過pom引進了,idea的Library中也能看

原创 JAVA反射機制及應用場景

往往當我們面對一項新的知識時,我們往往需要知道三個方面,它是什麼,它能做什麼,它比原有知識強在哪裏,我們該怎麼使用它。當你能夠解決這些問題時,便意味着你已經對這項知識入門了。 一、是什麼   Java Reflaction in Acti

原创 Maven生成可以直接運行的jar包的多種方式

引用自: https://blog.csdn.net/xiao__gui/article/details/47341385 Maven可以使用mvn package指令對項目進行打包,如果使用java -jar xxx.jar執行運行ja

原创 elasticsearch查詢總結

ES操作還是應該看官網api指南,這裏寫了幾個自己用到的,作爲總結記錄。 https://www.elastic.co/guide/en/elasticsearch/reference/5.1/search-aggregations-me

原创 elasticsearch心得體會

1 聚合搜索的字段如果是求和的情況下,字段不能爲string類型,那麼排序時字段要求是不是也一樣呢?  

原创 Java併發編程:線程池的使用

https://www.cnblogs.com/dolphin0520/p/3932921.html Java併發編程:線程池的使用   在前面的文章中,我們使用線程的時候就去創建一個線程,這樣實現起來非常簡便,但是就會有一個問題:   

原创 Python併發編程之線程池/進程池

轉載 http://python.jobbole.com/87272/ 引言 Python標準庫爲我們提供了threading和multiprocessing模塊編寫相應的多線程/多進程代碼,但是當項目達到一定的規模,頻繁創建/銷燬進程或

原创 python讀取redis三種方式效率對比

橫軸是讀取redis的key的數量,縱軸是時間。綠色是pipline方式,藍色是單次讀取,紅色是mget方式讀取。此圖在相同環境下運行時間對比,包含連接redis和讀取時間,有比較意義。 {0: {1000: 0.05, 20000: 0

原创 機器學習隨筆

1 隨機森林在大數據量和feature較多的時候效果比較好,反之的環境下還不如單獨的決策樹。 森林中的每棵樹都是獨立的,99.9%不相關的樹做出的預測結果涵蓋所有的情況,這些預測結果將會彼此抵消。少數優秀的樹的預測結果將會超脫於芸芸“噪音

原创 git操作一之原庫建分支

Administrator@GZ-20160802BKJG MINGW64 /e/migu/workspace/aggregation-game-service

原创 C++ 多態覆蓋隱藏重載

直到今日,才發現自己對重載的認識長時間以來都是錯誤的。幸虧現在得以糾正,真的是恐怖萬分,雷人至極。一直以來,我認爲重載可以發生在基類和派生類之間,例如: 1 class A { 2 public: 3 void

原创 git操作一之新庫建分支

Administrator@GZ-20160802BKJG MINGW64 /e/migu/workspace/xianwangnewGit $ git clone http://183.192.190.11:8085/cmam/aggr