原创 關於協程的一些個人理解

用了這麼多年java,覺得java不支持協程就是無腦的行爲,必須爲go支持協程點個贊,最近在優化性能,對過了這麼多年java仍然沒在語言級提供協程感覺痛心,剛好看到一篇文章: https://www.jianshu.com/p/837bb

原创 K-means聚類自定義距離計算的開源算法選擇

如果你想自己定義一個距離的function的話,scikit-learn是不行的,只支持Euclidean distance 如果你覺得spark可以的話,實際上sprk的k-means也是不行的,好一點的是支持Euclidean dis

原创 單變量分析的一些有用網絡資源

Python數據分析25——seaborn可視化(二)之單變量分佈圖    https://blog.csdn.net/weixin_44080811/article/details/92193960   數據分析:Pandas單變量圖

原创 後臺人員使用VUE入門

很久沒有寫web,最近寫一個簡單的DEMO,後臺使用python,簡單的總結下: 1、組件選擇 VUE+ELEMENT-UI,組件用ELEMENT-UI基本溝通 2、編輯工具: vscode,使用的vue插件用的vetur,基本上夠用。鍵

原创 python安裝中出現 cannot install ''xxx" .It is a distutils installed project and thus we cannot uninstall

tf出現一個庫無法卸載,最終解決,其實主要的原因是無法通過pip uninstall卸載,總結經驗如下: 1、直接刪除在site-package下的相關包 如果找到相關的包,可以參考: https://blog.csdn.net/qq_3

原创 一個不錯的java機器學習項目JSAT

官方地址: https://github.com/EdwardRaff/JSAT/   項目目標: java的sklearn 主要的算法見: https://github.com/EdwardRaff/JSAT/wiki/Algorith

原创 時間序列數據挖掘研究主要內容

主要包括: 1、時間序列相似性搜索 2、時間序列聚類 3、時間序列分類 4、時間序列分割與模式發現 5、海量時間序列可視化 6、時間序列預測   主要應用場景: 1、股票交易 2、銷售或訂單預測 3、氣象預測 4、各種比賽人數的預測 等等

原创 關於ad hoc retrieval的解釋

轉自於: https://blog.csdn.net/memray/article/details/41149633 Q:關於ad hoc retrieval的解釋 Answer: TREC剛開始的時候只有兩個任務,ad hoc和rout

原创 秒殺系統思維導圖

以前整理的文檔,從後端的角度來看的一些注意要點,熱點分離部分在中等的公司基本上不需要。  

原创 AI工程化涉及到的開源選型項目(持續更新)

算法落地會涉及到原始數據加工、原始數據採集、工作流調度和緩存等,以下是今年工程化涉及到的一些開源產品、 圖數據庫: HugeGraph: 開源分佈式圖數據存,百度開源,分佈式,存儲引擎依賴於第三方 dgraph:開源分佈式圖數據庫,存儲引

原创 一個很不錯的spss數據分析博客

數據小兵成長記 http://www.datasoldier.net/   非常不錯

原创 應該從哪裏檢索論文

1、日常關注 國內推薦paperweekly http://www.paperweekly.site/rank 有一個模塊:今日arXiv ,發現arxiv上的新文章,很不錯   知乎上關注的人和專欄: 關注人導航:  個人中心--》我關

原创 2018總結之一

AI相關知識拓展 1、開始做NLP,分類、分詞和對話有了較深入認識,但是沒什麼成果 2、現在忙的做推薦系統,初步的產品感覺難度不大,但是在數據整合上認識有錯誤 3、python比以前好那麼一點點,學會了一點VUE 大數據:基本上沒什麼變化

原创 大數據典型的技術棧

引用: https://www.jianshu.com/p/c688e47dae1d https://blog.csdn.net/u013710265/article/details/72580238   計算層少了當前的比較主流的: i

原创 你可能不需要一個推薦系統

推薦系統對一個企業來說是一個標準的配置,但是很多情況下並不適用,典型的這幾種情況並 1、本身嚴格的規則就能產生很大的收益 2、數據的支撐不夠,初期不夠,後期無法效果回收 3、ab測試環境沒有 1主要是場景的問題,有些垂直特殊的場景確實推薦