原创 XX:MaxMetaspaceSize 配置

前言 昨天謝照東大神在羣裏提出一個問題:怎麼查看Metaspace裏具體包含的是什麼,起因是他的某個服務設置了 -XX:MetaspaceSize=512m -XX:MaxMetaspaceSize=512m 但是通過jstat -gcut

原创 安裝啓動指南

https://www.milvus.io/cn/docs/milvus_docker-cpu.md docker 倉庫 https://hub.docker.com/r/milvusdb/milvus/tags 安裝 docker

原创 FM算法詳解(因子分解機)

什麼是FM? FM即Factor Machine,因子分解機。 任意的N×N 實對稱矩陣]都有 N 個線性無關的特徵向量。並且這些特徵向量都可以正交單位化而得到一組正交且模爲 1 的向量。故實對稱矩陣 A 可被分解成: 其中Q爲正交矩陣,

原创 機器學習概念總結

超平面 超平面是n維歐氏空間中餘維度等於一的[線性]子空間,也就是必須是(n-1)維度。 這是平面中的直線、空間中的平面之推廣(n大於3才被稱爲“超”平面),是純粹的數學概念,不是現實的物理概念。因爲是子空間,所以超平面一定經過原點。 在[

原创 線性迴歸VS最小二乘法的本質是什麼

最小平方法是十九世紀統計學的主題曲,從許多方面來看, 它之於統計學就相當於十八世紀的微積分之於數學。 ----史蒂芬·史蒂格勒的《The History of Statistics》 日用而不知 來看一個生活中的例子。比如說,有五把尺子:

原创 訓練集、驗證集和測試集 說明

機器學習簡單流程: 使用大量和任務相關的數據集來訓練模型; 通過模型在數據集上的誤差不斷迭代訓練模型,得到對數據集擬合合理的模型; 將訓練好調整好的模型應用到真實的場景中; 我們最終的目的是將訓練好的模型部署到真實的環境中,希望訓練好的

原创 Exception: Python in worker has different version 3.7 than that in driver 3.5, PySpark

Exception: Python in worker has different version 3.7 than that in driver 3.5, PySpark cannot run with different minor v

原创 記一次釘釘報警線上bug

案發現場 https://oapi.dingtalk.com/robot/send?access_token=${token} JDK 版本 1.8.0_20 釘釘java client version=0.9.0-SNAPSHOT gro

原创 windows 下安裝tensorflow

首先聲明幾點: 安裝tensorflow是基於Python的,並且需要從Anaconda倉庫中下載。 所以我們的步驟是:先下載Anaconda,再在Anaconda中安裝一個Python,(你的電腦裏可能本來已經裝了一個Python環境,但

原创 HDFS的高可用性 HDFS的高可用性 利用NAS實現HA QJM高可用

HDFS的高可用性 聯邦hdfs 由於namenode在內存中維護系統中的文件和數據塊的映射信息,所以對於一個海量文件的集羣來說,內存將成爲系統橫向擴展瓶頸。Hadoop在2.x的版本引入了聯邦HDFS(HDFS Federation),通

原创 CMS vs G1基本原理總結 CMS G1 參考資料

CMS CMS(Concurrent Mark Sweep)收集器是一種以獲取​最短回收停頓時間​爲目標的收集器。這是因爲CMS收集器工作時,GC工作線程與用戶線程可以​併發(Concurrent)​執行,以此來達到降低收集停頓時間的目的

原创 瘋子在思考之-mybatis3的sqlSession

關於sqlsession我們先看這些問題:我們做web開發,很容易聯繫到http的session,那麼它跟進http的session有關係嗎?如果非要

原创 開源的高性能 0 依賴的JAVA基礎開發框架SPARROW

麻雀雖小,但五臟俱全 sparrow 源自中國俗語 麻雀雖小,但五臟俱全,努力打造一個全新的低耦合,0依賴的高性能java 開發基礎框架。 這個框架我從11年開始寫,中間重構了n遍,最原始的代碼可能都找不到了,之所以堅持寫,最初並不是想

原创 JVM 收集器簡介

收集器簡介 https://blogs.oracle.com/jonthecollector/our-collectors 收集器 串行、並行or併發 新生代/老年代 算法 目標 適用場景 權威解釋 Serial 串行 新生代

原创 CMS收集器 VS G1

CMS收集器 VS G1 CMS(Concurrent Mark Sweep)收集器是一種以獲取最短回收停頓時間爲目標的收集器。這是因爲CMS收集器工作時,GC工作線程與用戶線程可以併發(Concurrent)執行,以此來達到降低收集停頓時