原创 XX:MaxMetaspaceSize 配置
前言 昨天謝照東大神在羣裏提出一個問題:怎麼查看Metaspace裏具體包含的是什麼,起因是他的某個服務設置了 -XX:MetaspaceSize=512m -XX:MaxMetaspaceSize=512m 但是通過jstat -gcut
原创 安裝啓動指南
https://www.milvus.io/cn/docs/milvus_docker-cpu.md docker 倉庫 https://hub.docker.com/r/milvusdb/milvus/tags 安裝 docker
原创 FM算法詳解(因子分解機)
什麼是FM? FM即Factor Machine,因子分解機。 任意的N×N 實對稱矩陣]都有 N 個線性無關的特徵向量。並且這些特徵向量都可以正交單位化而得到一組正交且模爲 1 的向量。故實對稱矩陣 A 可被分解成: 其中Q爲正交矩陣,
原创 機器學習概念總結
超平面 超平面是n維歐氏空間中餘維度等於一的[線性]子空間,也就是必須是(n-1)維度。 這是平面中的直線、空間中的平面之推廣(n大於3才被稱爲“超”平面),是純粹的數學概念,不是現實的物理概念。因爲是子空間,所以超平面一定經過原點。 在[
原创 線性迴歸VS最小二乘法的本質是什麼
最小平方法是十九世紀統計學的主題曲,從許多方面來看, 它之於統計學就相當於十八世紀的微積分之於數學。 ----史蒂芬·史蒂格勒的《The History of Statistics》 日用而不知 來看一個生活中的例子。比如說,有五把尺子:
原创 訓練集、驗證集和測試集 說明
機器學習簡單流程: 使用大量和任務相關的數據集來訓練模型; 通過模型在數據集上的誤差不斷迭代訓練模型,得到對數據集擬合合理的模型; 將訓練好調整好的模型應用到真實的場景中; 我們最終的目的是將訓練好的模型部署到真實的環境中,希望訓練好的
原创 Exception: Python in worker has different version 3.7 than that in driver 3.5, PySpark
Exception: Python in worker has different version 3.7 than that in driver 3.5, PySpark cannot run with different minor v
原创 記一次釘釘報警線上bug
案發現場 https://oapi.dingtalk.com/robot/send?access_token=${token} JDK 版本 1.8.0_20 釘釘java client version=0.9.0-SNAPSHOT gro
原创 windows 下安裝tensorflow
首先聲明幾點: 安裝tensorflow是基於Python的,並且需要從Anaconda倉庫中下載。 所以我們的步驟是:先下載Anaconda,再在Anaconda中安裝一個Python,(你的電腦裏可能本來已經裝了一個Python環境,但
原创 HDFS的高可用性 HDFS的高可用性 利用NAS實現HA QJM高可用
HDFS的高可用性 聯邦hdfs 由於namenode在內存中維護系統中的文件和數據塊的映射信息,所以對於一個海量文件的集羣來說,內存將成爲系統橫向擴展瓶頸。Hadoop在2.x的版本引入了聯邦HDFS(HDFS Federation),通
原创 CMS vs G1基本原理總結 CMS G1 參考資料
CMS CMS(Concurrent Mark Sweep)收集器是一種以獲取最短回收停頓時間爲目標的收集器。這是因爲CMS收集器工作時,GC工作線程與用戶線程可以併發(Concurrent)執行,以此來達到降低收集停頓時間的目的
原创 瘋子在思考之-mybatis3的sqlSession
關於sqlsession我們先看這些問題:我們做web開發,很容易聯繫到http的session,那麼它跟進http的session有關係嗎?如果非要
原创 開源的高性能 0 依賴的JAVA基礎開發框架SPARROW
麻雀雖小,但五臟俱全 sparrow 源自中國俗語 麻雀雖小,但五臟俱全,努力打造一個全新的低耦合,0依賴的高性能java 開發基礎框架。 這個框架我從11年開始寫,中間重構了n遍,最原始的代碼可能都找不到了,之所以堅持寫,最初並不是想
原创 JVM 收集器簡介
收集器簡介 https://blogs.oracle.com/jonthecollector/our-collectors 收集器 串行、並行or併發 新生代/老年代 算法 目標 適用場景 權威解釋 Serial 串行 新生代
原创 CMS收集器 VS G1
CMS收集器 VS G1 CMS(Concurrent Mark Sweep)收集器是一種以獲取最短回收停頓時間爲目標的收集器。這是因爲CMS收集器工作時,GC工作線程與用戶線程可以併發(Concurrent)執行,以此來達到降低收集停頓時