原创 JDK1.8 ArrayList源碼剖析(二)

JDK1.8中新增的特性: 1. void forEach(Consumer<? super E> action):JDK8中新特性,對list中每個元素分別進行操作,如: ArrayList<Integer> al = new

原创 矩陣的初等變換與線性方程組

矩陣的初等變換 初等矩陣 矩陣的秩 線性方程組的解 矩陣的初等變換 以下三種變換稱爲矩陣的初等行變換: 對調兩行(對調第i,ji,j 兩行,記作ri↔rjri↔rj ); 以數k(≠0)k(≠0) 乘以某一行中的所有元

原创 [數據與處理]歸一化(連續值和離散值)

歸一化原因 歸一化目的 連續值歸一化常見方法 Max-Min 0均值標準化Z-Score 對數函數法 反正切函數 離散值歸一化常見方法 One-Hot編碼 歸一化原因 如果多個特徵之間數值差異較大,那麼收

原创 二次型

二次型及其矩陣 化二次型爲標準形 用正交變換化二次型爲標準形 用配方法化二次型爲標準形 慣性定理 正定二次型 二次型及其矩陣 含nn 個變量x1,x2,...,xnx1,x2,...,xn 的二次齊次多項式f(x1,

原创 矩陣的特徵值與特徵向量

矩陣的特徵值與特徵向量 相似矩陣 實對稱矩陣的對角化 向量的內積 實對稱矩陣的對角化 矩陣的特徵值與特徵向量 設矩陣AA 是nn 階方陣,如果存在數λλ 和非零向量xx ,使得Ax=λx,(1)(1)Ax=λx, 則

原创 向量組的線性相關性

向量組及其線性組合 向量組的線性相關性 向量組的秩 向量空間 線性方程組解的結構 向量組及其線性組合 nn 個有次序的數a1,a2,...,ana1,a2,...,an 所組成的一個有序數組(a1,a2,...,an)(

原创 參數估計

樣本的統計量 設隨機變量X 的N 個樣本爲X1,X2,...,Xn ,則 1. 樣本均值爲:X¯¯¯=1n∑i=1nXi, 2. 樣本的方差爲:S2=1n−1∑i=1n(Xi−X¯¯¯)2 樣本方差的分母使用n−1 而非n

原创 [Spark_mllib]K-Means

K-means 優缺點 步驟 使用後處理來提高聚類性能 二分K-Means算法 Spark實現KMeans 關鍵步驟 聚類個數K的選擇 初始聚類中心點的選擇 MLlib的K-means實現 參數 Spark_K-Mea

原创 [機器學習實戰]kNN

原理 源碼 加權kNN 高斯函數 交叉驗證 原理 kNN(k近鄰算法)的基本思想就是選擇距離待分類點最近的K個點,統計這K個點中出現的分類的概率, 出現概率最高的分類即爲待分類點的分類 源碼 from nump

原创 常用數學公式(一)

自然常數ee=limx→∞=(1+1x)x=e=limx→∞=(1+1x)x=e ; 導數就是曲線的斜率,反映曲線改變的快慢; 二階導數反映斜率改變的快慢,表徵曲線的凹凸性; 常用函數的導數: C′=0C′=0 (xn)′=n

原创 數理統計(一)——統計量

期望 方差 標準差 協方差 協方差和獨立不相關 協方差的意義 協方差的上界 協方差矩陣 獨立和不相關 Pearson相關係數 偏度 峯度 矩 期望 期望可以簡單理解爲概率加權下的“平均值”,即試驗中每次可能結果

原创 數理統計(二)——切比雪夫不等式、大數定理、伯努利定理、中心極限定理

切比雪夫不等式 含義:設隨機變量XX 的期望爲μμ ,方差爲σ2σ2 ,對於任意正數εε ,有:P{|X−μ|≥ε}≤σ2ε2P{|X−μ|≥ε}≤σ2ε2 切比雪夫不等式說明,X的方差越小,事件{|X−μ|≤ε}{|X−μ|≤

原创 AOP基礎

背景問題 AOP簡介 AOP術語 用AspectJ註解聲明切面 前置通知 後置通知 返回通知 異常通知 環繞通知 引入通知(較少使用) 切面的優先級 重用切點表達式 基於配置文件配置AOP 背景問題 代碼混亂:越來越

原创 RedisCluster使用pipeline批量讀取數據

 因爲公司的Redis是Cluster的,一共有三臺主機,有個需求是同時讀取三千條數據,因爲是Cluster,所以沒辦法直接使用mget。  目前在網上找到的方法有兩種,一種是寫入時處理,一種是讀取時處理。  先說一

原创 Bean相關問題

IOC&DI概述 配置bean 自動裝配 Bean之間的關係(繼承、依賴) Bean的作用域:singleton;prototype;WEB環境作用域 使用外部屬性文件 SpEL(Spring表達式語言) Spring管理B