原创 迴歸&logistics迴歸筆記-七月算法(julyedu.com)4 月機器學習算法班學習筆記
過擬合 logistic迴歸 損失函數 性能分析 性能優化 關於樣本處理 關於特徵的優化處理 關於模型算法的參數優化 以下內容摘抄於七月算法(julyedu.com)4 月機器學習算法班課堂講義 過擬合 解決方法
原创 01算法概論
複雜度: 空間複雜度:運行市需要的設備的數量 時間複雜度: 算法分析: 輸入規模衡量 運行時間衡量 最壞情況不平均情況 增長量級(增長量級、增長率) ·關於數學術語和記號 (a)
原创 ubuntu 掛載 window7 共享文件夾
目錄 一、目標 二、步驟 一、目標 將window7的共享文件夾掛載到在ubuntu的 /mnt/winshare (文件夾路徑:D:\pythonwork,主機IP 192.168.1.100) 二、步驟 2.1 win
原创 分治法:歸併排序分析
目錄 一.分而治之 二.歸併排序性能分析 一.分而治之: 遞歸算法的複雜度計算方法: 1、代入法 2、遞歸樹法 P50 3、主方法 二.歸併排序性能分析: 假設求解規模爲n的問題耗時爲,當n=1,。當n>
原创 Lucas-Kanade 算法原理以及應用
Lucas-Kanade 算法原理以及應用 Lucas-Kanade 算法原理以及應用 一 算法原理 1 目標函數 2 一階泰勒公式展開 3 最小化目標函數條件下的pDelta p 二 LK算在跟蹤的應用 1 平移角度
原创 【轉】機器學習中距離和相似性度量方法
漫談:機器學習中距離和相似性度量方法 在機器學習和數據挖掘中,我們經常需要知道個體間差異的大小,進而評價個體的相似性和類別。最常見的是數據分析中的相關分析,數據挖掘中的分類和聚類算法,如 K 最近鄰(KNN)和 K 均值(K-
原创 簡單線性迴歸分析【筆記】
簡單線性迴歸分析 目錄 簡單線性迴歸分析 目錄 摘要 引言 算法名稱 歸類 Metaphor Strategy Procedure 1 參數估計 2 模型檢驗 21 迴歸係數的顯著性檢驗 t檢驗 F檢驗 相關係數 22
原创 Windws MySQL客戶端 訪問 ubuntu MySQL服務器
假設在安裝是已經設置了root賬戶,以及其密碼:123456 服務器IP:192.168.1.102 步驟 1、ubuntu下對MySQL設置: 1.1 修改 my.cnf文件 修改 /etc/mysql/my.cnfbi
原创 關於python的類
一、python的類 1.1 定義: class [類名](父類名): 【注意要有冒號】 如果沒有特別指定的父類,建議父類爲object,即 “ class [類名](父類object):” 1.2 self,cls
原创 布隆過濾器(Bloom Filter)詳解
【轉】原文連接 布隆過濾器[1](Bloom Filter)是由布隆(Burton Howard Bloom)在1970年提出的。它實際上是由一個很長的二進制向量和一系列隨機映射函數組成,布隆過濾器可以用於檢索一個元素是否在一個
原创 堆排序及性能分析
目錄 一 堆的相關知識 二 堆的僞代碼 三 堆的算法性能分析 一 堆的相關知識 1.1 堆的性質 1、下標爲i的下標,其父節點爲floor(i/2),左子節點下標爲2i,其右子節點下標爲2i+1 2、n個元素的堆時,葉節點的下標爲fl
原创 RANSAC算法
『原文地址』 大概太久沒更新了,壓力就越大了,工作比較忙,人比較懶,寫一篇高質量的文章還是比較耗時間的,這樣吧,以後就發一些我覺得比較實用的東西吧,就那麼一個小片段,這樣我也比較有時間,比較有動力,假如你有什麼建議可以留言。 今天
原创 關於eclipse 開發java程序的要點
目錄 目標 實驗內容 一、新建一個java項目 二、生成指定包 三、在指定包內編寫java程序 四、添加外部JAR文件 五、
原创 spark/scala關於【資源文件】加載方法
概述 外部文件加載方案測試 資源文件打包入jar包中 小結 概述 在spark的client模式加載文件 1 文件存在於客戶端的本地(非hdfs): 對於這種本地文件,可採用 Source. fromFile (LocalPa
原创 分類器訓練的過擬合問題和處理方法【未整理完成】
一 過擬合 模型訓練過程中過度擬合訓練集,將訓練樣本中的噪聲(錯誤的樣本)學習進去,使得訓練誤差不斷降低和模型複雜度不斷提高,最終導致泛化誤差升高的一種現象 成因:噪聲(錯誤的樣本),樣本過少/缺乏代表性 二 預測泛化誤差【1】