原创 迴歸&logistics迴歸筆記-七月算法(julyedu.com)4 月機器學習算法班學習筆記

過擬合 logistic迴歸 損失函數 性能分析 性能優化 關於樣本處理 關於特徵的優化處理 關於模型算法的參數優化 以下內容摘抄於七月算法(julyedu.com)4 月機器學習算法班課堂講義 過擬合 解決方法

原创 01算法概論

複雜度:      空間複雜度:運行市需要的設備的數量     時間複雜度: 算法分析:     輸入規模衡量     運行時間衡量     最壞情況不平均情況      增長量級(增長量級、增長率) ·關於數學術語和記號 (a)

原创 ubuntu 掛載 window7 共享文件夾

目錄 一、目標 二、步驟 一、目標 將window7的共享文件夾掛載到在ubuntu的 /mnt/winshare (文件夾路徑:D:\pythonwork,主機IP 192.168.1.100)   二、步驟 2.1 win

原创 分治法:歸併排序分析

目錄 一.分而治之 二.歸併排序性能分析 一.分而治之: 遞歸算法的複雜度計算方法: 1、代入法 2、遞歸樹法 P50 3、主方法  二.歸併排序性能分析: 假設求解規模爲n的問題耗時爲,當n=1,。當n>

原创 Lucas-Kanade 算法原理以及應用

Lucas-Kanade 算法原理以及應用 Lucas-Kanade 算法原理以及應用 一 算法原理 1 目標函數 2 一階泰勒公式展開 3 最小化目標函數條件下的pDelta p 二 LK算在跟蹤的應用 1 平移角度

原创 【轉】機器學習中距離和相似性度量方法

漫談:機器學習中距離和相似性度量方法   在機器學習和數據挖掘中,我們經常需要知道個體間差異的大小,進而評價個體的相似性和類別。最常見的是數據分析中的相關分析,數據挖掘中的分類和聚類算法,如 K 最近鄰(KNN)和 K 均值(K-

原创 簡單線性迴歸分析【筆記】

簡單線性迴歸分析 目錄 簡單線性迴歸分析 目錄 摘要 引言 算法名稱 歸類 Metaphor Strategy Procedure 1 參數估計 2 模型檢驗 21 迴歸係數的顯著性檢驗 t檢驗 F檢驗 相關係數 22

原创 Windws MySQL客戶端 訪問 ubuntu MySQL服務器

假設在安裝是已經設置了root賬戶,以及其密碼:123456 服務器IP:192.168.1.102 步驟 1、ubuntu下對MySQL設置: 1.1  修改 my.cnf文件     修改 /etc/mysql/my.cnfbi

原创 關於python的類

一、python的類 1.1 定義: class [類名](父類名): 【注意要有冒號】 如果沒有特別指定的父類,建議父類爲object,即 “ class [類名](父類object):” 1.2 self,cls

原创 布隆過濾器(Bloom Filter)詳解

【轉】原文連接 布隆過濾器[1](Bloom Filter)是由布隆(Burton Howard Bloom)在1970年提出的。它實際上是由一個很長的二進制向量和一系列隨機映射函數組成,布隆過濾器可以用於檢索一個元素是否在一個

原创 堆排序及性能分析

目錄 一 堆的相關知識 二 堆的僞代碼 三 堆的算法性能分析 一 堆的相關知識 1.1 堆的性質 1、下標爲i的下標,其父節點爲floor(i/2),左子節點下標爲2i,其右子節點下標爲2i+1 2、n個元素的堆時,葉節點的下標爲fl

原创 RANSAC算法

『原文地址』 大概太久沒更新了,壓力就越大了,工作比較忙,人比較懶,寫一篇高質量的文章還是比較耗時間的,這樣吧,以後就發一些我覺得比較實用的東西吧,就那麼一個小片段,這樣我也比較有時間,比較有動力,假如你有什麼建議可以留言。 今天

原创 關於eclipse 開發java程序的要點

目錄         目標         實驗內容         一、新建一個java項目         二、生成指定包         三、在指定包內編寫java程序         四、添加外部JAR文件         五、

原创 spark/scala關於【資源文件】加載方法

概述 外部文件加載方案測試 資源文件打包入jar包中 小結 概述 在spark的client模式加載文件 1 文件存在於客戶端的本地(非hdfs): 對於這種本地文件,可採用 Source. fromFile (LocalPa

原创 分類器訓練的過擬合問題和處理方法【未整理完成】

一 過擬合 模型訓練過程中過度擬合訓練集,將訓練樣本中的噪聲(錯誤的樣本)學習進去,使得訓練誤差不斷降低和模型複雜度不斷提高,最終導致泛化誤差升高的一種現象   成因:噪聲(錯誤的樣本),樣本過少/缺乏代表性   二 預測泛化誤差【1】