原创 Adaboost python初探

  Adaboost簡介:Adaboost是一種迭代算法,其核心思想是針對同一個訓練集訓練不同的分類器(弱分類器),然後把這些弱分類器集合起來,構成一個更強的最終分類器(強分類器)。 下面使用sklearn庫簡單體驗一下,使用自帶數據集i

原创 基於yale人臉庫的人臉圖像檢測

一.嵌入式特徵選擇:將特徵選擇方法和學習訓練過程融爲一體。兩者同在一個優化過程中完成。在學習器訓練時自動進行特徵選擇。給定訓練集,考慮線性迴歸模型,以平方誤差爲損失函數,則優化目標爲: 當樣本特徵較多,樣本數量較少時,很容易過擬合。若採用

原创 關於SVM算法 python實現

    SVM簡介   SVM(Support Vector Machine)指的是支持向量機,是常見的一種判別方法。在機器學習領域,是一個有監督的學習模型,通常用來進行模式識別、分類以及迴歸分析。 SVM的主要思想可以概括爲兩點: 它是

原创 Azure中通過模板部署批量創建虛擬機

1.開始模板部署,點擊創建   2.編輯模板     3.加載導入json模版文件(這裏使用了CentOS虛擬機的),修改內容 4.設置對應參數   5.點擊確定,等待部署完成。        

原创 TF-IDF介紹及Python實現文本聚類

TF-IDF 是一種統計方法,用以評估一字詞對於一個文件集或一個語料庫中的其中 一份文件的重要程度。字詞的重要性隨着它在文件中出現的次數成正比增加,但 同時會隨着它在語料庫中出現的頻率成反比下降。TF-IDF 加權的各種形式常被搜 索引擎

原创 SpringCloud的Config Client端Could not resolve placeholder 'xxx' in value "${xxx}錯誤解決

編寫SpringCloud的Config Client端時,當嘗試去配置文件裏拿某${xxx}的值會出現以下錯誤: org.springframework.beans.factory.BeanCreationException: Erro

原创 Hadoop及Hbase介紹與Ubuntu下安裝配置

Hbase 安裝模式介紹1.單機模式 1> Hbase 不使用 HDFS,僅使用本地文件系統 2> ZooKeeper 與 Hbase 運行在同一個 JVM 中2.分佈式模式 – 僞分佈式模式 1> 所有進程運行在同一個節點上,不同進程運

原创 SQL Server的Windows驗證之NTLM的Netmon主要過程

NTLM連接SQL Server默認實例 1. 使用命令,ipconfig /flushdns, 然後再次去執行連接,由於沒有client會發一個包給DNS Server, 來查詢SERVER的IP地址。 2.然後,在服務器端,抓到的TC

原创 SQL Server系統數據庫損壞時的快速恢復使用

1.假設data文件夾中master,masterlog,model,modellog,msdbdata,msdblog的系統數據庫文件已損壞,複製Binn/template中的同名文件替換。 2.管理員模式運行cmd,命令行中輸入NET

原创 python實現共軛梯度法

共軛梯度法(Conjugate Gradient)是介於最速下降法與牛頓法之間的一個方法,它僅需利用一階導數信息,但克服了最速下降法收斂慢的缺點,又避免了牛頓法需要存儲和計算Hesse矩陣並求逆的缺點,共軛梯度法不僅是解決大型線性方程組最

原创 isomap算法 python實現

isomap算法主要流程:1:構建鄰接圖G:基於輸入空間X中流形G上的的鄰近點對i,j之間的歐式距離dx (i,j),選取每個樣本點距離最近的K個點(K-Isomap)或在樣本點選定半徑爲常數ε的圓內所有點爲該樣本點的近鄰點,將這些鄰近點

原创 EM算法 python初探

EM算法在統計計算中,最大期望(EM)算法是在概率(probabilistic)模型中尋找參數最大似然估計或者最大後驗估計的算法,其中概率模型依賴於無法觀測的隱藏變量(Latent Variable)。最大期望經常用在機器學習和計算機視覺

原创 python實現QR法解線性方程組

QR(正交三角)分解法是目前求一般矩陣全部特徵值的最有效並廣泛應用的方法,一般矩陣先經過正交相似變化成爲Hessenberg矩陣,然後再應用QR方法求特徵值和特徵向量。它是將矩陣分解成一個正規正交矩陣Q與

原创 Apriori算法 python實現

算法簡介:   首先找出所有的頻集,這些項集出現的頻繁性至少和預定義的最小支持度一樣。然後由頻集產生強關聯規則,這些規則必須滿足最小支持度和最小可信度。然後使用第1步找到的頻集產生期望的規則,產生只包含集合的項的所有規則,其中每一條規則的

原创 Kmeans算法 python實現

K-Means算法簡介:事先確定常數K,常數K意味着最終的聚類類別數,首先隨機選定初始點爲質心,並通過計算每一個樣本與質心之間的相似度(這裏爲歐式距離),將樣本點歸到最相似的類中,接着,重新計算每個類的質心(即爲類中心),重複這樣的過程,