原创 二分查找(返回查找值的左右邊界索引)

1、返回查找值的隨機索引 搜索區間是 [left, right] 的左閉右閉寫法 int binary_search(int[] nums, int target) { int left = 0, right = nu

原创 前向分佈算法與Adaboost

首先了解一下提升方法的思路:”將多個弱學習模型組合成一個強學習模型,這個強學習模型可以達到比任何一個弱學習模型都要好的預測效果”,那麼應該怎樣求這個強學習模型,直接就能求出來嗎?況且到目前爲止連弱學習模型都還沒有,那麼就必須弄明白

原创 按照步長切割字符串形成列表

記錄一下小知識哈! s = '123456' l = [s[i:i+2] for i in range(0, len(s), 2)] # 2是步長,可隨意改變 "得:l = ['12', '34', '56']"

原创 python計算階乘的兩個函數

reduce() #從functools中調用reduce()函數 from functools import reduce #使用lambda,匿名函數,迭代 num = reduce(lambda x,y:x*y,ran

原创 前向分佈算法、Adaboost算法、提升樹算法、梯度提升算法、GBDT(梯度提升決策樹)和XGBoost(極限梯度提升)

目標:好好捋一捋跟提升有關的算法,總結實屬不易,望點贊或關注,謝謝。 一、前向分佈算法 首先必須瞭解前向分佈算法,因爲這個算法將提升思想變得更容易實現,它只需求出每一次迭代時的最優弱模型的參數和係數即可,不用一次性求出所有的弱模型

原创 數據挖掘筆記(7)-離羣點檢測

離羣點檢測是爲了發現數據集中與其它大部分數據顯著不同的數據點,建模的的時候通常將離羣點視爲噪聲丟棄。離羣點雖然會影響建模的準確率,但是在特定的應用中,離羣點蘊含着更大的研究價值,比如從銀行卡刷卡記錄數據的離羣點分析某用戶是否存在異

原创 隱馬爾可夫模型(四)——維特比算法

一、問題回顧 隱馬爾可夫的預測問題,也稱爲解碼問題。即給定模型λ=(A,B,Π)和觀測序列O={o1,o2,…oT},求給定觀測序列條件下,最可能出現的對應的狀態序列。這個問題的求解需要用到基於動態規劃的維特比算法,我會在隱馬爾可

原创 EM算法在高斯混合模型中的應用(非常簡單,完全按照EM算法的節奏)

一、首先介紹一下高斯混合模型 高斯混合模型是指具有如下概率分佈的模型: 其中,θ=(α1,μ1,σ12,α2,μ2,σ22,…,αK,μK,σK2),它是整個混合模型(有K個分模型)的參數。 αk是係數,αk ≥ 0,代表第k個

原创 無序數組求中位數——小根堆法原理(附python代碼)

小根堆法: 定義中位數爲一個有序數組(len(array)+1)//2處的元素,“//”代表下取整。我知道中位數的定義分按照數組長度的奇偶性分兩種,但是面試官會告訴你這裏求的中位數就是有序數組(len(array)+1)//2處的

原创 python——解決pip的“failed to create process”問題,以及用國內鏡像批量下載requirements.txt中包

一、pip的“failed to create process”問題 原因1:pip.exe一般在python下面的Scripts文件夾裏,這個文件夾裏面還有一個pip-script.py文件(注意pip3.exe對應的是pip3

原创 python3創建虛擬環境並配置環境變量(windows)

前提:python3環境,python2的可以看看環境變量配置。 1、建立一個venv文件夾專門存放各個項目的虛擬環境。 如:我在F盤下建立venv 2、win + r 召喚出命令行,執行python,記住哦,python還要分p

原创 DataFrame數據處理筆記(長期更新)

本文案例: >>> df = pd.DataFrame([[1, 2.0, 3], [4, 5.0, 6], [7, 8.0, 9]], columns = ['a', 'b', 'c']) >>> df['a'] = df['a

原创 關於Vs配置Opencv出現的錯誤“ 0x000007fefdf6a06d (KernelBase.dll) 處最可能的異常: Microsoft C++ 異常:”!!!

這幾天在學習雙目視覺的內容,所以安裝了vs2010和opencv2.4.11,但在配置opencv的過程中老是有一個問題不能解決。 問題如下: Test是我的工程目錄,運行老是報以下錯誤: Test.exe 中的 0x000007