原创 Kd Tree算法詳解

kd樹(k-dimensional樹的簡稱),是一種分割k維數據空間的數據結構,主要應用於多維空間關鍵數據的近鄰查找(Nearest Neighbor)和近似最近鄰查找(Approximate Nearest Neighbor)。一、Kd-

原创 【面試考】【入門】決策樹算法ID3,C4.5和CART

關於決策樹的purity的計算方法可以參考:決策樹purity/基尼係數/信息增益 Decision Trees如果有不懂得可以私信我,我給你講。ID3用下面的例子來理解這個算法:下圖爲我們的訓練集。總共有14個訓練樣本,每個樣本中有4個關

原创 【一致性檢驗指標】Kappa(cappa)係數

1 定義百度百科的定義:它是通過把所有地表真實分類中的像元總數(N)乘以混淆矩陣對角線(Xkk)的和,再減去某一類地表真實像元總數與被誤分成該類像元總數之積對所有類別求和的結果,再除以總像元數的平方減去某一類中地表真實像元總數與該類中被誤分

原创 決策樹purity/基尼係數/信息增益 Decision Trees

目錄決策樹簡單描述衡量purity的三種方法Gini CoefficientEntropy熵決策樹簡單描述決策樹的樣子大概是這個樣子的:選擇一個特徵作爲根節點,把這個特徵劃分成兩個孩子節點,每個孩子節點就是原始數據集的子集,然後再找一個特徵

原创 概率與分佈密度 貝葉斯理論入門 數據挖掘基礎入門

概率Probability,先驗概率Prior,後驗概率Posterior概率是一個衡量不確定性的工具。一個例子:我們來估測某一個人的生日是十月份的概率,在沒有任何數據樣本的情況下,我們可以估計這個概率是Pr(October)=112≈8.

原创 【科普入門】概率與分佈密度 貝葉斯理論入門 數據挖掘基礎入門

概率Probability,先驗概率Prior,後驗概率Posterior概率是一個衡量不確定性的工具。一個例子:我們來估測某一個人的生日是十月份的概率,在沒有任何數據樣本的情況下,我們可以估計這個概率是\(Pr(October) = \f

原创 【Python Deap庫】遺傳算法/遺傳編程 進化算法基於python DEAP庫深度解析講解

目錄前言概述啓發式的理解(重點)優化問題的定義個體編碼初始族羣的創建評價配種選擇錦標賽輪盤賭選擇隨機普遍抽樣選擇變異單點交叉兩點交叉均勻交叉部分匹配交叉突變高斯突變亂序突變位翻轉突變均勻整數突變環境選擇完全重插入(Pure reinsert

原创 【從零學習PyTorch】 如何殘差網絡resnet作爲pre-model +代碼講解+殘差網絡resnet是個啥

看的多個Kaggle上 圖片分類比賽 的代碼,發現基本都會選擇resnet網絡作爲前置網絡進行訓練,那麼如何實現這個呢?本文主要分爲兩個部分第一個部分講解如何使用PyTorch來實現前置網絡的設置,以及參數的下載和導入第二個部分簡單講一下r

原创 什麼是test-time argument(測試數據增強)

可將準確率提高若干個百分點,它就是測試時增強(test time augmentation, TTA)。這裏會爲原始圖像造出多個不同版本,包括不同區域裁剪和更改縮放程度等,並將它們輸入到模型中;然後對多個版本進行計算得到平均輸出,作爲圖像的

原创 加密貨幣考試押題整理

文章目錄散列hashing比特幣地址Bitcoin addressMerkle Tree比特幣基礎知識比特幣編程語言——scriptWallets區塊鏈的交易 transactionUTXO分散共識Decentralized consens

原创 【零基礎學習(面試考點/競賽不用)】GBDT Gradient-Boosting-Decision-Tree 梯度下降樹

1. 什麼是GBDT這個就是一個集成算法,希望通過多個弱分類器的結合來訓練出一個強分類器。這個弱分類器打個比方——決策樹。用決策樹作爲弱分類器,然後訓練10個決策樹,這10個決策樹組成的就是一個強分類器。GBDT是怎麼運作的呢?GBDT是預

原创 【零基礎(面試考點/競賽用)】boosting算法中的佼佼者 LightGBM = GOSS + histogram + EFB

之前一直在用LightGBM模型,但是它的原理並不是非常的瞭解,與之前講過的GBDT的區別也不甚清楚,所以今日一鼓作氣,好好整明白這個運行的原理。先放一個GBDT的鏈接:【零基礎學習(面試考點/競賽不用)】GBDT Gradient-Boo

原创 【類型建議符】python在def函數定義中出現了冒號“:”和箭頭“->”

今天在學習代碼中看到了這樣的寫法:defname(x:'str')->'int':returnint(x)這個寫法是Python3.5新增加的功能。因爲Python不需要像Java一樣,在函數定義中規定參數的類型,所以給程序員帶來方便的同時

原创 面試 筆試 在線編程最後一題 動態規劃優化問題

假設有 1 元, 3 元, 5 元的硬幣若干(無限) , 現在需要湊出 11 元,問如何組合才能使硬幣的數量最少?直接上代碼吧啊:# 動態規劃思想 dp方程式如下# dp[0] = 0# dp[i] = min{dp[i - coins[

原创 2020春秋招聘 人工智能方向 各大廠面試常見題整理二(附答案)(阿里騰訊華爲字節)

SVM的損失函數hinge loss。loss=max(0,1−y^∗f(x))loss = max(0,1-\hat{y}*f(x))loss=max(0,1−y^​∗f(x))邏輯迴歸不能解決什麼問題邏輯迴歸雖然用到了sigmoid函數