原创 爲什麼L1和L2正則化可防止過擬合

爲什麼L1和L2正則化可防止過擬合 線性模型常用來處理迴歸和分類任務,爲了防止模型處於過擬合狀態,需要用L1正則化和L2正則化降低模型的複雜度,很多線性迴歸模型正則化的文章會提到L1是通過稀疏參數(減少參數的數量)來降低複雜度,L

原创 一文詳解常用的激活函數

常見的激活函數及其特點 什麼是激活函數? 神經網絡中的每個神經元節點接受上一層神經元的輸出值作爲本神經元的輸入值,並將輸入值傳遞給下一層,輸入層神經元節點會將輸入屬性值直接傳遞給下一層(隱層或輸出層)。在多層神經網絡中,上層節點的

原创 如何防止過擬合和欠擬合

如何防止過擬合和欠擬合 過擬合(Over-Fitting) 高方差 在訓練集上誤差小,但在測試集上誤差大,我們將這種情況稱爲高方差(high variance),也叫過擬合。 欠擬合(Under-Fitting) 在訓練集上訓練效

原创 郝斌數據結構--遞歸專題

專題 遞歸 定義 把一個直接調用自己或通過一系列的調用語句間接地調用自己的函數,稱做遞歸函數。   遞歸的思想 將大規模(n)的問題轉換成小規模(n-1)的問題解決   遞歸滿足三個條件 遞歸必須得有一個明確得中止條件 該函數所處理得數

原创 郝斌數據結構--預備知識

數據結構概述 定義 算法 1. 時間複雜度 大概程序執行的次數,而非執行的時間 2. 空間複雜度 所佔內存 3. 難易程度 4. 健壯性 計算算法時間複雜度 推倒大o階方法 - 用常數1取代運行時間中的所有加法常數 - 在修改後的運行次數

原创 數據結構筆記--排序

經典排序算法 算法分類 十種常見排序算法可以分爲兩大類: 比較類排序:通過比較來決定元素間的相對次序,由於其時間複雜度不能突破O(nlogn),因此也稱爲非線性時間比較類排序。 非比較類排序:不通過比較來決定元素間的相對次序,它可

原创 數據結構筆記--快速冪算法

快速冪的目的就是做到快速求冪,假設我們要求a^b,按照樸素算法就是把a連乘b次,時間複雜度是O(b)爲O(n)級別,快速冪能做到O(logn) 原理如下:              假設我們要求a^b,那麼其實b是可以拆成二進制的,該二進

原创 GBDT推導(林軒田)

第二節林從優化的角度推導了Adaboost,本人不才,沒有看懂,可跳過 一、RandomForest Vs AdaBoost-DTree RF隨機森林算法:通過bootstrapping有放回的抽樣獲取不同的訓練數據Dt,不同的Dt可同時

原创 郝斌數據結構--棧和隊列

線性結構的兩種常見應用之一 棧 定義 一種可以實現“先進後出”的存儲結構 分類 靜態棧 類似數組的結構 動態棧 類似鏈表的結構 棧的應用 (1)函數調用(所有的函數調用都是壓棧與出棧)          所謂函數A調用函數B就是把A的最後

原创 郝斌數據結構--鏈表

模塊一:線性結構 連續存儲【數組】 1.數組定義 元素類型相同, 大小相等 2.數組的優缺點 # include <stdio.h> # include <malloc.h> # include <stdlib.h> # include

原创 郝斌數據結構--樹

模塊二 非線性結構 樹 定義     有且只有一個稱爲根的節點 有若干個互不相交的子樹,這些子樹本身也是一棵樹 通俗定義 樹是由節點和邊組成 但有一個節點例外,該節點沒有父節點,此節點稱爲根節點 每個節點只有一個父節點但可以有多個子節點

原创 數據結構筆記--查找

靜態查找表:只進行查找操作的查找表 動態查找表:在查找過程中同時插入查找表中不存在的元素,或者刪除已存在的元素 1.順序表查找:從第一個或者最後一個記錄開始,將每個記錄的關鍵字與給定值比較,若相等則查找成功。 C實現: # inc

原创 筆試題--層序輸入一顆二叉樹

在某一棵二叉樹中找出和爲某一值的所有路徑 輸入格式: 第一行 期望值 第二行 按照層序遍歷順序給出的完全二叉樹, 若空用 # 表示   輸入: 9 6 3 1 # # 4 1 # # # # # # # 1 輸出: 6 3  6 1 1

原创 數據結構筆記--KMP算法深入講解

前言     之前對kmp算法雖然瞭解它的原理,即求出P0···Pi的最大相同前後綴長度k;但是問題在於如何求出這個最大前後綴長度呢?我覺得網上很多帖子都說的不是很清楚,總感覺沒有把那層紙戳破,後來翻看算法導論,32章 字符串匹配雖然講到

原创 數據結構筆記--KMP算法簡單理解

KMP算法中的函數值只和模式串有關,而和相匹配的主串無關。 例 主串:a c a b a a b a a b c a c a a b c 模式串:a b a a b c a c 1.首先,我們給模式串標上序號 2.之後,我們把模式串的所有