原创 利用kaggle的API將數據集直接下載到Google Colab

下載kaggle.json 登錄kaggle在My Account中創建自己的Token: {"username":"abc","key":"123"}   下載數據集 找到需要下載的數據集名字 安裝kaggl

原创 算法分析--遞歸與分治--快速排序

快速排序算法策略 分解:選擇數組a中的一個元素q作爲基準,把數組劃分爲三段a1<q,a2=q和a3>q。 遞歸:對數組a1,a2遞歸調用快速排序算法。 合併:不需要額外操作 快速排序法時間複雜度分析 1、最優情況 每次都剛好在中間。

原创 UCI銀行營銷數據集--缺失值處理方法

程序源代碼參見GitHub:https://github.com/leungBH/BankMarketing 數據集基本情況 目標: 根據相關的信息預測通過電話推銷,用戶是否會在銀行進行存款。 特徵:總共有50個特徵。 年齡,工作類型

原创 配置latex環境(Atom+texlive)

首先需要從texlive官網(http://tug.org/texlive/acquire-netinstall.html)下載install-tl-windows.exe並安裝。這個是在線安裝,國內網速可能較慢,可以從其他鏡像源下載I

原创 李航 統計學習方法 第一章 習題 參考答案

1.1說明伯努利模型的極大似然估計以及被壓死估計中的統計學習方法三要素。 統計學習三要素:模型、策略和算法。 伯努利模型的極大似然估計   模型 策略 算法 極大似然估計 條件概率 經驗風險最小化 求解析解 貝葉斯估計 條件概率 結構風險

原创 SQL數據庫--查詢

參考資料 -- https://www.liaoxuefeng.com/ 基本查詢 查詢student表的所有數據 SELECT * FROM students 條件查詢 (NOT AND OR) 不是2班的,而且成績小於80

原创 在Google colab Colaboratory上,安裝CUDA和GPU版本的MXnet

首先得查看一下操作系統的版本 !sudo lsb_release -a Google colab 目前用的是Ubuntu 18.04   到官網上找到CUDA對應的版本 https://developer.nvidia.com/cu

原创 利用kaggle的API講數據集直接下載到Google Colab

下載kaggle.json 登錄kaggle在My Account中創建自己的Token: {"username":"abc","key":"123"}   下載數據集 找到需要下載的數據集名字 安裝kaggl

原创 UCI銀行營銷數據集--數據集不平衡

程序源代碼參見GitHub:https://github.com/leungBH/BankMarketing 數據集基本情況 目標: 根據相關的信息預測通過電話推銷,用戶是否會在銀行進行存款。 特徵:總共有50個特徵。 年齡,工作類型

原创 Github和Git的使用

新建一個.hello.py文件 在git bash上切換的該目錄 然後執行 git init 把新創建的文件添加到本地倉庫  提交修改 在github中新建一個倉庫learnpy 把本地倉庫添加到遠程倉庫(

原创 UCI銀行營銷數據集---數據可視化

  年齡結構 從年齡結構上分析,年輕人和老年人願意存款的比例更高。   職業 從職業上分析,退休工人和學生存款的比例也是遠遠高於其他職業。   婚姻狀況 相比於已婚人士,單身的似乎更傾向於存款     受教育程度 中

原创 各種缺失值處理方法

程序源代碼參見GitHub:https://github.com/leungBH/BankMarketing 使用平均值取代缺失值 使用隨機森林預測缺失值 把分類特徵轉化爲數值特徵。 統計有缺失值的特徵,按照缺失值數量從少到多排

原创 程序猿必備技能包--學習資料彙總

Git,Github 廖雪峯的Git教程:https://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000

原创 算法分析--動態規劃--矩陣連乘

動態規劃算法的基本要素: 最優子結構性質 假設A1*A2*A3*...*An在k處斷開爲最優,那麼只需要保證A1*...*Ak和Ak*..*An兩個子序列的分割也是最優,就能保證該結果是最優。 子問題重疊性 問題描述: 對於多個矩陣連乘

原创 算法分析--貪心算法--最小生成樹

貪心算法 貪心算法做的選擇都是當前狀態下的局部最好選擇。 每次選擇都將問題簡化爲規模更小的子問題。 優點:簡單高效。 缺點:不是對所有問題都能找到整體最優解。 最小生成樹問題