原创 目標檢測彙總

文章目錄1、神經網絡基礎2、卷積神經網絡2.1、術語及歷史2.2、CNN2.3、CNN改進3、目標檢測 1、神經網絡基礎 以下爲CS229視頻課程部分筆記,可參考文章內的講義。 數據挖掘day26、27-CS229-WEEK4 N

原创 數據挖掘day13-CS229-WEEK1 Introduction

今天內容是CS229 機器學習的介紹,比較簡單,就做了個簡單的思維導圖

原创 數據挖掘day20、21-《數據挖掘導論》-第三章,探索數據

文章目錄3.3.3-1、少量屬性的可視化1.1 莖葉圖1.2 直方圖(histogram)1.3 二維直方圖(two-dimensional histogram)1.4 盒狀圖(box plot)1.5 餅圖(pie plot)1

原创 數據挖掘day26、27-CS229-WEEK4 Neural Networks:Representtation

文章目錄1、神經元(neuron)2、神經網絡(Neural Network)表示3、向量化4、例子5、多元分類 本節僅是對神經網絡的背景知識介紹和神經網絡的表述方式進說明。因爲生物學知識不難,理解也還行。 1、神經元(neuro

原创 《python》編程導論 第1/2/3/4章

前幾章比較簡單,本文純粹是爲了對基本概念做個記錄,順便碼一下。 第三章 3.3 近似解和二分查找 3.3.1 平方根迭代近似解 x=25 epsilon = 0.01 step = epsilon**2 numGuesses =

原创 員工離職率預測,練手賽

文章目錄1、數據探索1.1 各特徵總量及百分比1.2 heatmap2、特徵選擇&處理2.1 特徵分類2.2 連續特徵選擇2.3 分類特徵選擇2.4 異常值處理2.5 連續特徵處理2.5.1 分箱測試2.6 拼接特徵,然後再篩選3

原创 1045. 買下所有產品的客戶 難度:中等

1、題目描述 來源:力扣(LeetCode) 2、解題思路 1# 首先對Customer去重,select distinct * from customer 2# 然後,統計每個客人購買的貨物種類數量select custom

原创 數據挖掘day16、17-CS229-WEEK3 Logistic Regression

今天參考github的項目進行分類實現,使用的是課程課後練習數據 使用的是隨機梯度下降,α\alphaα的選擇和遍歷次數設置,還是複雜一點。原 文章用的數據分類清晰,效果比較好,課後習題的數據分類比較模糊,如果輸出的不是’0‘、

原创 數據挖掘day12-CS229-Review of Probability Theory

沒找到中文翻譯,只能自己做翻譯了(未完待填坑) 概率論是對不確定性的研究。通過這個課程,我們將依靠概率論的概念來推導機器學習算法。 本文試圖概括適合於CS 229水平的概率論基礎知識。概率的數學理論非常複雜,其深層次內容爲測量理論

原创 1077. Project Employees III 難度:中等

1、題目描述 Write an SQL query that reports the most experienced employees in each project. In case of a tie, report all

原创 數據挖掘day18、19-《數據挖掘導論》-第一章,第二章

第一章僅是介紹,第二章數據很重要,但是都是概念性的東西,做一張思維導圖

原创 數據挖掘day14、15-CS229-WEEK2 Linera Regression

1、本節思維導圖 2、Python實現梯度下降 參考文章 數據使用課程的課後練習,J的圖像: # Use these for your excerise theta0s = np.linspace(-1,1,50) theta

原创 數據挖掘day34-CS229-WEEK6 Advice for Applying Machine Learning

文章目錄1、如何改進模型?2、模型評估方法2.1 簡單評估2.2 特徵評估2.3 偏差、方差評估2.3 正則化與偏差、方差3、學習曲線4、改進模型的答案5、學習系統設計5.1 查準率、召回率5.2 平衡查準率與召回率5.3 數據量

原创 數據挖掘day30~33-《數據挖掘導論》第五章,5.1~5.3,基於規則、最近鄰、貝葉斯分類器

本節的計劃是4天時間。內容中基於規則的分類器與決策樹較爲類似。而最近鄰和貝葉斯片數學計算,由於時間問題,算法實現,待後來補上。