台部落JackkwiN

這個問題困擾了我很久很久，所幸看到這篇文章。不能說茅塞頓開，但總算不至於在黑暗中苦苦摸索。特此轉載，與和我有相同困擾的大學生們分享。你說：“他們都有很強的開發能力,只是不太喜歡讀書,也只是希望混個學歷對今後在崗位上晉升有好處”

2018-09-03 21:07:43

重新索引 Series和DataFrame在創建時可以對其index屬性進行修改(DataFrame中index修改行屬性)。創建後需要對index修改需要用到reindex方法。s1 = pd.Series([1,2,3],ind

2018-09-03 21:07:43

層次化索引 Pandas層次化索引將對象的索引分層，以便調用。s1 = pd.Series(range(1,11),index=[['a','a','a','b','b','b','c','c','d','d'],[1,2,3,1,

2018-09-03 21:07:43

統計與彙總 pandas對象的統計基本與numpy的數學方法差不多，不過pandas數組都是基於沒有缺失數據的情況下構建的，即當對象中存在NAN值的時候，NaN值將會被自動排除，除非整個切片或對象都是NaN。 pandas對象

2018-09-03 21:07:42

首先，Python用.isnull的方法判斷對象元素是否爲NaN(缺失值)。s1 = pd.Series(['one','two',np.nan,'three']) s1.isnull() ''' 0 False 1

2018-09-03 21:07:42

線性迴歸（最小二乘法）一維模型：對於直角座標系中一系列樣本點（x,y），找到合適的a,b，使得f(x)=ax+b成立，並且f(x)～=y。實際上，線性迴歸的過程就是尋找a,b的過程，而判定最優解的方法就是尋找誤差最小值，即：。

2018-09-03 21:07:42

創建數組 np.array(*list):以list創建一個數組list1 = [1,2,3,4,5] arr1 = np.array(list1) print(arr1) //輸出結果：[1 2 3 4 5] np.emp

2018-09-03 21:07:42

幾種常見的分佈聯合分佈聯合分佈很難描述清楚，智能給出概念。但是在相互獨立的隨機變量中，它們聯合分佈是它們各自分佈的乘積。對於連續型隨機變量，加上積分就可以了。邊緣分佈在二維情況下的直觀解釋：

2018-09-03 21:07:42

概率的三個公理 1.事件A的概率是一個非負實數：P(A)≥0。 2.合法命題（必然事件）的概率爲1。 3.對兩兩不相交（互斥）事件，有。條件概率聯合概率：P(A,B)=P(A|B)*P(B) 條件概率：P(

2018-09-03 21:07:42

矢量化計算概念是：用數組表達式代替循環。例：計算點(x,y)到原點的長度。首先介紹一個函數，np.meshgrid(*x,*y)。這個函數接收兩個數組*x,*y，對於這兩個數組上的所有元素，進行一一對應，生成兩個矩陣，兩個

2018-09-03 21:07:42

等了很久，終於進入機器學習環節了。開始前只想說一句話：數學一定一定要學好！！！沒有學完概率的我今天開頭真的是看的昏昏欲睡，就算是現在也只能大概理解其原理，等抓緊時間學完概率，再來好好咀嚼一下這部分內容。最後給自己一碗雞湯：從菜鳥走

2018-09-03 21:07:42

Series - series可以看做是一個定長的有序字典，與一維數組形式相同，區別是series的索引可以是任意數據類型。 - series本身擁有一個name屬性，它的index也有自己的name屬性（這條性質爲下文中se

2018-09-03 21:07:41

兩個概念獨立同分布樣本：當X1,X2,...,Xn相互獨立且具有相同的分佈函數F的時候，稱X1,X2,...,Xn爲獨立同分布樣本，記爲X1,X2,...,Xn ~ F. 抽樣分佈：X1,X2,...,Xn爲獨立同分布樣本(

2018-09-03 21:07:41

範數定義：是一個描述線性空間的度量，可以理解爲二維空間的長度。如||x1-x2||表示向量x1,x2之間的距離。 *Frobenius範數：機器學習常用範數。即：矩陣所有元素先取平方和，再開平方。特徵分解

2018-09-03 21:07:41

多元函數導數對於n維函數，y本身沒有導數，但其對於每一個分量都有偏導，於是有如下定義：梯度向量：，其性質類似與一元函數的一階導。 Hessian矩陣： *值得注意的是，因爲偏導

2018-09-03 21:07:41