原创 計算機專業要不要考研

   這個問題困擾了我很久很久,所幸看到這篇文章。不能說茅塞頓開,但總算不至於在黑暗中苦苦摸索。特此轉載,與和我有相同困擾的大學生們分享。   你說:“他們都有很強的開發能力,只是不太喜歡讀書,也只是希望混個學歷對今後在崗位上晉升有好處”

原创 【Python數據分析之pandas02】數據結構的基本功能--1

重新索引    Series和DataFrame在創建時可以對其index屬性進行修改(DataFrame中index修改行屬性)。創建後需要對index修改需要用到reindex方法。s1 = pd.Series([1,2,3],ind

原创 【Python數據分析之pandas06】層次化索引

層次化索引    Pandas層次化索引將對象的索引分層,以便調用。s1 = pd.Series(range(1,11),index=[['a','a','a','b','b','b','c','c','d','d'],[1,2,3,1,

原创 【Python數據分析之pandas04】數學方法

統計與彙總    pandas對象的統計基本與numpy的數學方法差不多,不過pandas數組都是基於沒有缺失數據的情況下構建的,即當對象中存在NAN值的時候,NaN值將會被自動排除,除非整個切片或對象都是NaN。    pandas對象

原创 【Python數據分析之pandas05】處理缺失化數據

    首先,Python用.isnull的方法判斷對象元素是否爲NaN(缺失值)。s1 = pd.Series(['one','two',np.nan,'three']) s1.isnull() ''' 0 False 1

原创 【機器學習數學基礎之矩陣03】線性迴歸

線性迴歸(最小二乘法)    一維模型:對於直角座標系中一系列樣本點(x,y),找到合適的a,b,使得f(x)=ax+b成立,並且f(x)~=y。實際上,線性迴歸的過程就是尋找a,b的過程,而判定最優解的方法就是尋找誤差最小值,即:  。

原创 【Python數據分析工具之Numpy01】數組創建ndarray

創建數組    np.array(*list):以list創建一個數組list1 = [1,2,3,4,5] arr1 = np.array(list1) print(arr1) //輸出結果:[1 2 3 4 5]     np.emp

原创 【機器學習數學基礎之概率論與統計05】多元隨機向量及其分佈

幾種常見的分佈    聯合分佈     聯合分佈很難描述清楚,智能給出概念。但是在相互獨立的隨機變量中,它們聯合分佈是它們各自分佈的乘積。    對於連續型隨機變量,加上積分就可以了。    邊緣分佈    在二維情況下的直觀解釋:   

原创 【機器學習數學基礎之概率論01】貝葉斯公式

概率的三個公理    1.事件A的概率是一個非負實數:P(A)≥0。    2.合法命題(必然事件)的概率爲1。    3.對兩兩不相交(互斥)事件,有。條件概率    聯合概率:P(A,B)=P(A|B)*P(B)    條件概率:P(

原创 【Python數據分析之Numpy02】利用數據進行數據處理

矢量化計算    概念是:用數組表達式代替循環。    例:計算點(x,y)到原點的長度。首先介紹一個函數,np.meshgrid(*x,*y)。這個函數接收兩個數組*x,*y,對於這兩個數組上的所有元素,進行一一對應,生成兩個矩陣,兩個

原创 【機器學習--線性迴歸01】線性迴歸模型

    等了很久,終於進入機器學習環節了。開始前只想說一句話:數學一定一定要學好!!!沒有學完概率的我今天開頭真的是看的昏昏欲睡,就算是現在也只能大概理解其原理,等抓緊時間學完概率,再來好好咀嚼一下這部分內容。最後給自己一碗雞湯:從菜鳥走

原创 【Python數據分析之pandas01】兩個常用的數據結構

Series    - series可以看做是一個定長的有序字典,與一維數組形式相同,區別是series的索引可以是任意數據類型。    - series本身擁有一個name屬性,它的index也有自己的name屬性(這條性質爲下文中se

原创 【機器學習數學基礎之概率論與統計03】抽樣分佈

兩個概念    獨立同分布樣本:當X1,X2,...,Xn相互獨立且具有相同的分佈函數F的時候,稱X1,X2,...,Xn爲獨立同分布樣本,記爲X1,X2,...,Xn ~ F.    抽樣分佈:X1,X2,...,Xn爲獨立同分布樣本(

原创 【機器學習數學基礎--矩陣01】線性空間

範數    定義:是一個描述線性空間的度量,可以理解爲二維空間的長度。    如||x1-x2||表示向量x1,x2之間的距離。    *Frobenius範數:機器學習常用範數。     即:矩陣所有元素先取平方和,再開平方。特徵分解 

原创 【機器學習數學基礎之矩陣02】矩陣求導

多元函數導數    對於n維函數 ,y本身沒有導數,但其對於每一個分量都有偏導,於是有如下定義:        梯度向量:,其性質類似與一元函數的一階導。        Hessian矩陣:            *值得注意的是,因爲偏導