原创 計算機專業要不要考研
這個問題困擾了我很久很久,所幸看到這篇文章。不能說茅塞頓開,但總算不至於在黑暗中苦苦摸索。特此轉載,與和我有相同困擾的大學生們分享。 你說:“他們都有很強的開發能力,只是不太喜歡讀書,也只是希望混個學歷對今後在崗位上晉升有好處”
原创 【Python數據分析之pandas02】數據結構的基本功能--1
重新索引 Series和DataFrame在創建時可以對其index屬性進行修改(DataFrame中index修改行屬性)。創建後需要對index修改需要用到reindex方法。s1 = pd.Series([1,2,3],ind
原创 【Python數據分析之pandas06】層次化索引
層次化索引 Pandas層次化索引將對象的索引分層,以便調用。s1 = pd.Series(range(1,11),index=[['a','a','a','b','b','b','c','c','d','d'],[1,2,3,1,
原创 【Python數據分析之pandas04】數學方法
統計與彙總 pandas對象的統計基本與numpy的數學方法差不多,不過pandas數組都是基於沒有缺失數據的情況下構建的,即當對象中存在NAN值的時候,NaN值將會被自動排除,除非整個切片或對象都是NaN。 pandas對象
原创 【Python數據分析之pandas05】處理缺失化數據
首先,Python用.isnull的方法判斷對象元素是否爲NaN(缺失值)。s1 = pd.Series(['one','two',np.nan,'three']) s1.isnull() ''' 0 False 1
原创 【機器學習數學基礎之矩陣03】線性迴歸
線性迴歸(最小二乘法) 一維模型:對於直角座標系中一系列樣本點(x,y),找到合適的a,b,使得f(x)=ax+b成立,並且f(x)~=y。實際上,線性迴歸的過程就是尋找a,b的過程,而判定最優解的方法就是尋找誤差最小值,即: 。
原创 【Python數據分析工具之Numpy01】數組創建ndarray
創建數組 np.array(*list):以list創建一個數組list1 = [1,2,3,4,5] arr1 = np.array(list1) print(arr1) //輸出結果:[1 2 3 4 5] np.emp
原创 【機器學習數學基礎之概率論與統計05】多元隨機向量及其分佈
幾種常見的分佈 聯合分佈 聯合分佈很難描述清楚,智能給出概念。但是在相互獨立的隨機變量中,它們聯合分佈是它們各自分佈的乘積。 對於連續型隨機變量,加上積分就可以了。 邊緣分佈 在二維情況下的直觀解釋:
原创 【機器學習數學基礎之概率論01】貝葉斯公式
概率的三個公理 1.事件A的概率是一個非負實數:P(A)≥0。 2.合法命題(必然事件)的概率爲1。 3.對兩兩不相交(互斥)事件,有。條件概率 聯合概率:P(A,B)=P(A|B)*P(B) 條件概率:P(
原创 【Python數據分析之Numpy02】利用數據進行數據處理
矢量化計算 概念是:用數組表達式代替循環。 例:計算點(x,y)到原點的長度。首先介紹一個函數,np.meshgrid(*x,*y)。這個函數接收兩個數組*x,*y,對於這兩個數組上的所有元素,進行一一對應,生成兩個矩陣,兩個
原创 【機器學習--線性迴歸01】線性迴歸模型
等了很久,終於進入機器學習環節了。開始前只想說一句話:數學一定一定要學好!!!沒有學完概率的我今天開頭真的是看的昏昏欲睡,就算是現在也只能大概理解其原理,等抓緊時間學完概率,再來好好咀嚼一下這部分內容。最後給自己一碗雞湯:從菜鳥走
原创 【Python數據分析之pandas01】兩個常用的數據結構
Series - series可以看做是一個定長的有序字典,與一維數組形式相同,區別是series的索引可以是任意數據類型。 - series本身擁有一個name屬性,它的index也有自己的name屬性(這條性質爲下文中se
原创 【機器學習數學基礎之概率論與統計03】抽樣分佈
兩個概念 獨立同分布樣本:當X1,X2,...,Xn相互獨立且具有相同的分佈函數F的時候,稱X1,X2,...,Xn爲獨立同分布樣本,記爲X1,X2,...,Xn ~ F. 抽樣分佈:X1,X2,...,Xn爲獨立同分布樣本(
原创 【機器學習數學基礎--矩陣01】線性空間
範數 定義:是一個描述線性空間的度量,可以理解爲二維空間的長度。 如||x1-x2||表示向量x1,x2之間的距離。 *Frobenius範數:機器學習常用範數。 即:矩陣所有元素先取平方和,再開平方。特徵分解
原创 【機器學習數學基礎之矩陣02】矩陣求導
多元函數導數 對於n維函數 ,y本身沒有導數,但其對於每一個分量都有偏導,於是有如下定義: 梯度向量:,其性質類似與一元函數的一階導。 Hessian矩陣: *值得注意的是,因爲偏導