實訓小結(4)

今天已經實訓結束了,得個空閒的時候將之前沒上傳的筆記上傳
**

3.8 學習隨機數的原理

**
隨機數
隨機數其實是僞隨機數,這些數其實是有規律的

seed()種子(初始值) ——> 隨機數生成器(算法)——>返回兩樣東西(隨機數,生成下一個隨機數的種子)
這個種子用來再繼續生成新的隨機數

while(num<5):
    np.random.seed(1)
    print(np.random.random())
    num+=1

生成相同的隨機數,每次的隨機種子都是1,相同的初始值,最後生成的是相同的隨機數

num1=0
np.random.seed(2)
while(num1<5):
    print(np.random.random())
    num1+=1

第一次循環的時候,使用的是自己定義的種子,後面的循環是隨機數生成器自己生成的新種子

總結:
1.僞隨機數並不是假隨機數,這裏的“僞”是有規律的意思,就是計算機產生的僞隨機數既是隨機的又是有規律的。

2.隨機種子來自系統時鐘,確切地說,是來自計算機主板上的定時/計數器在內存中的記數值。

3.隨機數是由隨機種子根據一定的計算方法計算出來的數值。所以,只要計算方法一定,隨機種子一定,那麼產生的隨機數就不會變。也就是說,僞隨機數也是某種對應映射的產物,只不過這個自變量是系統的時間而已

4.如果你每次調用srand()時都提供相同的種子值,那麼,你將會得到相同的隨機數序列

**

3.9 對預測模型瞭解

**

一、梯度提升迴歸:GBR (Gradient boosting regression)
LSTM:長短期記憶網絡

二、關於re模塊的group中數字的含義

import re
str = 'say hello world! hello python'
pattern = re.compile(r'(?P<first>hell\w)(?P<symbol>\s)(?P<last>.*ld!)') # 分組,0 組是整個 hello world!, 1組 hello,2組 ld!
search = re.search(pattern, str)
print('group 0:', search.group(0)) # 匹配 0 組,整個字符串
print('group 1:', search.group(1)) # 匹配第一組,hello
print('group 2:', search.group(2)) # 匹配第二組,空格
print(search.group('first'))

0 表示整個字符串,1表示第一組,。。。

關於正則表達式中^的用法
用法一:限定開頭,^在[]外面代表是爲首
/^A/會匹配"An e"中的A,但是不會匹配"ab A"中的A
用法二:^在[]裏面代表是非
[^a-z\s]會匹配"my 3 sisters"中的"3" 這裏的”^”的意思是字符類的否定,上面的正則表達式的意思是匹配不是(a到z和空白字符)的字符。

編程常識:
一、不帶括號時,調用的是這個函數本身 ,是整個函數體,是一個函數對象,不須等該函數執行完成
二、帶括號(參數或者無參),調用的是函數的執行結果,須等該函數執行完成的結果

TensorFlow程序典型的分爲兩個部分
第一部分創建計算圖,構建階段:建立表示機器學習的模型和計算圖,需要去訓練模型的計算圖
第二部分執行階段,通常執行Loop循環重複訓練步驟,每一步訓練小批量數據,逐漸改善模型的參數

**

3.10 以波士頓房價的例子,繼續對模型學習

**
波士頓房價的影響因子:
CRIM:城鎮人均犯罪率。
ZN:住宅用地超過 25000 sq.ft. 的比例。
INDUS:城鎮非零售商用土地的比例。
CHAS:查理斯河空變量(如果邊界是河流,則爲1;否則爲0)。
NOX:一氧化氮濃度。
RM:住宅平均房間數。
AGE:1940 年之前建成的自用房屋比例。
DIS:到波士頓五個中心區域的加權距離。
RAD:輻射性公路的接近指數。
TAX:每 10000 美元的全值財產稅率。
PTRATIO:城鎮師生比例。
B:1000(Bk-0.63)^ 2,其中 Bk 指代城鎮中黑人的比例。
LSTAT:人口中地位低下者的比例。
MEDV:自住房的平均房價,以千美元計。

住宅用地超過 25000 sq.ft. 的比例,住宅平均房間數,每 10000 美元的全值財產稅率,輻射性公路的接近指數對房價的影響因素較大

集成迴歸器
隨機森林和提升樹本質上來說都是決策樹的衍生,迴歸樹也可以衍生出迴歸版本的隨機森林和提升樹。
另外,隨機森林還可以衍生出極端隨機森林,其每個節點的特徵劃分並不是完全隨機的

集成迴歸模型
ExtraTreesRegressor模型使用的效果較好
極端迴歸森林模型

第一步:讀取波士頓房價數據

第二步:波士頓房價數據分割

第三步:訓練數據和測試數據標準化處理

第四步:使用模型進行預測

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章