原创 遷移學習&在線學習
簡介 英文: transfer learning 以已訓練好的模型A爲起點,在新場景中,根據新數據建立模型B 目的:將某個領域或任務上學習到的知識或模式,應用到不同但相關的領域或問題中。 特徵提取 使用模型A,移除輸出層,提取目標特徵信
原创 LSTM 文本預測
LSTM RNN對於前面的信息會有意外,LSTM可以基礎相應的信息 code #加載數據 data = open("LSTM_text.txt").read() #移除換行 data = data.replace("\n","").repl
原创 RNN實現股價預測
簡介 import pandas as pd import numpy as np data = pd.read_csv('zgpa_train.csv') data.head() price = data.loc[:,'close']
原创 多層感知器
簡介 將多個 邏輯迴歸 網絡 層疊起來 構建 多層感知器 在不增加高次項數據的情況下,如何通過MLP實現非線性分類預測。 + MNIST 數據集的MLP模型 參考鏈接 推薦安裝 李沐 的 cuda 還有GPU版本 https:
原创 欠擬合 與 過擬合
簡介 模型不合適,導致其無法對數據實現有效預測 訓練數據 預測數據 欠擬合 不準確 不準確 過擬合 準確 不準確 好模型 準確 準確 原因 模型結構過於複雜(維度過高) 使用了過多屬性,模型訓練時包含了干擾信息
原创 實戰 異常檢測
簡介 參考鏈接 https://blog.csdn.net/weixin_46344368/article/details/106312536?spm=1001.2014.3001.5502 code # 實戰 異常檢測 #加載數據 imp
原创 實戰(一):酶活性預測
簡介 使用多個 線性迴歸參數對模型進行預測。 code # load the data import pandas as pd import numpy as np data_train = pd.read_csv('T-R-train.
原创 機器學習之數據分離與混淆矩陣
簡介 實例基本流程: 數據載入->數據可視化與預處理->模型創建->全數據用於模型訓練->模型評估 數據分離可以用於模型評估 對全數據進行數據分離,部分用於訓練,部分用於新數據的結果預測! 通常來說分爲3步: 把數據分成兩部分:訓練集、測
原创 實戰(二) 機器學習之數據分離與混淆矩陣
簡介 使用多個KNN參數進行訓練 參考鏈接 https://blog.csdn.net/weixin_46344368/article/details/107214449?spm=1001.2014.3001.5502 code #加載數據
原创 實戰 PCA
簡介 PCA code #加載數據 import pandas as pd import numpy as np data = pd.read_csv('iris_data.csv') data.head(100) print(pd.val
原创 無監督學習 Kmeans
無監督學習 自動對輸入數據進行分類或者分羣 優點: 算法不受監督信息(偏見)的約束,可能考慮到新的信息 不需要標籤數據,極大程度擴大數據樣本 Kmeans 聚類 根據數據與中心點距離劃分類別 基於類別數據更新中心點 重複過程直到收斂 特點:
原创 多因子線性迴歸
簡介 對於房價的預測,採用多因子進行預測,例如房屋面積,人口密度等等。 參考鏈接 https://blog.csdn.net/weixin_46344368/article/details/105775078 (內涵數據集) code im
原创 使用機器學習對曲線進行線性迴歸
簡介 線性迴歸:根據數據,確定兩種或兩種以上變量間相互依賴的定量關係 評價曲線的擬合效果使用均方誤差和R方值進行擬合質量評估 \[M S E=\frac{1}{m} \sum_{i=1}^{m}\left(y_{i}^{\prime}-y_
原创 體積模量
簡介 體積模量是一個比較穩定的材料常數,單位爲帕斯卡。 \[K=\frac{E}{3(1-2 \mu)} \]
原创 體積虎克定律
簡介