原创 遷移學習&在線學習

簡介 英文: transfer learning 以已訓練好的模型A爲起點,在新場景中,根據新數據建立模型B 目的:將某個領域或任務上學習到的知識或模式,應用到不同但相關的領域或問題中。 特徵提取 使用模型A,移除輸出層,提取目標特徵信

原创 LSTM 文本預測

LSTM RNN對於前面的信息會有意外,LSTM可以基礎相應的信息 code #加載數據 data = open("LSTM_text.txt").read() #移除換行 data = data.replace("\n","").repl

原创 RNN實現股價預測

簡介 import pandas as pd import numpy as np data = pd.read_csv('zgpa_train.csv') data.head() price = data.loc[:,'close']

原创 多層感知器

簡介 將多個 邏輯迴歸 網絡 層疊起來 構建 多層感知器 在不增加高次項數據的情況下,如何通過MLP實現非線性分類預測。 + MNIST 數據集的MLP模型 參考鏈接 推薦安裝 李沐 的 cuda 還有GPU版本 https:

原创 欠擬合 與 過擬合

簡介 模型不合適,導致其無法對數據實現有效預測 訓練數據 預測數據 欠擬合 不準確 不準確 過擬合 準確 不準確 好模型 準確 準確 原因 模型結構過於複雜(維度過高) 使用了過多屬性,模型訓練時包含了干擾信息

原创 實戰 異常檢測

簡介 參考鏈接 https://blog.csdn.net/weixin_46344368/article/details/106312536?spm=1001.2014.3001.5502 code # 實戰 異常檢測 #加載數據 imp

原创 實戰(一):酶活性預測

簡介 使用多個 線性迴歸參數對模型進行預測。 code # load the data import pandas as pd import numpy as np data_train = pd.read_csv('T-R-train.

原创 機器學習之數據分離與混淆矩陣

簡介 實例基本流程: 數據載入->數據可視化與預處理->模型創建->全數據用於模型訓練->模型評估 數據分離可以用於模型評估 對全數據進行數據分離,部分用於訓練,部分用於新數據的結果預測! 通常來說分爲3步: 把數據分成兩部分:訓練集、測

原创 實戰(二) 機器學習之數據分離與混淆矩陣

簡介 使用多個KNN參數進行訓練 參考鏈接 https://blog.csdn.net/weixin_46344368/article/details/107214449?spm=1001.2014.3001.5502 code #加載數據

原创 實戰 PCA

簡介 PCA code #加載數據 import pandas as pd import numpy as np data = pd.read_csv('iris_data.csv') data.head(100) print(pd.val

原创 無監督學習 Kmeans

無監督學習 自動對輸入數據進行分類或者分羣 優點: 算法不受監督信息(偏見)的約束,可能考慮到新的信息 不需要標籤數據,極大程度擴大數據樣本 Kmeans 聚類 根據數據與中心點距離劃分類別 基於類別數據更新中心點 重複過程直到收斂 特點:

原创 多因子線性迴歸

簡介 對於房價的預測,採用多因子進行預測,例如房屋面積,人口密度等等。 參考鏈接 https://blog.csdn.net/weixin_46344368/article/details/105775078 (內涵數據集) code im

原创 使用機器學習對曲線進行線性迴歸

簡介 線性迴歸:根據數據,確定兩種或兩種以上變量間相互依賴的定量關係 評價曲線的擬合效果使用均方誤差和R方值進行擬合質量評估 \[M S E=\frac{1}{m} \sum_{i=1}^{m}\left(y_{i}^{\prime}-y_

原创 體積模量

簡介 體積模量是一個比較穩定的材料常數,單位爲帕斯卡。 \[K=\frac{E}{3(1-2 \mu)} \]

原创 體積虎克定律

簡介