原创 決策樹(西瓜書學習)

算法是死的,思想纔是活的! 1. 基本流程 決策樹(decision tree):一般的,一棵決策樹包含一個根結點、若干個內部結點和若干個葉結點;葉結點對應於決策結果,其他每個結點則對應於一個屬性測試;每個結點包含的樣本集合根據根

原创 Pandas重複數據的查看和去重

實現步驟: 1、採用drop_duplicates對數據去兩次重,一次將重複數據全部去除(keep=False)記爲data1,另一次將重複數據保留一個(keep='first)記爲data2; 2、求data1和data2的差集

原创 多任務學習方法

  最近一直在做多任務,但是效果好象沒什麼提升,因爲都是憑自己的想法和感覺在做。於是上網查找了一些這方面的資料,尋求一些理論上的支撐和前人經驗上的幫助。 多任務學習:   故名思意,就是多個任務一起學習。爲什麼要進行多任務學習呢?

原创 pytorch基礎一:張量

簡單記錄以便查閱 張量 一、創建張量 x = torch.empty(5,3) # 創建未初始化矩陣張量 x = torch.rand(5,3)

原创 Tensorflow實現MLP

  多層感知機(MLP)作爲最典型的神經網絡,結構簡單且規則,並且在隱層設計的足夠完善時,可以擬合任意連續函數。本文將利用 MLP 實現手寫數字分類的任務。 結構:   784個輸入層神經元 – 200個隱層神經元 – 10個輸出

原创 集成學習(西瓜書學習)

算法是死的,思想纔是活的! 集成學習 集成學習(ensemble learning)通過構建並結合多個學習器來完成學習任務。 要獲得好的集成,個體學習器應該“好而不同” 集成學習分類: 個體學習器間存在強依賴關係,必須串行生成的序

原创 matplotlib繪製多張圖、多子圖、多例圖

繪製多圖 關鍵: fig = plt.figure(1) 表示新建第幾個圖 import matplotlib.pyplot as plt fig = plt.figure(1) plt_rec_loss = [1,2,3,4,

原创 shell腳本實現命令的自動執行

背景:在我傻傻的手工執行命令整整一天手腕都有點疼之後發現shell這個大寶貝簡直開心的不得了 1. 關於shell腳本的使用: 一、編寫完成的shell腳本放到腳本要執行的文件的相同目錄下 二、注意shell腳本的編碼問題(w

原创 數據挖掘第一次作業

我先大概寫了寫,還有一些讀過的論文沒有往上放,一些論文之間的聯繫線條沒有搞出來。 就先這樣吧!有空再搞,我現在想去玩板子啦!

原创 Tensorflow修改張量特定位置元素的值

張量和array一樣可以通過切片獲取,但是張量不可以直接修改某個值。 可以理解爲張量具有“只讀”的模式。 如果按照數組修改某個值的方式處理的話,會報錯: import tensorflow as tf tensor_1 = tf.

原创 Pycharm使用遠程服務器運行代碼

pycharm下載專業版,然後用學生郵箱申請個激活碼(我這裏申請了個賬號,更方便)。 連上廈大VPN,再用pycharm高級版可以直接連到學校的GPU服務器,這樣平時不在學校也能調試服務器了。 廈大VPN設置 pycharm下載專

原创 pytorch之embedding

一、隨機初始化的embedding import torch.nn as nn u2e = nn.Embedding(num_users, embed_dim).to(device) 二、自定義的embedding impor

原创 tensorflow版本升級後的各種方法問題

執行命令 tf_upgrade_v2 --infile foo.py --outfile foo_upgraded.py 自動將低版本的方法轉換爲高版本的方法,不過需要人工確認一下。 詳細請看鏈接

原创 方便的小方法

文件追加 from time import time name = "result"+str(time())+".txt" file = r'data/'+name with open(file, 'a+') as f: