台部落向阳争渡

之前寫過一篇PyTorch節省顯存的文章，在此基礎上進行補充老博文傳送門本篇參考自夕小瑤的賣萌屋公衆號一、單卡加載大型網絡 1.1 梯度累加Gradient Accumulation 單卡加載大型網絡，一般受限於大量的網

2020-06-21 00:35:31

TorchText詳細介紹1傳送門 TorchText入門教程，輕鬆玩轉文本處理傳送門 from torchtext.data import Field,TabularDataset,Iterator,BucketIterator ''

2020-06-09 18:20:22

jieba與N-gram結合進行新詞發現使用jieba作爲基礎分詞組件針對新的文本，利用信息熵進行新詞發現使用字典樹存儲單詞和統計詞頻取TopN作爲新詞此方法主要依託互信息和左右信息熵互信息表示的是兩個詞的凝聚力，或者說是兩個

2020-06-09 18:20:22

題目來源： LeetCode113 路徑總和給定一個二叉樹和一個目標和，找到所有從根節點到葉子節點路徑總和等於給定目標和的路徑。說明: 葉子節點是指沒有子節點的節點。 5 /

2020-06-09 18:20:22

import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOExcepti

2020-06-09 18:20:22

在深度學習模型中，Embedding層在代碼層面上的意義是：一個保存了固定字典和大小的簡單查找表。這個模塊常用來保存詞嵌入和用下標檢索它們。模塊的輸入是一個下標的列表，輸出是對應的詞嵌入。當輸入是一個batch時，則這個輸入矩陣是一個N

2020-03-16 18:05:32

from rasa_nlu.model import Interpreter from sklearn.metrics import precision_score from sklearn.metrics import recall_

2019-06-15 20:11:51

指定橫縱座標繪圖 import pandas as pd import matplotlib.pyplot as plt users = pd.read_excel('Users.xlsx') users['Total'] = use

2019-06-10 22:00:46

json.load:把文件打開，並把字符串變換爲數據類型 with open(p,'r') as f: data = json.load(f,ensure_ascii= False) dump:

2019-06-10 22:00:46

學習自張俊林大佬的知乎https://zhuanlan.zhihu.com/p/54743941 想整理下NLP任務中特徵提取的發展脈絡流程，整理了下張大神的博客。 RNN 特徵提取方案：在輸入的線性序列中，從前向後傳播收集輸入信息存在

2019-05-08 16:01:34

數據傾斜的原因：數據傾斜與業務邏輯和數據量有關在MapReduce程序中，數據傾斜主要發生在某個key的數據量較大，此key分散到某個reduce造成reduce階段的緩慢甚至卡頓。在Spark程序中，同一個Stage的不同Part

2019-05-01 01:05:17

深度學習反向傳播的作用：梯度下降法中需要利用損失函數對所有參數的梯度來尋找局部最小點；反向傳播是用於計算梯度的具體方法，本質是利用鏈式法則對每個參數求偏導激活函數使用激活函數的目的是爲了向網絡中加入非線性隱藏層；加強網絡的表達能

2019-05-01 00:49:58

import docx import re from docx import Document import string path = '/Users/ya/Desktop/11246441.docx' document = Doc

2019-04-18 19:25:12

list中extend和append的區別： 1. append() 方法向列表的尾部添加一個新的元素。只接受一個參數。 2. extend()方法只接受一個列表作爲參數，並將該參數的每個元素都添加到原有的列表中。 Zip()和Zip(

2019-04-18 19:25:12

不定時更新工作中遇到的小trick DataFrame.tocsv() 輸出的colume最前面多了一個逗號解決辦法：設置index=False即可 train_data[['qid','title_char']].to_csv(

2019-04-12 19:25:02