台部落阿唐明

自然語言幾個重要的模型。循環神經網絡 (序列模型序列依賴問題) 雙向循環神經網絡（輸入序列正向和反向依賴問題）深度雙向循環神經網絡 LSTM（梯度消失問題） GRU text CNN（一維卷積和池化） seq2seq（序列到

2020-07-06 22:44:07

1.下載bert源代碼和中文預訓練模型 bert代碼模型下載 Chinese Simplified and Traditional, 12-layer, 768-hidden, 12-heads, 110M parameter

2020-07-06 22:44:07

1.反射獲取對象的變量和方法等信息。 Class c = user.getClass(); Field field = c.getDeclaredField("id"); Method method = c.getDeclared

2020-07-06 22:43:56

TF-IDF 用於提取關鍵詞，那麼如何從多個文檔中提取出關鍵詞。文章的關鍵詞可能有什麼規律，表示文章主要意思，那這個詞應該在該文章中出現多次，但是在其他文章中出現次數不多。 TF 詞頻（Term Frequency）表示w在文檔

2020-07-06 22:43:56

對之前一節部分進行實踐，使用keras進行實現，keras關於循環神經網絡有多個方法。https://keras.io/zh/layers/recurrent/ SimpleRNN LSTM+CNN 樣本使用ai挑戰賽用戶評

2020-07-06 22:43:56

bert分類模型使用tfserving部署。 bert模型服務化現在已經有對應開源庫部署。例如：1.https://github.com/macanv/BERT-BiLSTM-CRF-NER 該項目支持三種不同的任務 2.使用

2020-06-01 09:50:46

1.歸一化，標準化歸一化：把數據投影到（0，1）或者（-1，1）之間的小數。標準化：數據變成平均值爲0，標準差爲1的數。中心化：均值爲0 區別：歸一化是將樣本的特徵值轉換到同一量綱下把數據映射到[0,1]或者[-1, 1]

2020-05-31 07:27:10

機器學習實戰書籍第二章例子學習筆記書中源碼，here文中還有很多擴展知識和更新方法，很值得學習本文地址here 注： 1.增加CustomLabelBinarizer轉換器解決參數傳遞問題（出現args參數數量錯誤） 2.

2020-05-31 07:27:10

針對上圖分別從每個部分進行計算。 BERT-Base, Uncased 12層，768個隱單元，12個Attention head，110M參數 BERT-Large, Uncased 24層，1024個隱單元，16個head

2020-05-31 07:27:00

1.降維 ravel()、flatten()、squeeze()、reshape(-1) ravel 如果沒有必要，不會產生源數據的副本 flatten 返回源數據的副本源數據不會變化 squeeze 只能對維數爲1的維度降維

2020-05-31 07:27:00

GPU 之前看到一個用畫師的比喻感覺蠻好的。 GPU架構一般來說越新性能越好，架構越好水平越好，類比畫師的水平。流處理器渲染管，流處理器數量越多，顯卡畫圖的能力越強，速度也越快。一般是同型號比較流處理器個數。類比畫師的個

2020-05-31 07:27:00

小白循環神經網絡RNN LSTM 參數數量門單元 cell units timestep batch_size RNN循環神經網絡 timestep batch_size LSTM及參數計算 keras中若干個Cell例如LS

2020-05-24 16:20:21

從零搭建一個tf2.0的web服務，包含mysql redis 使用anaconda 來管理 https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/找一個使用自己環境的安裝包安

2020-04-26 19:01:32

linux 下CPU && GPU && 磁盤信息查看 cpu cat /proc/cpuinfo 獲取全部cpu信息，其中physical id是物理cpu個數，也就是實際CPU個數。 core id cpu的核id cpu c

2020-04-16 03:20:04

cpu的四核八邏輯處理器這樣的處理器使用了超線程技術，所以每個核心是兩個線程，所以4個物理核心就是8個線程。所以在操作系統的設備管理器裏面看到的CPU數量是實際物理CPU數量的兩倍例如八個邏輯處理器，出去系統主線程。以w

2020-04-16 03:20:04