模型參數

positive_data_dir = "data/train/pos"
negative_data_dir = "data/train/neg"
data_dirs = [negative_data_dir, positive_data_dir]
out_dir = "runs"

正負樣本數據文件夾,以及最後輸出的文件夾名稱

文件夾裏面是一個一個的txt,每一個文本代表一個樣本包含以及預處理後的數據

document_length_limit = 1000
is_line_as_word = True
dev_sample_percentage = 0.1

文件的長度限制,用在哪?

一行是否是一個單詞,後面創建字典的時候會用到

訓練集與測試集劃分的比例

num_classes = len(data_dirs) 分類個數,多分類or二分類,這裏是二分類
embedding_size = 100
filter_sizes = [3, 4, 5] 卷積核大小
stride_h = 1 步長
num_filters = 128 卷積核大小
keep_prob_rate = 1.0 
learning_rate = 1e-3 學習率
batch_size = 32 訓練批次
ecoph_num = 100 迭代次數
evaluate_every = 10 每10此評估一次
checkpoint_every = 10 每10次保存一次
# is_finetune = False
is_finetune = True 
is_bn = True  # use batch norm or not 是否使用BN
l2_lambda = 0.0 正則化參數
decay_steps = 1000 每1000輪給學習率乘以0.5
decay_rate = 0.5 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章