positive_data_dir = "data/train/pos" negative_data_dir = "data/train/neg" data_dirs = [negative_data_dir, positive_data_dir] out_dir = "runs"
正負樣本數據文件夾,以及最後輸出的文件夾名稱
文件夾裏面是一個一個的txt,每一個文本代表一個樣本包含以及預處理後的數據
document_length_limit = 1000 is_line_as_word = True dev_sample_percentage = 0.1
文件的長度限制,用在哪?
一行是否是一個單詞,後面創建字典的時候會用到
訓練集與測試集劃分的比例
num_classes = len(data_dirs) 分類個數,多分類or二分類,這裏是二分類 embedding_size = 100 filter_sizes = [3, 4, 5] 卷積核大小 stride_h = 1 步長 num_filters = 128 卷積核大小 keep_prob_rate = 1.0 learning_rate = 1e-3 學習率 batch_size = 32 訓練批次 ecoph_num = 100 迭代次數 evaluate_every = 10 每10此評估一次 checkpoint_every = 10 每10次保存一次 # is_finetune = False is_finetune = True is_bn = True # use batch norm or not 是否使用BN l2_lambda = 0.0 正則化參數 decay_steps = 1000 每1000輪給學習率乘以0.5 decay_rate = 0.5