Learning Rate Annealing

原創

2018-08-27 16:14

學習率退火

“learning_rate”：學習率
“learning_rate_a”和”learning_rate_b”：學習率衰減參數，具體衰減公式由learning_rate_schedule決定
“learning_rate_schedule”：配置不同的學習率遞減模式，包括：
1. ”constant”: lr = learning_rate
2. “poly”: lr = learning_rate * pow(1 + learning_rate_decay_a * num_samples_processed, -learning_rate_decay_b)
3. “exp”: lr = learning_rate * pow(learning_rate_decay_a, num_samples_processed / learning_rate_decay_b)
4. “discexp”: lr = learning_rate * pow(learning_rate_decay_a, floor(num_samples_processed / learning_rate_decay_b))
5. “linear”: lr = max(learning_rate - learning_rate_decay_a * num_sample_passed, learning_rate_decay_b)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

24小時熱門文章

最新文章

最新評論文章