Keras实现迁移学习-Effective DeepLearning

原創

2020-06-24 17:32

之前做图像分类的项目的时候一直在寻找一个行之有效的迁移学习的实现方法，但是寻找了许久都没有找到。经过我们团队的努力实践最近终于探索出一个有效的方法，这里拿出来跟大家一起探讨一下看看还有那些地方需要改进的。

一，背景

首先因为迁移学习其实没有理论性的一个定义，所以先解析一下我们所需要实现的迁移学习，我们的图像分类是现实分类中的其中一类物体的垂直分类，细分到具体型号的。然后我们是基于DenseNet201创建训练模型，一开始分类数从0到100，因为imageNet的分类跟我们需要的分类不一样所以即使是拿它训练好的模型也是起不来多大的提升作用。项目一直在进行，分类数再从100提升到了500，这时候从0开始训练也是可以接受，因为跨度大之前训练好的模型的分类数相对新增加的分类的分类数占比低。再下去我们再从500增加到600，600增加到630，现在我们在想如果这样子的增加幅度也是要从0开始的话，之前的训练时间就相当于是浪费了，所以就想到了用迁移学习这样的方法把之前训练好的模型的权重集成过来，再在这个基础上训练新加的分类。虽然不知道这个是不是属于真正的迁移学习的范畴，但是在实践中的确比从0开始训练要节省时间。

二，实现

就第一点我们遇到的问题从500增加到600，600增加到630的分类数怎么样有效的利用之前训练好的模型主要有下面两个问题

1. 如何继承前一个模型的权重

2. 如何继承前一个模型的权重之后加上新的分类数

下面先直接上一段代码

#create a DenseNet201 and then load the weigth from existing model

densenet = DenseNet201(include_top=False, weights='imagenet',input_tensor=None, input_shape=(299, 299, 3), pooling='avg')

output = densenet.get_layer(index=-1).output

output = Dropout(0.3)(output)

output = Dense(500, activation='softmax', name='predictions')(output)

model = Model(outputs=output, inputs=densenet.input)

model.load_weights(best_model_file)

#get the old model`s last dense weight and then add new classies into the last dense layer

output = model.get_layer(index=-2).output

old_dense = model.get_layer(index=-1)

weight_list = old_dense.get_weights()

new_weight_0 = np.concatenate((weight_list[0], np.random.randn(old_dense.get_weights()[0].shape[0], 100)), axis=1)

new_weight_1 = np.concatenate((weight_list[1], np.random.randn(100)), axis=1)

old_dense.set_weight([new_weight_0,new_weight_1])

new_dense = old_dense.output
#output the new model to do the trainning
model = Model(outputs=new_dense, inputs=densenet.input)

上面的伪代码主要有三部分

第一步先用Keras的已拥有的model.load_weights(best_model_file)的方法把之前训练好的500分类的模型的权重先加载进来，现在的模型是就的500分类的模型；

第二步是在最后一层的全连接层里在原有的500分类的权重基础上，再在张量矩阵里面加上100新添加分类数的随机数矩阵。这样子就可以使用之前已经训练好的500的分类的权重，又可以在新的训练里面添加上新的分类数。

第三步把新的全连接放到Model的outputs里面创造一个全新的模型作为训练使用。

这样子下来，得到的新的训练模型体现在训练时间上比从0开始训效果要好，具体数据暂时没有记录下来以后有机会再补充。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Keras实现迁移学习-Effective DeepLearning

再谈23种设计模式（3）：行为型模式（学习笔记）

Power Automate Desktop 安装完，登录后老是提示one driver 错误

微前端学习笔记(4):从微前端到微模块之EMP与hel-micro方案探索

微前端学习笔记（1）：微前端总体架构概述，从微服务发微

985 硕士程序员，空窗 4 个月没有 Offer！

一文搞懂 Spring 循环依赖

赛博斗地主——使用大语言模型扮演Agent智能体玩牌类游戏。

VScode右键打开(添加到右键)

记一次 .NET某工控视觉自动化系统卡死分析

WindowsServer--SQL Server搭建主从同步实现读写分离 - 事务性分发

Keras多gpu訓練模型後權重文件無法在cpu或者單gpu機器使用的問題-Effective DeepLearning

keras分佈式訓練模型 openMpi+Horovod+keras -Effective DeepLearning

Keras實現遷移學習-Effective DeepLearning

圖像識別中的P-R曲線是如何產生的-Effective DeepLearning

CUDA安裝踩坑指南-Effective DeepLearning

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結