位置：首页-资讯-后端开发

Pytorch实现网络部分层的固定不进行回传更新问题及思路详解

2024-04-02 19:55

短信预约 -IT技能 免费直播动态提醒

实际问题

Pytorch有的时候需要对一些层的参数进行固定，这些层不进行参数的梯度更新

问题解决思路

那么从理论上来说就有两种办法

优化器初始化的时候不包含这些不想被更新的参数，这样他们会进行梯度回传，但是不会被更新
将这些不会被更新的参数梯度归零，或者不计算它们的梯度

思路就是利用tensor的requires_grad，每一个tensor都有自己的requires_grad成员，值只能为True和False。我们对不需要参与训练的参数的requires_grad设置为False。

在optim参数模型参数中过滤掉requires_grad为False的参数。
还是以上面搭建的简单网络为例，我们固定第一个卷积层的参数，训练其他层的所有参数。

代码实现


class Net(nn.Module):
    def __init__(self):
        super(Net,self).__init__()
        self.conv1 = nn.Conv2d(3,32,3)
        self.conv2 = nn.Conv2d(32,24,3)
        self.prelu = nn.PReLU()
        for m in self.modules():
            if isinstance(m,nn.Conv2d):
                nn.init.xavier_normal_(m.weight.data)
                nn.init.constant_(m.bias.data,0)
            if isinstance(m,nn.Linear):
                m.weight.data.normal_(0.01,0,1)
                m.bias.data.zero_()
    def forward(self, input):
        out = self.conv1(input)
        out = self.conv2(out)
        out = self.prelu(out)
        return out

遍历第一层的参数，然后为其设置requires_grad


model = Net()
for name, p in model.named_parameters():
    if name.startswith('conv1'):
        p.requires_grad = False
        
optimizer = torch.optim.Adam(filter(lambda x: x.requires_grad is not False ,model.parameters()),lr= 0.2)

为了验证一下我们的设置是否正确，我们分别看看model中的参数的requires_grad和optim中的params_group()。


for p in model.parameters():
    print(p.requires_grad)

能看出优化器仅仅对requires_grad为True的参数进行迭代优化。

LAST 参考文献

Pytorch中，动态调整学习率、不同层设置不同学习率和固定某些层训练的方法_我的博客有点东西-CSDN博客

到此这篇关于Pytorch实现网络部分层的固定不进行回传更新的文章就介绍到这了,更多相关Pytorch网络部分层内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

Pytorch实现网络部分层的固定不进行回传更新问题及思路详解

下载Word文档到电脑，方便收藏和打印～

下载Word文档

Pytorch实现网络部分层的固定不进行回传更新问题及思路详解

目录

实际问题

问题解决思路

代码实现

LAST 参考文献

Pytorch实现网络部分层的固定不进行回传更新问题及思路详解

相关文章

猜你喜欢

Pytorch实现网络部分层的固定不进行回传更新问题及思路详解

热门标签

编程热搜

Python 学习之路 - Python

chatgpt的中文全称是什么

C/C++中extern函数使用详解

C/C++可变参数的使用

css样式文件该放在哪里

php中数组下标必须是连续的吗

Python 3 教程

Python pip包管理

ubuntu如何重新编译内核

改善Java代码之慎用java动态编译

编程资源站

2021年下半年软考高级信息系统项目管理师高频考点精选资料

2021下半年软考高级信息系统技术知识点记忆口诀精选资料

2021下半年软考《信息系统项目管理师》考试真题及答案精选资料

2021下半年软考高级考试备考攻略精选资料

2021年软考高级《信息系统项目管理师》巩固练习题汇总精选资料

2021下半年软考高级信息系统项目管理师30个易考知识点汇总精选资料

2021下半年软考高级知识点这样记，还担心记不住吗精选资料

2021年下半年软考高级考试重点汇总精选资料

2021下半年软考高级信息系统项目管理师计算公式汇总精选资料

2021年下半年软考高级《信息系统项目管理师》模拟试题精选资料

信息系统项目管理师选择题每日一练（2024）历年试题

2023年下半年信息系统项目管理师综合知识真题演练历年试题

目录

Pytorch实现网络部分层的固定不进行回传更新问题及思路详解

目录

实际问题

问题解决思路

代码实现

LAST 参考文献

Pytorch实现网络部分层的固定不进行回传更新问题及思路详解

相关文章

猜你喜欢

Pytorch实现网络部分层的固定不进行回传更新问题及思路详解

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复