我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Pytorch中model.eval()的作用是什么

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Pytorch中model.eval()的作用是什么

这篇文章主要介绍了Pytorch中model.eval()的作用是什么的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Pytorch中model.eval()的作用是什么文章都会有所收获,下面我们一起来看看吧。

    model.eval()的作用及分析

    • model.eval() 作用等同于 self.train(False)

    简而言之,就是评估模式。而非训练模式。

    在评估模式下,batchNorm层,dropout层等用于优化训练而添加的网络层会被关闭,从而使得评估时不会发生偏移。

    结论

    在对模型进行评估时,应该配合使用with torch.no_grad() 与 model.eval():

        loop:        model.train()    # 切换至训练模式        train……        model.eval()        with torch.no_grad():            Evaluation    end loop

    Pytorch踩坑之model.eval()问题

    最近在写代码时遇到一个问题,原本训练好的模型,加载进来进行inference准确率直接掉了5个点,这简直不能忍啊~下意识地感知到我肯定又在哪里写了bug了~~~于是开始到处排查,从model load到data load,最终在一个被我封装好的module的犄角旮旯里找到了问题,于是顺便就在这里总结一下,避免以后再犯。 

    对于训练好的模型加载进来准确率和原先的不符,

    比较常见的有两方面的原因

    • data

    • model.state_dict() 

    1) data

    数据方面,检查前后两次加载的data有没有发生变化。首先检查 transforms.Normalize 使用的均值和方差是否和训练时相同;另外检查在这个过程中数据是否经过了存储形式的改变,这有可能会带来数据精度的变化导致一定的信息丢失。比如我过用的其中一个数据集,原先将图片存储成向量形式,但其对应的是“png”格式的数据(后来在原始文件中发现了相应的描述。),而我进行了一次data-to-img操作,将向量转换成了“jpg”形式,这时加载进来便造成了掉点。

    2)model.state_dict()

    第一方面造成的掉点一般不会太严重,第二方面造成的掉点就比较严重了,一旦模型的参数加载错了,那就误差大了。

    如果是参数没有正确加载进来则比较容易发现,这时准确率非常低,几乎等于瞎猜。

    而我这次遇到的情况是,准确率并不是特别低,只掉了几个点,检查了多次,均显示模型参数已经成功加载了。后来仔细查看后发现在其中一次调用模型进行inference时,忘了写 ‘model.eval()’,造成了模型的参数发生变化,再次调用则出现了掉点。于是又回顾了一下model.eval()和model.train()的具体作用。如下:

    model.train() 和 model.eval() 一般在模型训练和评价的时候会加上这两句,主要是针对由于model 在训练时和评价时 Batch Normalization 和 Dropout 方法模式不同:

    • a) model.eval(),不启用 BatchNormalization 和 Dropout。此时pytorch会自动把BN和DropOut固定住,不会取平均,而是用训练好的值。不然的话,一旦test的batch_size过小,很容易就会因BN层导致模型performance损失较大;

    • b) model.train() :启用 BatchNormalization 和 Dropout。 在模型测试阶段使用model.train() 让model变成训练模式,此时 dropout和batch normalization的操作在训练q起到防止网络过拟合的问题。

    因此,在使用PyTorch进行训练和测试时一定要记得把实例化的model指定train/eval。

    model.eval()   vs   torch.no_grad()

    虽然二者都是eval的时候使用,但其作用并不相同:

    model.eval() 负责改变batchnorm、dropout的工作方式,如在eval()模式下,dropout是不工作的。

    见下方代码:

      import torch  import torch.nn as nn   drop = nn.Dropout()  x = torch.ones(10)    # Train mode     drop.train()  print(drop(x)) # tensor([2., 2., 0., 2., 2., 2., 2., 0., 0., 2.])       # Eval mode     drop.eval()  print(drop(x)) # tensor([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

    torch.no_grad() 负责关掉梯度计算,节省eval的时间。

    只进行inference时,model.eval()是必须使用的,否则会影响结果准确性。 而torch.no_grad()并不是强制的,只影响运行效率。

    关于“Pytorch中model.eval()的作用是什么”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“Pytorch中model.eval()的作用是什么”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注编程网行业资讯频道。

    免责声明:

    ① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

    ② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

    Pytorch中model.eval()的作用是什么

    下载Word文档到电脑,方便收藏和打印~

    下载Word文档

    猜你喜欢

    Pytorch中model.eval()的作用是什么

    这篇文章主要介绍了Pytorch中model.eval()的作用是什么的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Pytorch中model.eval()的作用是什么文章都会有所收获,下面我们一起来看看吧。m
    2023-07-05

    Pytorch中关于model.eval()的作用及分析

    这篇文章主要介绍了Pytorch中关于model.eval()的作用及分析,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-02-03

    Pytorch中的model.train()和model.eval()怎么使用

    本文小编为大家详细介绍“Pytorch中的model.train()和model.eval()怎么使用”,内容详细,步骤清晰,细节处理妥当,希望这篇“Pytorch中的model.train()和model.eval()怎么使用”文章能帮助
    2023-07-06

    PyTorch中TorchScript的作用是什么

    在 PyTorch 中,TorchScript 是一种将 PyTorch 模型转换为序列化脚本(script)的工具。TorchScript 的作用主要有以下几点:跨平台部署:通过将 PyTorch 模型转换为 TorchScript,可以
    PyTorch中TorchScript的作用是什么
    2024-03-06

    pytorch中retain_graph==True的作用是什么

    这篇文章主要介绍“pytorch中retain_graph==True的作用是什么”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“pytorch中retain_graph==True的作用是什么”文章
    2023-07-05

    Pytorch中的model.train() 和 model.eval() 原理与用法解析

    pytorch可以给我们提供两种方式来切换训练和评估(推断)的模式,分别是:model.train() 和 model.eval(),这篇文章主要介绍了Pytorch中的model.train() 和 model.eval() 原理与用法,需要的朋友可以参考下
    2023-05-15

    PyTorch中的张量是什么

    在PyTorch中,张量是一种类似于多维数组的数据结构,可以存储和处理多维数据。张量在PyTorch中是用来表示神经网络的输入、输出和参数的主要数据类型。张量可以是任意维度的,可以是标量(0维张量)、向量(1维张量)、矩阵(2维张量)等等。
    PyTorch中的张量是什么
    2024-03-05

    pytorch中的hook机制是什么

    本篇内容介绍了“pytorch中的hook机制是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!1、hook背景Hook被成为钩子机制,这
    2023-06-29

    pytorch中的广播语义是什么

    这篇文章主要介绍“pytorch中的广播语义是什么”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“pytorch中的广播语义是什么”文章能帮助大家解决问题。1、什么是广播语义?官方文档有这样一个解释:
    2023-06-29

    PyTorch中Tensor和tensor的区别是什么

    这篇文章主要介绍“PyTorch中Tensor和tensor的区别是什么”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“PyTorch中Tensor和tensor的区别是什么”文章能帮助大家解决问题。
    2023-07-02

    python中的Pytorch建模流程是什么

    小编给大家分享一下python中的Pytorch建模流程是什么,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!一般我们训练神经网络有以下步骤:导入库设置训练参数的初
    2023-06-29

    pytorch中backward的参数含义是什么

    本文小编为大家详细介绍“pytorch中backward的参数含义是什么”,内容详细,步骤清晰,细节处理妥当,希望这篇“pytorch中backward的参数含义是什么”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧
    2023-07-05

    python中%的作用是什么

    python中%的作用是什么?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。Python主要用来做什么Python主要应用于:1、Web开发;2、数据科学研究;3、网络爬虫;
    2023-06-14

    python中“+=”的作用是什么

    本篇内容介绍了“python中“+=”的作用是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!在python中,“+=”是指“加赋值”运算
    2023-07-04

    python中的作用是什么

    这期内容当中小编将会给大家带来有关python中的作用是什么,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。Python主要用来做什么Python主要应用于:1、Web开发;2、数据科学研究;3、网络爬虫;
    2023-06-14

    jquery中$的作用是什么

    这篇文章主要介绍“jquery中$的作用是什么”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“jquery中$的作用是什么”文章能帮助大家解决问题。作用有:1、作为jQuery包装器,利用选择器来选择
    2023-07-05

    python中 -=的作用是什么

    本篇文章为大家展示了python中 -=的作用是什么,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。python主要应用领域有哪些1、云计算,典型应用OpenStack。2、WEB前端开发,众多大型网
    2023-06-14

    python中 =的作用是什么

    本篇文章为大家展示了python中 =的作用是什么,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。python有哪些常用库python常用的库:1.requesuts;2.scrapy;3.pillo
    2023-06-14

    编程热搜

    • Python 学习之路 - Python
      一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
      Python 学习之路 - Python
    • chatgpt的中文全称是什么
      chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
      chatgpt的中文全称是什么
    • C/C++中extern函数使用详解
    • C/C++可变参数的使用
      可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
      C/C++可变参数的使用
    • css样式文件该放在哪里
    • php中数组下标必须是连续的吗
    • Python 3 教程
      Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
      Python 3 教程
    • Python pip包管理
      一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
      Python pip包管理
    • ubuntu如何重新编译内核
    • 改善Java代码之慎用java动态编译

    目录