我的编程空间,编程开发者的网络收藏夹
学习永远不晚

批标准化层tf.keras.layers.Batchnormalization的使用位置是什么

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

批标准化层tf.keras.layers.Batchnormalization的使用位置是什么

这篇文章主要介绍“批标准化层tf.keras.layers.Batchnormalization的使用位置是什么”,在日常操作中,相信很多人在批标准化层tf.keras.layers.Batchnormalization的使用位置是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”批标准化层tf.keras.layers.Batchnormalization的使用位置是什么”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

    批标准化层 tf.keras.layers.Batchnormalization()

    tf.keras.layers.Batchnormalization()

    重要参数:

    • training:布尔值,指示图层应在训练模式还是在推理模式下运行。

    • training=True:该图层将使用当前批输入的均值和方差对其输入进行标准化。

    • training=False:该层将使用在训练期间学习的移动统计数据的均值和方差来标准化其输入。

    BatchNormalization 广泛用于 Keras 内置的许多高级卷积神经网络架构,比如 ResNet50、Inception V3 和 Xception。

    BatchNormalization 层通常在卷积层或密集连接层之后使用。

    批标准化的实现过程

    • 求每一个训练批次数据的均值

    • 求每一个训练批次数据的方差

    • 数据进行标准化

    • 训练参数γ,β

    • 输出y通过γ与β的线性变换得到原来的数值

    在训练的正向传播中,不会改变当前输出,只记录下γ与β。在反向传播的时候,根据求得的γ与β通过链式求导方式,求出学习速率以至改变权值。

    对于预测阶段时所使用的均值和方差,其实也是来源于训练集。比如我们在模型训练时我们就记录下每个batch下的均值和方差,待训练完毕后,我们求整个训练样本的均值和方差期望值,作为我们进行预测时进行BN的的均值和方差。

    批标准化的使用位置

    原始论文讲在CNN中一般应作用与非线性激活函数之前,但是,实际上放在激活函数之后效果可能会更好。

    # 放在非线性激活函数之前model.add(tf.keras.layers.Conv2D(64, (3, 3)))model.add(tf.keras.layers.BatchNormalization())model.add(tf.keras.layers.Activation('relu'))# 放在激活函数之后model.add(tf.keras.layers.Conv2D(64, (3, 3), activation='relu'))model.add(tf.keras.layers.BatchNormalization())

    tf.keras.layers.BatchNormalization使用细节

    关于keras中的BatchNormalization使用,官方文档说的足够详细。本文的目的旨在说明在BatchNormalization的使用过程中容易被忽略的细节。

    在BatchNormalization的Arguments参数中有trainable属性;以及在Call arguments参数中有training。两个都是bool类型。第一次看到有两个参数的时候,我有点懵,为什么需要两个?

    后来在查阅资料后发现了两者的不同作用。

    1,trainable是Argument参数,类似于c++中构造函数的参数一样,是构建一个BatchNormalization层时就需要传入的,至于它的作用在下面会讲到。

    2,training参数时Call argument(调用参数),是运行过程中需要传入的,用来控制模型在那个模式(train还是interfere)下运行。关于这个参数,如果使用模型调用fit()的话,是可以不给的(官方推荐是不给),因为在fit()的时候,模型会自己根据相应的阶段(是train阶段还是inference阶段)决定training值,这是由learning——phase机制实现的。

    重点

    关于trainable=False:如果设置trainable=False,那么这一层的BatchNormalization层就会被冻结(freeze),它的trainable weights(可训练参数)(就是gamma和beta)就不会被更新。

    注意:freeze mode和inference mode是两个概念。

    但是,在BatchNormalization层中,如果把某一层BatchNormalization层设置为trainable=False,那么这一层BatchNormalization层将一inference mode运行,也就是说(meaning that it will use the moving mean and the moving variance to normalize the current batch, rather than using the mean and variance of the current batch).

    到此,关于“批标准化层tf.keras.layers.Batchnormalization的使用位置是什么”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!

    免责声明:

    ① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

    ② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

    批标准化层tf.keras.layers.Batchnormalization的使用位置是什么

    下载Word文档到电脑,方便收藏和打印~

    下载Word文档

    猜你喜欢

    批标准化层tf.keras.layers.Batchnormalization的使用位置是什么

    这篇文章主要介绍“批标准化层tf.keras.layers.Batchnormalization的使用位置是什么”,在日常操作中,相信很多人在批标准化层tf.keras.layers.Batchnormalization的使用位置是什么问题
    2023-07-05

    C语言中定义和使用的特殊标准是什么

    本文小编为大家详细介绍“C语言中定义和使用的特殊标准是什么”,内容详细,步骤清晰,细节处理妥当,希望这篇“C语言中定义和使用的特殊标准是什么”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。一、ANSI C特殊标准定
    2023-06-16

    javascript浏览器的滚动条位置发生变化时触发此事件使用什么函数,详细讲解

    当浏览器滚动条位置变化时,可以使用以下JavaScript函数触发事件:window.onscroll:用于任何元素的滚动条变化document.onscroll:仅用于文档的滚动条变化element.onscroll:用于特定元素的滚动条变化这些函数接收事件对象,包含有关滚动条状态的信息(scrollTop和scrollLeft)。事件处理程序函数将根据滚动条变化执行指定的代码,并可在页面加载或动态添加。
    javascript浏览器的滚动条位置发生变化时触发此事件使用什么函数,详细讲解
    2024-04-02

    编程热搜

    • Python 学习之路 - Python
      一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
      Python 学习之路 - Python
    • chatgpt的中文全称是什么
      chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
      chatgpt的中文全称是什么
    • C/C++中extern函数使用详解
    • C/C++可变参数的使用
      可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
      C/C++可变参数的使用
    • css样式文件该放在哪里
    • php中数组下标必须是连续的吗
    • Python 3 教程
      Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
      Python 3 教程
    • Python pip包管理
      一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
      Python pip包管理
    • ubuntu如何重新编译内核
    • 改善Java代码之慎用java动态编译

    目录