我的编程空间,编程开发者的网络收藏夹
学习永远不晚

PyTorch中tensor.detach()和tensor.data的区别有哪些

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

PyTorch中tensor.detach()和tensor.data的区别有哪些

这篇文章主要介绍“PyTorch中tensor.detach()和tensor.data的区别有哪些”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“PyTorch中tensor.detach()和tensor.data的区别有哪些”文章能帮助大家解决问题。

PyTorch中 tensor.detach() 和 tensor.data 的区别

以 a.data, a.detach() 为例:
两种方法均会返回和a相同的tensor,且与原tensor a 共享数据,一方改变,则另一方也改变。

所起的作用均是将变量tensor从原有的计算图中分离出来,分离所得tensor的requires_grad = False。

不同点:

data是一个属性,.detach()是一个方法;data是不安全的,.detach()是安全的;

>>> a = torch.tensor([1,2,3.], requires_grad =True)>>> out = a.sigmoid()>>> c = out.data>>> c.zero_()tensor([ 0., 0., 0.])>>> out                   #  out的数值被c.zero_()修改tensor([ 0., 0., 0.])>>> out.sum().backward()  #  反向传播>>> a.grad                #  这个结果很严重的错误,因为out已经改变了tensor([ 0., 0., 0.])

为什么.data是不安全的?

这是因为,当我们修改分离后的tensor,从而导致原tensora发生改变。PyTorch的自动求导Autograd是无法捕捉到这种变化的,会依然按照求导规则进行求导,导致计算出错误的导数值。

其风险性在于,如果我在某一处修改了某一个变量,求导的时候也无法得知这一修改,可能会在不知情的情况下计算出错误的导数值。

>>> a = torch.tensor([1,2,3.], requires_grad =True)>>> out = a.sigmoid()>>> c = out.detach()>>> c.zero_()tensor([ 0., 0., 0.])>>> out                   #  out的值被c.zero_()修改 !!tensor([ 0., 0., 0.])>>> out.sum().backward()  #  需要原来out得值,但是已经被c.zero_()覆盖了,结果报错RuntimeError: one of the variables needed for gradientcomputation has been modified by an

那么.detach()为什么是安全的?

使用.detach()的好处在于,若是出现上述情况,Autograd可以检测出某一处变量已经发生了改变,进而以如下形式报错,从而避免了错误的求导。

RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation. Hint: enable anomaly detection to find the operation that failed to compute its gradient, with torch.autograd.set_detect_anomaly(True).

从以上可以看出,是在前向传播的过程中使用就地操作(In-place operation)导致了这一问题,那么就地操作是什么呢?

补充:pytorch中的detach()函数的作用

detach()

官方文档中,对这个方法是这么介绍的。

  • 返回一个新的从当前图中分离的 Variable。

  • 返回的 Variable 永远不会需要梯度 如果 被 detach

  • 的Variable volatile=True, 那么 detach 出来的 volatile 也为 True

  • 还有一个注意事项,即:返回的 Variable 和 被 detach 的Variable 指向同一个 tensor

import torchfrom torch.nn import initfrom torch.autograd import Variablet1 = torch.FloatTensor([1., 2.])v1 = Variable(t1)t2 = torch.FloatTensor([2., 3.])v2 = Variable(t2)v3 = v1 + v2v3_detached = v3.detach()v3_detached.data.add_(t1) # 修改了 v3_detached Variable中 tensor 的值print(v3, v3_detached)    # v3 中tensor 的值也会改变

能用来干啥

可以对部分网络求梯度。

如果我们有两个网络 , 两个关系是这样的 现在我们想用 来为B网络的参数来求梯度,但是又不想求A网络参数的梯度。我们可以这样:

# y=A(x), z=B(y) 求B中参数的梯度,不求A中参数的梯度y = A(x)z = B(y.detach())z.backward()

关于“PyTorch中tensor.detach()和tensor.data的区别有哪些”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注编程网行业资讯频道,小编每天都会为大家更新不同的知识点。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

PyTorch中tensor.detach()和tensor.data的区别有哪些

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

PyTorch中tensor.detach()和tensor.data的区别有哪些

这篇文章主要介绍“PyTorch中tensor.detach()和tensor.data的区别有哪些”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“PyTorch中tensor.detach()和te
2023-07-05

PyTorch中tensor.detach()和tensor.data的区别解析

这篇文章主要介绍了PyTorch中tensor.detach()和tensor.data的区别解析,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2023-05-14

pytorch中.to(device) 和.cuda()的区别有哪些

这篇文章主要介绍了pytorch中.to(device) 和.cuda()的区别有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。原理.to(device) 可以指定CPU
2023-06-15

Kotlin中?和!!的区别有哪些

这篇文章给大家分享的是有关Kotlin中?和!!的区别有哪些的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。前言很多同学刚上手使用Kotlin知道它有针对Java NullPointerException的管理,而
2023-06-14

js中==和===的区别有哪些

这篇文章将为大家详细讲解有关js中==和===的区别有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。JavaScript是什么JavaScript是一种直译式的脚本语言,其解释器被称为JavaScri
2023-06-15

Numpy.array中[:]和[::]的区别有哪些

小编给大家分享一下Numpy.array中[:]和[::]的区别有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!array([:])>>> import nu
2023-06-15

golang中&和*的区别有哪些

本文将为大家详细介绍“golang中&和*的区别有哪些”,内容步骤清晰详细,细节处理妥当,而小编每天都会更新不同的知识点,希望这篇“golang中&和*的区别有哪些”能够给你意想不到的收获,请大家跟着小编的思路慢慢深入,具体内容如下,一起去
2023-06-06

Java中==和equals()的区别有哪些

小编给大家分享一下Java中==和equals()的区别有哪些,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!1. ==== 是运算符,用来判断两个值是否相等,==可以使用在基本数据类型变量和引用数据类型变量中1.1 基本数
2023-06-25

PyTorch中torch.tensor()和torch.to_tensor()的区别

在Pytorch中Tensor和tensor都用于生成新的张量,但二者并不相同,下面这篇文章主要给大家介绍了关于PyTorch中torch.tensor()和torch.to_tensor()区别的相关资料,需要的朋友可以参考下
2023-01-28

php=== 和==的区别有哪些

这篇文章主要介绍“php === 和==的区别有哪些”,在日常操作中,相信很多人在php === 和==的区别有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”php === 和==的区别有哪些”的疑惑有所
2023-06-25

java中Runnable和Thread的区别有哪些

这篇文章将为大家详细讲解有关java中Runnable和Thread的区别有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。在java中可有两种方式实现多线程,一种是继承Thread类,一种是实现Run
2023-06-02

JS中let和var的区别有哪些

这篇文章将为大家详细讲解有关JS中let和var的区别有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。1.作用域的不同:{ let a = 10; var b = 1; } a // Refer
2023-06-14

Hibernate中VO和PO的区别有哪些

这篇文章将为大家详细讲解有关Hibernate中VO和PO的区别有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。VO,值对象(Value Object),PO,持久对象(Persisent Objec
2023-06-17

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录