我的编程空间,编程开发者的网络收藏夹
学习永远不晚

利用Pytorch进行CNN分析

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

利用Pytorch进行CNN分析

这篇文章主要介绍“利用Pytorch进行CNN分析”,在日常操作中,相信很多人在利用Pytorch进行CNN分析问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”利用Pytorch进行CNN分析”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

工具

开源深度学习库: PyTorch

数据集: MNIST

实现

初始要求

利用Pytorch进行CNN分析

首先建立基本的BASE网络,在Pytorch中有如下code:

class Net(nn.Module):     def __init__(self):         super(Net, self).__init__()         self.conv1 = nn.Conv2d(1, 20, kernel_size=(5, 5), stride=(1, 1), padding=0)         self.conv2 = nn.Conv2d(20, 50, kernel_size=(5, 5), stride=(1, 1), padding=0)         self.fc1 = nn.Linear(4*4*50, 500)         self.fc2 = nn.Linear(500, 10)      def forward(self, x):         x = F.max_pool2d(self.conv1(x), 2)         x = F.max_pool2d(self.conv2(x), 2)         x = x.view(-1, 4*4*50)         x = F.relu(self.fc1(x))         x = self.fc2(x)         return F.log_softmax(x)

这部分代码见 base.py 。

问题A:预处理

利用Pytorch进行CNN分析

即要求将MNIST数据集按照规则读取并且tranform到适合处理的格式。这里读取的代码沿用了BigDL Python  Support的读取方式,无需细说,根据MNIST主页上的数据格式可以很快读出,关键block有读取32位比特的函数:

def _read32(bytestream):     dt = numpy.dtype(numpy.uint32).newbyteorder('>')    # 大端模式读取,***字节在前(MSB first)     return numpy.frombuffer(bytestream.read(4), dtype=dt)[0]

读出后是(N, 1, 28,  28)的tensor,每个像素是0-255的值,首先做一下归一化,将所有值除以255,得到一个0-1的值,然后再Normalize,训练集和测试集的均值方差都已知,直接做即可。由于训练集和测试集的均值方差都是针对归一化后的数据来说的,所以刚开始没做归一化,所以forward输出和grad很离谱,后来才发现是这里出了问题。

这部分代码见 preprocessing.py 。

问题B:BASE模型

利用Pytorch进行CNN分析

将random seed设置为0,在前10000个训练样本上学习参数,***看20个epochs之后的测试集错误率。***结果为:

Test set: Average loss: 0.0014, Accuracy: 9732/10000 (97.3%)

可以看到,BASE模型准确率并不是那么的高。

问题C:Batch Normalization v.s BASE

利用Pytorch进行CNN分析

在前三个block的卷积层之后加上Batch Normalization层,简单修改网络结构如下即可:

class Net(nn.Module):     def __init__(self):         super(Net, self).__init__()         self.conv1 = nn.Conv2d(1, 20, kernel_size=(5, 5), stride=(1, 1), padding=0)         self.conv2 = nn.Conv2d(20, 50, kernel_size=(5, 5), stride=(1, 1), padding=0)         self.fc1 = nn.Linear(4*4*50, 500)         self.fc2 = nn.Linear(500, 10)         self.bn1 = nn.BatchNorm2d(20)         self.bn2 = nn.BatchNorm2d(50)         self.bn3 = nn.BatchNorm1d(500)      def forward(self, x):         x = self.conv1(x)         x = F.max_pool2d(self.bn1(x), 2)         x = self.conv2(x)         x = F.max_pool2d(self.bn2(x), 2)         x = x.view(-1, 4*4*50)         x = self.fc1(x)         x = F.relu(self.bn3(x))         x = self.fc2(x)         return F.log_softmax(x)

同样的参数run一下,得出加了BN的结果为:

Test set: Average loss: 0.0009, Accuracy: 9817/10000 (98.2%)

由此可见,有明显的效果提升。

关于Batch Normalization的更多资料参见[2],[5]。

问题D: Dropout Layer

利用Pytorch进行CNN分析

在***一层即 fc2 层后加一个 Dropout(p=0.5) 后,在BASE和BN上的结果分别为:

BASE:Test set: Average loss: 0.0011, Accuracy: 9769/10000 (97.7%) BN:  Test set: Average loss: 0.0014, Accuracy: 9789/10000 (97.9%)

观察得知,dropout能够对BASE模型起到一定提升作用,但是对BN模型却效果不明显反而降低了。

原因可能在于,BN模型中本身即包含了正则化的效果,再加一层Dropout显得没有必要反而可能影响结果。

问题E:SK model

SK model: Stacking two 3x3 conv. layers to replace 5x5 conv. layer

利用Pytorch进行CNN分析

利用Pytorch进行CNN分析

如此一番改动后,搭建的SK模型如下:

class Net(nn.Module):     def __init__(self):         super(Net, self).__init__()         self.conv1_1 = nn.Conv2d(1, 20, kernel_size=(3, 3), stride=(1, 1), padding=0)         self.conv1_2 = nn.Conv2d(20, 20, kernel_size=(3, 3), stride=(1, 1), padding=0)         self.conv2 = nn.Conv2d(20, 50, kernel_size=(3, 3), stride=(1, 1), padding=0)         self.fc1 = nn.Linear(5*5*50, 500)         self.fc2 = nn.Linear(500, 10)         self.bn1_1 = nn.BatchNorm2d(20)         self.bn1_2 = nn.BatchNorm2d(20)         self.bn2 = nn.BatchNorm2d(50)         self.bn3 = nn.BatchNorm1d(500)         self.drop = nn.Dropout(p=0.5)      def forward(self, x):         x = F.relu(self.bn1_1(self.conv1_1(x)))         x = F.relu(self.bn1_2(self.conv1_2(x)))         x = F.max_pool2d(x, 2)         x = self.conv2(x)         x = F.max_pool2d(self.bn2(x), 2)         x = x.view(-1, 5*5*50)         x = self.fc1(x)         x = F.relu(self.bn3(x))         x = self.fc2(x)         return F.log_softmax(x)

在20个epoch后,结果如下,

SK: Test set: Average loss: 0.0008, Accuracy: 9848/10000 (98.5%)

测试集准确率得到了少许的提高。

这里利用2个3x3的卷积核来代替大的5x5卷积核,参数个数由5x5=25变为了2x3x3=18。实践表明,这样使得计算更快了,并且小的卷积层之间的ReLU也很有帮助。

VGG中就使用了这种方法。

问题F:Change Number of channels

利用Pytorch进行CNN分析

通过将特征图大小乘上一个倍数,再通过shell程序执行,得到如下结果:

SK0.2:  97.7% SK0.5:  98.2% SK1:    98.5% SK1.5:  98.6% SK2:    98.5%  (max 98.7%)

在特征图分别为4,10, 30,  40时,最终的准确度基本是往上提升的。这在一定程度上说明,在没有达到过拟合前,增大特征图的个数,即相当于提取了更多的特征,提取特征数的增加有助于精度的提高。

这部分代码见 SK_s.py 和 runSK.sh 。

问题G:Use different training set sizes

利用Pytorch进行CNN分析

同样通过脚本运行,增加参数

parser.add_argument('--usedatasize', type=int, default=60000, metavar='SZ',                     help='use how many training data to train network')

表示使用的数据大小,从前往后取 usebatchsize 个数据。

这部分程序见 SK_s.py 和 runTrainingSize.sh 。

运行的结果如下:

500:   84.2% 1000:  92.0% 2000:  94.3% 5000:  95.5% 10000: 96.6% 20000: 98.4% 60000: 99.1%

由此可以明显地看出,数据越多,结果的精度越大。

太少的数据无法准确反映数据的整体分布情况,而且容易过拟合,数据多到一定程度效果也会不明显,不过,大多数时候我们总还是嫌数据太少,而且更多的数据获取起来也有一定难度。

问题H:Use different training sets

利用Pytorch进行CNN分析

采用脚本完成,这部分程序见 SK_0.2.py 和 diffTrainingSets.sh 。

运行结果如下:

 0-10000: 98.0% 10000-20000: 97.8% 20000-30000: 97.8% 30000-40000: 97.4% 40000-50000: 97.5% 50000-60000: 97.7%

由此可见,采用不同的训练样本集合训练出来的网络有一定的差异,虽不是很大,但是毕竟显示出了不稳定的结果。

问题I:Random Seed’s effects

利用Pytorch进行CNN分析

采用 runSeed.sh 脚本完成,用到了全部60000个训练集。

运行的结果如下:

Seed      0:  98.9% Seed      1:  99.0% Seed     12:  99.1% Seed    123:  99.0% Seed   1234:  99.1% Seed  12345:  99.0% Seed 123456:  98.9%

事实上在用上整个训练集的时候,随机数生成器的种子设置对于***结果的影响不大。

问题J:ReLU or Sigmoid?

利用Pytorch进行CNN分析

将ReLU全部换成Sigmoid后,用全部60000个训练集训练,有对比结果如下:

ReLU SK_0.2:  99.0% igmoid SK_0.2:  98.6%

由此可以看出,在训练CNN时,使用ReLU激活单元比Sigmoid激活单元要更好一些。原因可能在于二者机制的差别,sigmoid在神经元输入值较大或者较小时,输出值会近乎0或者1,这使得许多地方的梯度几乎为0,权重几乎得不到更新。而ReLU虽然增加了计算的负担,但是它能够显著加速收敛过程,并且也不会有梯度饱和问题。

到此,关于“利用Pytorch进行CNN分析”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

利用Pytorch进行CNN分析

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Python利用CNN实现对时序数据进行分类

这篇文章主要为大家详细介绍了Python如何利用CNN实现对时序数据进行分类功能,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
2023-02-22

利用Python进行数据分析_Panda

申明:本系列文章是自己在学习《利用Python进行数据分析》这本书的过程中,为了方便后期自己巩固知识而整理。import pandas as pdimport numpy as npfile = 'D:\example.xls'df = p
2023-01-30

怎么利用python进行数值分析

小编给大家分享一下怎么利用python进行数值分析,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!一、准备噪声是在拟合过程中常用的干扰手段,常用的噪声:1.统一分布 U(a,b)f ( x ) = { 1 i f a ≤ x
2023-06-15

怎么利用Python进行客户分群分析

这篇文章主要讲解了“怎么利用Python进行客户分群分析”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么利用Python进行客户分群分析”吧!导入数据和python库import pand
2023-07-05

JavaScript如何利用performance.timing进行性能分析

小编给大家分享一下JavaScript如何利用performance.timing进行性能分析,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!performance.timing:利用performance.timing进行
2023-06-03

如何用PyTorch进行语义分割

本篇内容主要讲解“如何用PyTorch进行语义分割”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何用PyTorch进行语义分割”吧!预设置在开始训练之前,得首先设置一下库、数据集等。库准备pi
2023-06-15

python中怎么利用PyTorch进行回归运算

本篇内容介绍了“python中怎么利用PyTorch进行回归运算”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!PyTorch中的重要基础函数
2023-06-30

详解如何利用Python进行客户分群分析

每个电子商务数据分析师必须掌握的一项数据聚类技能,如果你是一名在电子商务公司工作的数据分析师,从客户数据中挖掘潜在价值,来提高客户留存率很可能就是你的工作任务之一。这篇就来告诉你如何将客户分成不同的群组,并在一段时间内观察每个群组的留存率
2023-02-24

PyTorch中如何进行模型的解释性分析

PyTorch提供了多种方法来进行模型的解释性分析,以下是一些常用的方法:特征重要性分析:可以使用SHAP(SHapley Additive exPlanations)库来计算特征的重要性,帮助理解模型的预测结果是如何基于输入特征而变化的。
PyTorch中如何进行模型的解释性分析
2024-03-05

Python怎么用CNN实现对时序数据进行分类

这篇“Python怎么用CNN实现对时序数据进行分类”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Python怎么用CNN实
2023-07-05

pytorch如何利用ResNet18进行手写数字识别

这篇文章主要介绍了pytorch如何利用ResNet18进行手写数字识别问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
2023-02-02

如何利用Angr进行简单CTF逆向分析

如何利用Angr进行简单CTF逆向分析,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。一、符号执行概括简单的来说,符号执行就是在运行程序时,用符号来替代真实值。符号执行相较于
2023-06-17

PyTorch中怎么进行模型评估和性能分析

在PyTorch中,可以使用torch.utils.data.DataLoader加载测试数据集,并调用模型的eval()方法进入评估模式。然后使用测试数据集对模型进行推理,并计算模型的性能指标,如准确率、损失值等。import torc
PyTorch中怎么进行模型评估和性能分析
2024-03-05

编程热搜

目录