神经网络——Python实现BP神经网络算法(理论+例子+程序)
采用BP算法的多层感知器是至今为止应用最广泛的神经网络,在多层感知器的应用中,以图3-15所示的单隐层网络的应用最为普遍。一般习惯将单隐层前馈网称为三层感知器,所谓三层包括了输入层、隐层和输出层。
算法最终结果采用梯度下降法,具体详细过程此处就省略了!
标准BP算法在调整权值时,只按t时刻误差的梯度降方向调整,而没有考虑t时刻以前的梯度方向,从而常使训练过程发生振荡,收敛缓慢。为了提高网络的训练速度,可以在权值调整公式中增加一动量项。若用W代表某层权矩阵,X代表某层输入向量,则含有动量项的权值调整向量表达式为
可以看出,增加动量项即从前一次权值调整量中取出一部分迭加到本次权值调整量中,α称为动量系数,一般有a∈ (0,1)。动量项反映了以前积累的调整经验,对于t时刻的调整起阻尼作用。当误差曲面出现骤然起伏时,可减小振荡趋势,提高训练速度。目前,BP算法中都增加了动量项,以致于有动量项的BP算法成为一种新的标准算法。
这里为了运用算法,简要的举了一个例子(不需归一化或标准化的例子)
输入 X=-1:0.1:1;
输出 D=.....(具体查看代码里面的数据)
为了便于查看结果我们输出把结果绘制为图形,如下:
其中黄线和蓝线代表着训练完成后的输出与输入
# -*- coding: utf-8 -*-import mathimport stringimport matplotlib as mpl############################################调用库(根据自己编程情况修改)import numpy.matlib import numpy as npnp.seterr(divide='ignore',invalid='ignore')import matplotlib.pyplot as pltfrom matplotlib import font_managerimport pandas as pdimport random#生成区间[a,b]内的随机数def random_number(a,b): return (b-a)*random.random()+a #生成一个矩阵,大小为m*n,并且设置默认零矩阵def makematrix(m, n, fill=0.0): a = [] for i in range(m): a.append([fill]*n) return np.array(a) #函数sigmoid(),两个函数都可以作为激活函数def sigmoid(x): #return np.tanh(x) return (1-np.exp(-1*x))/(1+np.exp(-1*x))#函数sigmoid的派生函数def derived_sigmoid(x): return 1-(np.tanh(x))**2 #return (2*np.exp((-1)*x)/((1+np.exp(-1*x)**2)))#构造三层BP网络架构class BPNN: def __init__(self, num_in, num_hidden, num_out): #输入层,隐藏层,输出层的节点数 self.num_in = num_in + 1 #增加一个偏置结点 self.num_hidden = num_hidden + 1 #增加一个偏置结点 self.num_out = num_out #激活神经网络的所有节点(向量) self.active_in = np.array([-1.0]*self.num_in) self.active_hidden = np.array([-1.0]*self.num_hidden) self.active_out = np.array([1.0]*self.num_out) #创建权重矩阵 self.wight_in = makematrix(self.num_in, self.num_hidden) self.wight_out = makematrix(self.num_hidden, self.num_out) #对权值矩阵赋初值 for i in range(self.num_in): for j in range(self.num_hidden): self.wight_in[i][j] = random_number(0.1, 0.1) for i in range(self.num_hidden): for j in range(self.num_out): self.wight_out[i][j] = random_number(0.1, 0.1) #偏差 for j in range(self.num_hidden): self.wight_in[0][j] = 0.1 for j in range(self.num_out): self.wight_in[0][j] = 0.1 #最后建立动量因子(矩阵) self.ci = makematrix(self.num_in, self.num_hidden) self.co = makematrix(self.num_hidden, self.num_out) #信号正向传播 def update(self, inputs): if len(inputs) != self.num_in-1: raise ValueError('与输入层节点数不符') #数据输入输入层 self.active_in[1:self.num_in]=inputs #数据在隐藏层的处理 self.sum_hidden=np.dot(self.wight_in.T,self.active_in.reshape(-1,1)) #点乘 self.active_hidden=sigmoid(self.sum_hidden) #active_hidden[]是处理完输入数据之后存储,作为输出层的输入数据 self.active_hidden[0]=-1 #数据在输出层的处理 self.sum_out=np.dot(self.wight_out.T,self.active_hidden) #点乘 self.active_out = sigmoid(self.sum_out) #与上同理 return self.active_out #误差反向传播 def errorbackpropagate(self, targets, lr,m): #lr是学习率 if self.num_out==1: targets=[targets] if len(targets) != self.num_out: raise ValueError('与输出层节点数不符!') #误差 error=(1/2)*np.dot((targets.reshape(-1,1)-self.active_out).T,(targets.reshape(-1,1)-self.active_out)) #输出误差信号 self.error_out=(targets.reshape(-1,1)-self.active_out)*derived_sigmoid(self.sum_out) #隐层误差信号 #self.error_hidden=np.dot(self.wight_out.reshape(-1,1),self.error_out.reshape(-1,1))*self.active_hidden*(1-self.active_hidden) self.error_hidden=np.dot(self.wight_out,self.error_out)*derived_sigmoid(self.sum_hidden) #更新权值 #隐藏 self.wight_out=self.wight_out+lr*np.dot(self.error_out,self.active_hidden.reshape(1,-1)).T+m*self.co self.co=lr*np.dot(self.error_out,self.active_hidden.reshape(1,-1)).T #输入 self.wight_in=self.wight_in+lr*np.dot(self.error_hidden,self.active_in.reshape(1,-1)).T+m*self.ci self.ci=lr*np.dot(self.error_hidden,self.active_in.reshape(1,-1)).T return error #测试 def test(self, patterns): for i in patterns: print(i[0:self.num_in-1], '->', self.update(i[0:self.num_in-1])) return self.update(i[0:self.num_in-1]) #权值 def weights(self): print("输入层权重") print(self.wight_in) print("输出层权重") print(self.wight_out) def train(self, pattern, itera=100, lr = 0.2, m=0.1): for i in range(itera): error = 0.0 for j in pattern: inputs = j[0:self.num_in-1] targets = j[self.num_in-1:] self.update(inputs) error = error+self.errorbackpropagate(targets, lr,m) if i % 10 == 0: print('########################误差 %-.5f######################第%d次迭代' %(error,i))#实例X=list(np.arange(-1,1.1,0.1))D=[-0.96, -0.577, -0.0729, 0.017, -0.641, -0.66, -0.11, 0.1336, -0.201, -0.434, -0.5, -0.393, -0.1647, 0.0988, 0.3072, 0.396, 0.3449, 0.1816, -0.0312, -0.2183, -0.3201]A=X+Dpatt=np.array([A]*2) #创建神经网络,21个输入节点,21个隐藏层节点,1个输出层节点n = BPNN(21, 21, 21) #训练神经网络n.train(patt) #测试神经网络d=n.test(patt) #查阅权重值n.weights() plt.plot(X,D)plt.plot(X,d)plt.show()
来源:小凌のBlog—Good Times|一个不咋地的博客
[1] 韩力群,人工神经网络理论及应用 [M]. 北京:机械工业出版社,2016.
来源地址:https://blog.csdn.net/Linyun2tt/article/details/121572933
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341