当前位置:首页 > 智能硬件 > 人工智能AI
[导读] 一、RNN 递归神经网络(RNN)被提出用来处理80年代的输入序列时间信息。1993年,神经历史压缩器系统解决了“非常深度学习”任务,该任务需要及时展开RNN中的1000多个后续层。如图

一、RNN

递归神经网络(RNN)被提出用来处理80年代的输入序列时间信息。1993年,神经历史压缩器系统解决了“非常深度学习”任务,该任务需要及时展开RNN中的1000多个后续层。如图1所示,在传统的建模活动(例如前馈神经网络)中,我们显然会看到固定输入大小到固定输出大小的固定网络。在前馈神经网络的包围下,我们得到图1.b以揭示RNN的可区分性。

RNN能将输入动态更改为包含多个输入向量,每时间段一个,并且每个向量可以有很多列。

对于图2所示的RNN网络,假设输入序列为{x1,x2,…xt},则隐藏层节点的相应时间向量为H={ h1,h2,…ht },并且输出节点分别对应于Y={ y1,y2…yt },其中xi ,hi,yi(i=1,2…t)是神经网络相应层大的节点向量。

图1 前馈神经网络

图2 递归神经网络(RNN)

在普通的前馈神经网络中,前向传播公式如下:

在前馈神经网络的RNN中,前向传播公式如下:

其中Wxh制是输入层和隐藏才能够之间的权重矩阵,bh是隐藏层的偏差矢量。Why是隐藏层和输出层之间的权重矩阵,by是输出层的偏差矢量。Whh图是隐藏层上一时刻与下一时刻之间的权重矩阵。σ是sigmoid()的激活功能。

由于RNN迭代复用隐藏层,导致RNN可以有效的保留序列的时间信息。如图1所示,一般的神经网络结构是从输入层到隐藏层再到输出层,并且每次的输出都与之前和之后的输入无关。如图2所示,RNN将在隐藏层中循环多路复用,因此它可以有效的保存序列的时间信息,并且每次输出的结果都受到所有先前输入的影响。

图3递归神经网络的发展

图4 消失梯度问题

在图3中,扩展了RNN的结构以解释RNN的隐藏层复用。除第一层外,RNN还将前一次隐藏层的结果与最新的输入一起用作当前时间的输入,从而影响后续的结果,同时是达到了保存序列时间信息的目的。

但是众所周知,RNN存在“消失梯度问题”。如图4所示,当梯度变得太大或者太小并且难以对输入数据集的结构中的长期依赖关系(10个时间步或更多)进行建模是就会出现这个问题。

二、 LSTM

为了克服RNN的“消失梯度问题”,Hochreiter和Schmidhuber于1997年提出了具有RNN架构的长短期记忆(LSTM)网络。

如图5所示,LSTM和其它神经网络模型之间的区别在于其独特的LSTM单元。当它与LSTM结合使用时,在不同时间阶段传播的LSTM的ht参数传输内部存储器状态Ct。尽管LSTM单元有很多改进的结构,但是它们都没有将模型的预测准确性进一步提升。 在图5中,从左到右的四个部分是忘记门,输入门,单元门和输出门。

图5 长短期记忆网络单元

每个门对应的输入时ht-1,xt和它们对应的权重矩阵。 忘记门负责选择性地忘记存储在原始单元中的先前状态,以避免“消失梯度问题”。 输入门和单元门的结果相乘并加到先前的单元Ct-1上。最后,为了计算当前的输出ht ,我们使用了当前的单元门结果与出出门结果。使用到的相关公式如下:

Ft、It、Ct和Ot分别是四个门各自的输出结果。W是从相应的输入到对应的门。例如,Wxy是相应的输入层到斜门的权重,并且Whi从上一刻就隐藏了起来。从层到输入门的权重bf,bi,bc和bo是四个门的偏置矢量,⊙是两个矢量或矩阵点乘法。σ和tanh()是常用的激活函数。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭