人工智能之机器学习记忆神经网络LSTM算法解析

时间：2020-07-03 12:45:01

关键字： rnn 人工智能机器学习神经网络

手机看文章

扫描二维码
随时随地手机看文章

[导读] 前言：人工智能之机器学习主要有三大类：1）分类；2）回归；3）聚类。今天我们重点探讨一下长短时记忆神经网络（LSTM）算法。我们知道，RNN是一类功能强大的人工神经网络算法，RNN一个

前言：人工智能之机器学习主要有三大类：1）分类；2）回归；3）聚类。今天我们重点探讨一下长短时记忆神经网络（LSTM）算法。

我们知道，RNN是一类功能强大的人工神经网络算法，RNN一个重要的优点在于，其能够在输入和输出序列之间的映射过程中利用上下文相关信息。但是RNN存在着梯度消失或梯度爆炸等问题。因此，为了解决上述问题，长短时记忆神经网络（LSTM）诞生了。

长短期记忆神经网络LSTM是一种特殊的RNN，能够学习长期依赖关系。由Hochreiter和Schmidhuber （1997）提出，在后期工作中又由许多人进行了调整和普及（除了原始作者之外，许多人为现代LSTM做出了贡献，不完全统计：Felix Gers（目前在谷歌的DeepMind任职）， Fred Cummins， Santiago Fernandez， Felix Gers（发明了LSTM遗忘门），JusTIn Bayer（自动演化）， Daan Wierstra， Julian Togelius， FausTIan Gomez， Matteo Gagliolo 和 Alex Graves）。LSTM在大量问题上效果异常出色，现在正在广泛使用。

LTSM概念：

长短时记忆神经网络LSTM（Long Short–Term Memory）是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。

与其说长短时记忆神经网络LSTM是一种循环神经网络，倒不如说是一个加强版的组件被放在了循环神经网络中。具体地说，就是把循环神经网络中隐含层的小圆圈换成长短时记忆的模块，如下图所示。

LTSM本质：

LSTM引入自循环的巧妙构思，以产生梯度长时间持续流动的路径是初始LSTM模型的核心贡献。其中一个关键扩展是使自循环的权重视上下文而定，而不是固定的。门控此自循环（由另一个隐藏单元控制）的权重，累积的时间尺度可以动态地改变。

LSTM循环网络除了外部的RNN循环外，还具有内部的LSTM细胞循环（自环）。

LSTM 通过刻意的设计来避免长期依赖问题。记住长期的信息在实践中是 LSTM 的默认行为，而非需要付出很大代价才能获得的能力。

LSTM原理：

LSTM区别于RNN的地方，主要就在于它在算法中加入了一个判断信息有用与否的“处理器”，这个处理器作用的结构被称为cell。

一个cell当中被放置了三扇门，分别叫做输入门、遗忘门和输出门。一个信息进入LSTM的网络当中，可以根据规则来判断是否有用。只有符合算法认证的信息才会留下，不符的信息则通过遗忘门被遗忘。

说起来无非就是一进二出的工作原理，却可以在反复运算下解决神经网络中长期存在的大问题。目前已经证明，LSTM是解决长序依赖问题的有效技术，并且这种技术的普适性非常高，导致带来的可能性变化非常多。各研究者根据LSTM纷纷提出了自己的变量版本，这就让LSTM可以处理千变万化的垂直问题。