小规模任务的神经网络应用

[导读]在过去10-15年中,人工神经网络领域的发展迅速。典型的应用是图像处理、声音等领域的高维数据.然而,在机器学习中,系统输入的数据量很小的任务很少:例如,异常事件建模、处理人工收集的分析数据、分析低频传感器的信号等。在这种情况下,一个重要阶段是对系统训练有素的特点("特点")进行认真的工作,特别是从现有的基本特点中产生新的特点,这将能够提高设计系统的性能质量。手动方法通常用于这种生成,但是一个好的选择是使用神经网络,它不仅能够学习基本的数学运算,而且能够识别输入数据中极其复杂的模式。

在过去10-15年中,人工神经网络领域的发展迅速。典型的应用是图像处理、声音等领域的高维数据.然而,在机器学习中,系统输入的数据量很小的任务很少:例如,异常事件建模、处理人工收集的分析数据、分析低频传感器的信号等。在这种情况下,一个重要阶段是对系统训练有素的特点("特点")进行认真的工作,特别是从现有的基本特点中产生新的特点,这将能够提高设计系统的性能质量。手动方法通常用于这种生成,但是一个好的选择是使用神经网络,它不仅能够学习基本的数学运算,而且能够识别输入数据中极其复杂的模式。

本文介绍了利用多层神经网络生成小维度数据背景下的附加特征的经验,其中基本特征的数量从十几个到二十个不等。两个数据集用于培训模型:真实数据集(记录器的数据)和合成数据集(生成数据),用于培训神经网络,以便随后产生额外的特征。

任务和数据说明

机器学习系统设计的基本任务是预测工业电气装置故障,这是由于线圈之间非临界微故障的累积。故障在性质上是零星的,是由于当其他设备打开或关闭时,出现高压载波和脉冲噪声引起的。

为了研究这一因素,将记录器连接到电路的测试段;它在每个时间点的线圈的两个控制点以50千赫兹的频率记录电位。随后以半自动方式处理了记录员提供的资料,结果获得了一个培训样本,其中说明了在一次设备换班(8小时)操作期间登记的微型故障的统计数字。

对问题的初步分析表明,由于系统的不对称性,不同极性的故障以不同的方式影响系统的可靠性,而且它们之间有相当大的补偿。因此,选择以下标准作为目标变量:如果平衡(即:,在1-2型和2-1型转换期间注册的微故障数量之间的差异超过预设阈值T,那么分类器应该在相反情况下生成1,在0。对于第一阶段的研究,为阈值T选择了一个零值,因为这提供了一个很好的类平衡。

下面您将从下表中列出的收集数据集中找到一些功能。

除了两个基本的目标特征(从记录器处理的数据)之外,还计算了其他特征----根据经验规则和积累的经验作出的专家估计。表中仅包括那些通过了初步变异测试的特征。

野外的描述

u1线圈1号试验点的绝对电位的平均值,平均值超过一个换档(8小时)。

u2对2号线圈也一样。

埃普_根据经验规则,专家评估某一转移的微观细目总数("1-2"类和"2-1"类)。

埃普_B总余额也是如此(事件数"1-2"减去"2-1")。

exp_pb1专家概率估计,微观收支平衡将超过t阈值.

exp_pb2同样的,平衡。

埃克斯_pb0同样,对于平衡=t(对于某些类型的装置,这种情况很可能发生)。

y目标变量:

· 1,如果"1-2"类和"2-1"类事件之间的总平衡超过t阈值。