什么是大数据?工业大数据主要解决什么问题?
扫描二维码
随时随地手机看文章
本文中,小编将对大数据予以介绍,主要内容在于阐述工业大数据想要解决的问题。如果你想对大数据的详细情况有所认识,或者想要增进对大数据的了解程度,不妨请看以下内容哦。
一、什么是大数据
在了解工业大数据技术主要解决什么问题之前,我们先来看看什么是大数据。
大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
二、工业大数据主要解决的问题是什么?
在了解了什么是大数据后,我们再来看看工业大数据和互联网大数据之间由什么区别,以及工业大数据主要是为了解决什么问题。
工业大数据与Internet大数据之间的最大区别在于,工业大数据具有很强的用途,而Internet大数据更多地是相关的挖掘和更发散的分析。 此外,两者在数据特征和所面临的问题上也有所不同。 与互联网大数据不同,工业大数据的核心分析技术必须解决“ 3B”问题:
1、BelowSurface——隐匿性,即需要洞悉背后的意义
与互联网上的大数据相比,工业环境中大数据之间最重要的区别是数据特征的提取。工业大数据关注特征背后的物理意义以及特征之间相关性的机制逻辑,而互联网大数据趋向于仅依靠统计工具来挖掘属性之间的相关性。
2、Broken——碎片化,即需要避免断续、注重时效性
与互联网大数据量相比,工业大数据更加注重数据的完整性,即面向应用的需求具有尽可能全面的使用样本,以涵盖工业过程中各种变化的情况,并确保可以提取数据以反映对象的真实状态信息的全面性。因此,一方面,工业大数据需要克服后端分析方法中数据碎片化所带来的困难,并使用特征提取和其他手段将这些数据转换为有用的信息。 另一方面,它需要从数据采集的前端进行设计。在基于价值需求的数据标准开发中,在数据和信息流通的平台上构建了统一的数据环境。
3、BadQuality——低质性,即需要提高数据质量、满足低容错性
数据碎片缺陷来源的另一个方面也显示了对数据质量的担忧。也就是说,数据量不能保证数据的质量,这可能会导致数据可用性较低,因为低质量的数据可能会直接影响分析过程并使结果无法使用。
但是互联网大数据却不同,它只能挖掘和关联数据本身,而没有考虑数据本身的含义,也就是说,挖掘的结果就是结果。最典型的是,在对超市购物习惯进行数据挖掘之后,可以将啤酒架子放在尿布架子的另一侧,而不管它们之间的机制和逻辑关系如何。 换句话说,与互联网大数据相比,通常不需要具有精确的结果推送,工业大数据对预测和分析结果的容错率远低于互联网大数据。
在进行预测和决策时,互联网大数据仅考虑两个属性之间的相关性是否具有统计显着性。当样本量足够大时,可以忽略个体之间的噪音和差异。 预测结果的准确性将大大降低。
例如,当我觉得应该向用户A电影推荐70%的重要性时,即使用户不太喜欢这种电影,也不会造成太严重的后果。但是在工业环境中,如果仅通过统计意义给出分析结果,则即使是单个错误也可能导致严重的后果。
经由小编的介绍,不知道你对大数据是否充满了兴趣?如果你想对大数据有更多的了解,不妨尝试度娘更多信息或者在我们的网站里进行搜索哦。