互联网大数据如何更深层次的去理解
扫描二维码
随时随地手机看文章
随着大数据的快速发展,就像计算机和互联网一样,大数据很有可能是新一轮的技术革命。随之兴起的数据挖掘、机器学习和人工智能等相关技术,可能会改变数据世界里的很多算法和基础理论,实现科学技术上的突破。“大数据”给人的第一刺激是“大量数据”。确实如此,随着半导体工业、制造业的发达,世界上的工业设备、汽车、公路、管线、电表上都会有传感器,随时测量着有关位置、温度、湿度、运动、震动乃至空气中化学物质的变化,海量的数据就会产生。
权威机构—美国互联网数据中心指出,互联网上的数据每年增长50%,每两年翻一番,90%以上的数据是最近几年才产生的。早在1980年,未来学家阿尔文托夫勒便将“大数据”热情地赞颂为“第三次浪潮”,直到互联网大发展,这个词才因为海量数据的产生而成为流行词汇。
当下还处在大数据的初级阶段,和实践的结合还不够,很多概念都还只停留在表层,人们的看法也参差而缺乏深度。比如关于大数据的定义:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。这是显得最权威的认识了。
大数据有足够的技术深度,适合解决时代的问题,符合时代气质,可以引发巨大变革。但是,任何一种生产力,它都会被不同的眼光打量,用于满足不同需求,在不同的人那儿表现各异。我们不能满足于当下的观点,要用历史视角观看,结合人类需要解决的问题思考大数据。大数据成为这个时代的时髦词汇,很多人都宣称大数据,包括很多权威机构,其实是数据量稍微多一些,查询条件关联条件稍微复杂一些而已,根本还是以往的关系型数据库模式医学数据更是繁多,包含几乎所有生命特性,医院的检查工具会从专业的角度贡献数据,往往局限于疾病状态。更多数据来源已经开启,体联网和脑联网会立足于生活贡献数据,数据的种类大大扩展了,数据的量级更会亿万倍地增加。这是长期不间断的监测,海量数据中,某些隐含的规律就会出现。假设,白细胞计数以天为单位呈现周期性波动,和年龄、生活特性等相关,找到这些规律,就可定义何为正常何为异常,可探索保养身体的思路,发现生命滑向危险状态的苗头。