AI产业逆势成长,为数据流程提供了一把火!
扫描二维码
随时随地手机看文章
在2022年新冠奥密疫情的影响下,各行各业都受到了影响, GDP增速、 PMI、金融贷款等数据继续下滑。
而与疫情有关的行业,也是为数不多的亮点,而 AI技术,也是其中的关键。例如药物开发中的辅助药物筛选、疫苗基因设计算法等,加快了疫苗与疫苗的开发;人脸识别、语音机器人、文字识别、智能流调等智能控制方案是疫情防控的核心;智能会议、智能辅助学习等工作学习情景越来越多;甚至,正在迅速发展的无人驾驶出租车、配送机器人、机器人餐厅等,都有望在未来成为一股重要的服务力量。
在未来,随着市场的需要、政策的不断推进,技术的不断成熟,中国的 AI数据服务将会有一个显著的加速。云测数据为人工智能提供了高质量、场景化的支持,帮助人工智能实现了极限的创新,实现了工业的落地。它的业务是围绕人工智能三要素中的一项(算法、计算能力和数据)进行的,我们把它叫做 DPS (DPS, DataProcess Service)。
DPS是一种以数据处理过程为核心的数据处理系统,利用数字技术从现实世界或者信息系统中获取数据,并根据应用需求对数据进行处理和输出。DPS所提供的服务主要包括 AI、大数据、互联网内容服务等。DPS的服务结构主要有数据收集与预处理、数据标注、内容审核、工具平台及辅助服务(例如业务训练)等。
从监督学习向非监督学习、强化学习的演进
目前来看,大部分的AI应用都是通过监督学习,利用一组已标注的训练数据,对分类器的参数进行调整,使其达到所要求的性能。但在现实生活中,监督学习不足以被称为“智能”。对照人类的学习过程,许多都是建立在与事物的交互中,通过人类自身的体会、领悟,得到对事物的理解,并将之应用于未来的生活中。而机器的局限就在于缺乏这些“常识”。
无监督学习领域近期的研究重点在于“生成对抗网络”(GANs),而强化学习的一个重要研究方向在于建立一个有效的、与真实世界存在交互的仿真模拟环境,不断训练,模拟采取各种动作、接受各种反馈,以此对模型进行训练。
从“堆数据”到研发低训练成本的算法
MIT Digital Lab的研究者联合韩国的相关机构在2020年发表了一项基于1058篇深度学习的论文和数据的研究。在分析了现有的深度学习论文成果后,研究人员提出了一个悲观的预言:深度学习会随着计算量的限制,在到达某个性能水平后停滞不前,因为在深度学习领域有这样一条规律:想提升 X 倍的性能,最少需要用 X^2倍的数据去训练模型,且这个过程要消耗X^4倍的计算量。即便是10倍性能提升和1万倍计算量的提升,这样失衡的比例关系也仅仅是理论上最优的。在现实中,提升10倍性能往往要搭上10亿倍的运算量。以今天地球资源的状况看,想把一些常用的模型错误率降低到人们满意的程度,代价高到人类不能承受。因此,在深度学习领域非常值得关注的是可大幅降低训练成本的新算法创新。
从数据到情报的演变,到底是怎样的一个转化路径呢?
以某市雾霾舆情分析管控为例,当舆情讨论点产生时,可视化技术会基于后台数据做串联,从传播轨迹、模式等方面进行分析,提取真实数据,管控问题数据。
由此可见,在场景应用中,无论是通过数据计算来监测问题,还是利用数据关联来分析问题,其实都是为了把真实世界的问题还原,用可视化建立起数据与决策之间的桥梁,最终要转化出来的,是情报层级的信息。
在大型活动安保中,技术怎样辐射到场景?
每一次大型活动,会针对活动级别和要保障的核心点,去进行相关数字模型和业务模型的匹配,再基于匹配结果将各类预警转化为信息进行决策和交互。
以上海进博会为例,活动开办一年前,就要通过人防、技防、物防的相关手段,把所有风险点过滤,随着时间的临近,制定不同的安保预案,再进行不同模型的设置和风险点的管控,直到最后一天保证活动的整体运行。