原创

机器学习为何重要?机器学习落地时存在哪些挑战?

时间：2022-12-01 10:20:01

关键字：机器学习人工智能计算机视觉

手机看文章

扫描二维码
随时随地手机看文章

[导读]机器学习将是下述内容的主要介绍对象，通过这篇文章，小编希望大家可以对机器学习的相关情况以及信息有所认识和了解，详细内容如下。

机器学习将是下述内容的主要介绍对象，通过这篇文章，小编希望大家可以对机器学习的相关情况以及信息有所认识和了解，详细内容如下。

一、机器学习为何重要

人工智能将比任何其他创新更有能力塑造我们的未来，任何不了解它的人很快就会发现自己被抛在后面。

在经过多个人工智能冬天和“虚假繁荣”之后，数据存储和计算机处理能力的快速发展极大地改变了游戏规则。

机器学习已经对计算机视觉(机器识别图像或视频中对象的能力)做出了巨大改进。例如，您收集了几十万甚至几百万张图片，需要分别给它们贴上标签，比如要给有猫的图片贴上标签，然后，该算法试图建立一个模型，可以准确无误地给每一张有猫的图片贴上标签。一旦精度足够高，机器就能“了解”猫的样子。

为了在收集数据时立即进行分析，以准确识别先前已知和先前从未见过的新模式，还必须使用能够生成和聚合这些大数据的机器来了解每个患者的正常行为，并跟踪、发现和标记任何可能表明严重健康问题的异常内容。

物联网的实现依赖于能够获得隐藏在广阔且不断增长的数据海洋中的洞察力。由于目前的方法不能扩展到物联网的规模，因此，实现物联网承诺的未来依赖于机器学习来发现模式、相关性和异常，而这些模式、相关性和异常有可能会改善我们日常生活的所有方面。

机器学习是我们走向人工智能之旅的核心，与此同时，它将改变每个行业，并对我们的日常生活产生巨大影响。

二、机器学习落地时存在哪些挑战

在这部分，我们主要来了解一下当机器学习落地时，存在哪些挑战。

在实际业务落地过程中，大部分大型云平台提供商均已提供机器学习算力等资源服务，同时支持多种机器学习框架等以提供开放灵活的部署环境。但是，机器学习模型所需的数据往往并非从云平台中产生，而是从传感器、手机、网关等边缘设备中产生。数据从边侧产生，而云端需从边侧采集数据以训练和不断完善机器学习模型。

在实际落地时，当前机器学习需面对以下问题：

1、海量设备数据导致延迟和成本问题

假设即使有100 Mbps的专网连接，将10TB的数据运送到云端也需要10天。面对大量边缘连接设备每天生成数百兆字节甚至TB数据，带来的延迟和成本对客户和服务提供方来说往往是难以承受的;

2、数据压缩导致的延迟和精度问题

正因迁移所有数据通常不切实际，往往需要对数据进行“压缩”(如特征工程、难例识别等)并传输到云端，而数据压缩过程容易引入新的延迟。压缩数据不一定能完全代表完整数据集信息，容易导致精度损失。

3、边侧数据隐私和计算实时性问题

边侧数据与资源等具备地理分布性。隐私和网络瓶颈导致数据集天然分割, 传统集中式机器学习在边缘情况下性能将显著下降;单个边侧资源受限且异构(算力、供电、场地等均受限)，相对云上资源建设与维护成本更高。

上述问题的本质来源是数据在边缘产生，而算力却在云端更为充足。也就是说，机器学习服务将边缘产生的数据转换为知识的过程中，一方面需要在边缘快速响应并处理本地产生的数据，另一方面需要云上算力与开发环境的支持。随着边缘设备数量指数级增长以及设备性能的提升，边云协同机器学习应运而生，以期打通机器学习的最后一公里。

最后，小编诚心感谢大家的阅读。你们的每一次阅读，对小编来说都是莫大的鼓励和鼓舞。希望大家对机器学习已经具备了初步的认识，最后的最后，祝大家有个精彩的一天。