使用人工智能技术应该考虑数据质量 而不是数量
扫描二维码
随时随地手机看文章
机器学习算法经常被描述为数据饥饿。但调研机构Gartner公司的Erick Brethenoux最近表示,对于某些人工智能用例来说,企业首席信息官在开始应用时应该考虑数据质量,而不是数量。
在最近的一个网络研讨会上,Brethenoux提出了一个新的研究方案,他断言:“企业的规模和数据量都不利于企业使用这些人工智能技术。”
这是他提供给开始采用人工智能技术的公司的一个建议。以下将详细介绍为什么Brethenoux强调某些用例中突出的数据质量而不是数量,以及为什么他认为从业务问题开始是至关重要的原因。他还向已经为人工智能做好准备的客户提出了五个问题。
清洁数据优于大量数据
Brethenoux在网络研讨会期间给出一个令人惊讶的提示:企业在决定是否使用人工智能技术时,数据量并不是一个很好的经验法则。他举了一个小型区域银行客户的例子,该客户使用人工智能不仅实现个性化贷款,而且还开始向小额贷款客户提供新服务。
他说,“他们拥有的数据量并不大。但是,这些数据的质量必须是无可挑剔的。”
Brethenoux重申了这一点。他说,“企业拥有的数据越多,通常就越能找到有趣的相关性,但没有必要通过拥有大量的数据才能找到有趣的东西。”如果需要,企业人工智能团队可以利用来自提供商的外部数据来弥补内部数据不足。
另一方面,低质量数据可能会触发疯狂的算法追逐。而加拿大的一家保险公司想要根据保险公司的工作地点来衡量保险公司的风险时,其分析产生了垃圾结果。根据Brethenoux的说法,事实证明,其距离数据分别以英里和公里为标记,使结果出现了偏差。
虽然数据质量很重要,但他表示,企业首席信息官不应该被迫去清理每一项数据,并推迟启动。
“企业最终要做的就是不断清理,而且从机器学习或预测分析的角度来看,很多数据可能对企业尝试做的事情没有帮助。”他说,“这就是企业坚持从一个用例开始的原因。”
专注于业务问题
为了引入人工智能技术,企业首席信息官应该从业务问题入手,努力寻求解决方案。重点是业务问题。“用例并不是一个好主意,而是一个商业案例。”Brethenoux说。
他建议首席信息官与企业进行沟通,找出问题的症结所在,然后将问题“范围缩小”为他们可以在几周内完成的事情。Brethenoux说,这就是首席信息官们如何弄清楚他们不知道什么,以及他们需要关注什么的方式。
这一建议部分来自于他的观察,即“以资产为中心的公司”,例如制造业或能源公司,在人工智能技术方面取得了比“以服务为中心的公司”(如营销公司)更多的成功。
“大多数以资产为中心的组织正在处理以工程为中心的文化,这些文化从用例开始,并返回解决问题所需的数据和技术。”他在网络研讨会上说。Brethenoux表示,在以服务为中心的公司中,这一过程经常发生逆转:数据专业人员在数据中找到趋势或相关性,然后寻找问题。
Brethenoux阐述了这一点,并补充说,以服务为中心的企业有时会因缺乏关注而受到影响,而将人工智能技术引入企业时可能会面临问题。
他说,“当企业开始处理更多的数据和问题时,解决问题的方法并不那么严谨。”
提出的五个问题
当客户告诉Brethenoux想要使用人工智能来解决问题时,他提出了五个问题,以确定人工智能是否是适当的行动方案,以及客户是否准备沿着人工智能路径前进。问题如下:
(1)业务用例是什么? Brethenoux表示,这个过程应该包括描述预期和期望的结果,以及确定如果引入人工智能技术将如何衡量业务价值。
(2)企业具有必要的技能吗?企业首席信息官可能不需要雇佣大批数据科学家。Brethenoux建议他们从评估内部技能开始,并考虑培训合格的数据工程师或主题专家。他还建议举办“黑客大会”来帮助发掘人才。“或者企业可以采取这些措施:聘请顾问,在短期内帮助企业走出困境,并推动这些努力。”他说。
(3)企业有必要的数据吗?企业可能不需要他们想象的那么多的数据,但他们需要数据,并且它应该是合理的。当Brethenoux要求一家大型保险公司想要拍摄事故的现场照片,并预测索赔的类型和费用时,他收到了一堆照片,该公司花费两个月的时间对这些图像进行数字化、整理和标记。“当企业解决其试图解决的用例时,需要确保拥有适当的数据。”他说。
(4)企业需要什么样的技术?业务问题将推动技术决策。 Brethenoux引用了几种成熟的人工智能技术——从概率推理(如机器学习被确定为最成熟的技术)到基于代理的编程(被认为是最不成熟的技术)。
(5)企业如何组织团队?一旦企业有了一些概念上的证据,就应该考虑这样的团队应该在哪里实施,团队应该向谁报告,以及如何支持团队来提高其技能和技术。