面对数据孤岛和隐私问题,人工智能迎来最好时代？

时间：2019-09-02 08:40:20

关键字： AI 人工智能机器人

手机看文章

扫描二维码
随时随地手机看文章

[导读]站在今天回看，2017年或许是中国人工智能发展的一个重要节点。2017年，“人工智能”首次被写入全国两会政府工作报告，国务院总理李克强表示，要全面实施战略性新兴产业发展规划，加快新材料、人工智能、集成电路、生物制药、第五代移动通信等技术研发和转化。人工智能也为全国人大代表、全国政协委员们所热议。

站在今天回看，2017年或许是中国人工智能发展的一个重要节点。2017年，“人工智能”首次被写入全国两会政府工作报告，国务院总理李克强表示，要全面实施战略性新兴产业发展规划，加快新材料、人工智能、集成电路、生物制药、第五代移动通信等技术研发和转化。人工智能也为全国人大代表、全国政协委员们所热议。

所以，不免有人会问，当下我们是否已经迎来了人工智能最好的时代?希望未来中国的AI同仁能够更加注重基础研究，一起努力，真正驱动核心、深度、产业化的AI发展与落地。

好时代的挑战

与此同时，2017年乌镇围棋峰会上，AlphaGo以3：0的总比分战胜排名世界第一的世界围棋冠军柯洁，引发全民关注。“人工智能是否已全面超越人类”，“人工智能会不会取代人类”等问题也成为热点话题。

也是从那一年开始，人工智能风起云涌。一夜之间，仿佛所有的公司都变成了人工智能公司。资本、人才向人工智能领域快速涌入。“人工智能”成为科技界、学界、企业界最热门、最受追捧的词汇之一。各大互联网公司都大力加码推进人工智能研发。腾讯创始人马化腾也曾公开表示，如果只能投资一个领域，从他自身所处行业出发，他最关注的是和信息技术相关的AI产业。在国际上，科技巨头Google、IBM等对人工智能的研究已逾十年，近几年部分研究成果已经进入商业应用。

从这些维度来看，人工智能可谓已经迎来一个非常好的时代，但是热闹背后也存在着问题。比如这股热潮更多是产业界、投资界推动的，而学界和基础研究领域事实上并没有革命性变革，人才缺口问题也没有真正解决。

同时，AI在实际应用与落地中还面临着非常多的挑战，尤其是数据问题。AI研究需要的各类数据分散在不同企业中，人们口中常说的理想状况的“大数据”并不存在，实际状况是存在着大量的“小数据”和“数据孤岛”;此外数据的安全、隐私、合规等问题一直存在，欧盟在2018年正式实施了史上最严的数据保护条例——《通用数据保护条例》(GDPR)，而在2019年1月21日，谷歌公司就成为依据此法遭高额处罚的首家美国科技公司，被罚款5000万欧元……这些问题又让AI落地和发展看起来没那么美好。

深度赋能行业

2019年，李克强总理第三次在政府工作报告中谈到人工智能。值得注意的是，今年总理在报告中特别提出，要打造工业互联网平台，拓展“智能+”，为制造业转型升级赋能。

目前，人工智能的创新成果在各领域已有落地应用，推动了各行各业的技术进步、效率提升和商业模式变革。其中，金融行业是最被看好的AI应用领域之一，AI+金融是“智能+”的重中之重。

一方面，金融行业的信息化建设起步较早，且行业内极其重视数据的标准化和规范化采集，因而拥有大量累积数据，这些数据为人工智能的应用提供了坚实的基础;另一方面，以银行、保险、证券公司为例，金融业的主要业务都是基于大规模数据展开的，大量繁琐的数据处理工作，急需自动化和智能化的变革来解放人力;此外，金融普惠化和场景化的创新，也需要新的技术手段来提供支持，而人工智能与金融的结合，无疑为金融创新提供了更多的可能。

笔者以微众银行在AI+金融领域的实践为例，展开介绍。从需求出发，回归业务价值是自研AI的核心。微众银行是服务小微企业和普罗大众的互联网银行，其中最难的在于因数量分散而庞大、缺乏抵押物、担保体系不健全等原因造成的服务成本高。

微众银行AI团队将“AI+服务”应用于实际业务环节。比如基于“自然语言处理引擎”、“语音引擎”、“视觉引擎”三大引擎创建三大应用系统——“智能核身系统”、“智能客服系统”、“智能质检系统”，覆盖了业务咨询、身份核验、资料审核、操作放款等业务全流程。目前，通过这一套AI机器人组合拳，我们让客户从咨询到申请到借款全部在线完成，无需线下开户、无需纸质资料，最大化解决小微企业贷款难流程慢的难题，助力企业创新发展。

国家资管新规的推出、中国市场纳入MSCI指数，都对中国的资产管理行业带来深远影响。微众银行也在“AI+资管”领域发力，目前在研发基于以卫星遥感影像数据、无人机影像数据、移动位置数据和舆情文本信息等为代表的另类数据(AlternativeData)，通过人工智能技术打造AI驱动的资产管理平台，不但可以实时监测宏观经济，还可以对上市和发债公司、不同行业的趋势进行预测，构建AI+AlternativeData驱动的ESG(环境、社会和公司治理)指数，从而为资管公司、基金公司、评级公司等领域提供投资决策。

面对数据孤岛和隐私问题，AI何去何从

上文提到，数据的复杂性、孤立性和隐私安全等问题，是困扰和制约AI包括金融行业在内深化发展和应用落地的关键因素。如何解决这些数据难题，打破数据孤岛，建立真正的“大数据”，同时更好地保护数据隐私和安全，成了当下AI发展必须解决的问题。

笔者认为，面对这些难题，我们可以拥有一种新思路——联邦学习(FederatedLearning)，其目的是保护用户隐私和数据安全。联邦学习，顾名思义，就是搭建一个虚拟的“联邦国家”，把大大小小的“数据孤岛”联合统一进来。他们就像这个“联邦国家”里的一个州，既保持一定的独立自主(比如商业机密、用户隐私)，又能在数据不共享出去的情况下，共同建模，提升AI模型效果。

本质上，它是一种分布式加密机器学习技术，参与各方可以在不披露底层数据的前提下共建模型。这也是一种共赢的机器学习方式，它打破了山头林立的数据次元壁，盘活了大大小小的“数据孤岛”，连成一片共赢的AI大陆。

在金融领域，联邦学习能够用以分析潜在的欺诈行为;在保险定价领域，能够以更多维度精准分析用户的属性。对于企业而言，应用联邦学习能够更有效地节省成本，同时也能够更精准地去做用户的分级。另外对于一些数据非常敏感的场景，比如说医疗领域，不同医院之间也能够通过联邦学习技术去共享敏感的医疗数据。

未来AI新一代的机器学习算法框架，应该以保护隐私、安全合规为出发点，进行合理的解释性，用透明的推理机制来保障人工智能的健康发展。而联邦学习的发展与实践，为业界提供了新的思路。当然，AI生态的建设与大数据的构建还需要不同的企业、学者、研究机构联合起来，共享技术、分享数据、团结力量，共同解决数据孤岛和用户隐私问题。

AI未来：基础研究仍需持续努力

那么，中国的AI目前发展情况到底如何，未来的前景又怎样?科技部原副部长马颂德等多位专家学者都曾表示，中国在AI方面的应用会是全世界规模最大的，前景非常好，但在基础研究方面仍需持续努力。

笔者认为，这几年，中国的AI版图上，一个一个“点”都起来了，但是还没能连成“面”。换句话说，能够打通产业链的、深度的AI应用生态还没有建立，在系统层面和基础设施建设上还有所欠缺。

目前，业界对AI的理解和运用更多停留于单功能的产品层面，比如一个企业在某些流程环节引入了AI的辅助，例如引入人机交互、人脸识别，但这样的企业还不能说是人工智能企业。整个业界对于AI的理解应该更深一些，让AI驱动行业核心决策系统的优化，把AI的优势和革命性发挥到最大。

人工智能(ArtificialIntelligence，AI)自诞生以来，已经发展了60多年。近年来，AI在全球范围内都成为学界、业界追逐的热点，创业公司风起云涌，巨额投资不断涌现，科技巨头也不断加码，科研、资本和人才向AI靠拢的趋势明显。