面对数据孤岛和隐私问题,人工智能迎来最好时代?
扫描二维码
随时随地手机看文章
站在今天回看,2017年或许是中国人工智能发展的一个重要节点。2017年,“人工智能”首次被写入全国两会政府工作报告,国务院总理李克强表示,要全面实施战略性新兴产业发展规划,加快新材料、人工智能、集成电路、生物制药、第五代移动通信等技术研发和转化。人工智能也为全国人大代表、全国政协委员们所热议。
所以,不免有人会问,当下我们是否已经迎来了人工智能最好的时代?希望未来中国的AI同仁能够更加注重基础研究,一起努力,真正驱动核心、深度、产业化的AI发展与落地。
好时代的挑战
与此同时,2017年乌镇围棋峰会上,AlphaGo以3:0的总比分战胜排名世界第一的世界围棋冠军柯洁,引发全民关注。“人工智能是否已全面超越人类”,“人工智能会不会取代人类”等问题也成为热点话题。
也是从那一年开始,人工智能风起云涌。一夜之间,仿佛所有的公司都变成了人工智能公司。资本、人才向人工智能领域快速涌入。“人工智能”成为科技界、学界、企业界最热门、最受追捧的词汇之一。各大互联网公司都大力加码推进人工智能研发。腾讯创始人马化腾也曾公开表示,如果只能投资一个领域,从他自身所处行业出发,他最关注的是和信息技术相关的AI产业。在国际上,科技巨头Google、IBM等对人工智能的研究已逾十年,近几年部分研究成果已经进入商业应用。
从这些维度来看,人工智能可谓已经迎来一个非常好的时代,但是热闹背后也存在着问题。比如这股热潮更多是产业界、投资界推动的,而学界和基础研究领域事实上并没有革命性变革,人才缺口问题也没有真正解决。
同时,AI在实际应用与落地中还面临着非常多的挑战,尤其是数据问题。AI研究需要的各类数据分散在不同企业中,人们口中常说的理想状况的“大数据”并不存在,实际状况是存在着大量的“小数据”和“数据孤岛”;此外数据的安全、隐私、合规等问题一直存在,欧盟在2018年正式实施了史上最严的数据保护条例——《通用数据保护条例》(GDPR),而在2019年1月21日,谷歌公司就成为依据此法遭高额处罚的首家美国科技公司,被罚款5000万欧元……这些问题又让AI落地和发展看起来没那么美好。
深度赋能行业
2019年,李克强总理第三次在政府工作报告中谈到人工智能。值得注意的是,今年总理在报告中特别提出,要打造工业互联网平台,拓展“智能+”,为制造业转型升级赋能。
目前,人工智能的创新成果在各领域已有落地应用,推动了各行各业的技术进步、效率提升和商业模式变革。其中,金融行业是最被看好的AI应用领域之一,AI+金融是“智能+”的重中之重。
一方面,金融行业的信息化建设起步较早,且行业内极其重视数据的标准化和规范化采集,因而拥有大量累积数据,这些数据为人工智能的应用提供了坚实的基础;另一方面,以银行、保险、证券公司为例,金融业的主要业务都是基于大规模数据展开的,大量繁琐的数据处理工作,急需自动化和智能化的变革来解放人力;此外,金融普惠化和场景化的创新,也需要新的技术手段来提供支持,而人工智能与金融的结合,无疑为金融创新提供了更多的可能。
笔者以微众银行在AI+金融领域的实践为例,展开介绍。从需求出发,回归业务价值是自研AI的核心。微众银行是服务小微企业和普罗大众的互联网银行,其中最难的在于因数量分散而庞大、缺乏抵押物、担保体系不健全等原因造成的服务成本高。
微众银行AI团队将“AI+服务”应用于实际业务环节。比如基于“自然语言处理引擎”、“语音引擎”、“视觉引擎”三大引擎创建三大应用系统——“智能核身系统”、“智能客服系统”、“智能质检系统”,覆盖了业务咨询、身份核验、资料审核、操作放款等业务全流程。目前,通过这一套AI机器人组合拳,我们让客户从咨询到申请到借款全部在线完成,无需线下开户、无需纸质资料,最大化解决小微企业贷款难流程慢的难题,助力企业创新发展。
国家资管新规的推出、中国市场纳入MSCI指数,都对中国的资产管理行业带来深远影响。微众银行也在“AI+资管”领域发力,目前在研发基于以卫星遥感影像数据、无人机影像数据、移动位置数据和舆情文本信息等为代表的另类数据(AlternativeData),通过人工智能技术打造AI驱动的资产管理平台,不但可以实时监测宏观经济,还可以对上市和发债公司、不同行业的趋势进行预测,构建AI+AlternativeData驱动的ESG(环境、社会和公司治理)指数,从而为资管公司、基金公司、评级公司等领域提供投资决策。
面对数据孤岛和隐私问题,AI何去何从
上文提到,数据的复杂性、孤立性和隐私安全等问题,是困扰和制约AI包括金融行业在内深化发展和应用落地的关键因素。如何解决这些数据难题,打破数据孤岛,建立真正的“大数据”,同时更好地保护数据隐私和安全,成了当下AI发展必须解决的问题。
笔者认为,面对这些难题,我们可以拥有一种新思路——联邦学习(FederatedLearning),其目的是保护用户隐私和数据安全。联邦学习,顾名思义,就是搭建一个虚拟的“联邦国家”,把大大小小的“数据孤岛”联合统一进来。他们就像这个“联邦国家”里的一个州,既保持一定的独立自主(比如商业机密、用户隐私),又能在数据不共享出去的情况下,共同建模,提升AI模型效果。
本质上,它是一种分布式加密机器学习技术,参与各方可以在不披露底层数据的前提下共建模型。这也是一种共赢的机器学习方式,它打破了山头林立的数据次元壁,盘活了大大小小的“数据孤岛”,连成一片共赢的AI大陆。
在金融领域,联邦学习能够用以分析潜在的欺诈行为;在保险定价领域,能够以更多维度精准分析用户的属性。对于企业而言,应用联邦学习能够更有效地节省成本,同时也能够更精准地去做用户的分级。另外对于一些数据非常敏感的场景,比如说医疗领域,不同医院之间也能够通过联邦学习技术去共享敏感的医疗数据。
未来AI新一代的机器学习算法框架,应该以保护隐私、安全合规为出发点,进行合理的解释性,用透明的推理机制来保障人工智能的健康发展。而联邦学习的发展与实践,为业界提供了新的思路。当然,AI生态的建设与大数据的构建还需要不同的企业、学者、研究机构联合起来,共享技术、分享数据、团结力量,共同解决数据孤岛和用户隐私问题。
AI未来:基础研究仍需持续努力
那么,中国的AI目前发展情况到底如何,未来的前景又怎样?科技部原副部长马颂德等多位专家学者都曾表示,中国在AI方面的应用会是全世界规模最大的,前景非常好,但在基础研究方面仍需持续努力。
笔者认为,这几年,中国的AI版图上,一个一个“点”都起来了,但是还没能连成“面”。换句话说,能够打通产业链的、深度的AI应用生态还没有建立,在系统层面和基础设施建设上还有所欠缺。
目前,业界对AI的理解和运用更多停留于单功能的产品层面,比如一个企业在某些流程环节引入了AI的辅助,例如引入人机交互、人脸识别,但这样的企业还不能说是人工智能企业。整个业界对于AI的理解应该更深一些,让AI驱动行业核心决策系统的优化,把AI的优势和革命性发挥到最大。
人工智能(ArtificialIntelligence,AI)自诞生以来,已经发展了60多年。近年来,AI在全球范围内都成为学界、业界追逐的热点,创业公司风起云涌,巨额投资不断涌现,科技巨头也不断加码,科研、资本和人才向AI靠拢的趋势明显。