杨强谈AI发展遇到的大数据困境以及解决办法
扫描二维码
随时随地手机看文章
近日,2018中国人工智能大会在深圳举行。会上,国际人工智能联合会(IJCAI)主席、AAAI/ACM/IEEE Fellow、香港科技大学教授杨强发表了题为《AI面临的挑战和迁移学习所带来的机遇》的演讲,谈到了AI发展遇到的大数据的困境以及解决办法。
杨强表示,我们正处于大数据驱动的AI时代,人们将工作数字化,然后通过人工智能自动化,从而提高效率。但是,现在我们越来越多的遇到了数据的困扰,很多企业的数据都是孤岛没有办法打通,同时受制于欧盟GDPR等法案的制约,增大了这种困境。
杨强教授具体讲解了大数据面临的两大困境。
一大困境是面临隐私、安全和监督。以欧盟的GDPR为例,GDPR明文规定了用户的“被遗忘权”,对使用自动化模型决策全面禁止,这对机器学习有重大影响,因为让用户同意使用并不容易,使用自主决策合法要满足三点,包括合同处理的必要性、其他法律另行授权,数据主体明确同意。
在数据隐私的监管的大趋势下,解决这一问题并不容易。杨强教授提出了联邦迁移学习思路,这种思路希望建立起机器学习的企业生态,各个企业自有数据不出本地,模型效果不变,在不违规的情况下建立一个虚拟模型。杨强教授表示,利用联邦迁移学习加密技术,协同建模,学习模型过程不交换用户数,不侵犯隐私。
另一大困境是小数据的困境,杨强教授提出了迁移学习,并列举了跨领域舆情分析的案例。
杨强最后表示,面对数据发展的困扰,希望利用联邦迁移学习技术建立联合建模解决方案,克服数据障碍。在法律规范的基础上,各个参与方理解一致的共识机制,保障安全合规性。比如在金融领域,可以建立金融业联邦迁移学习联盟。