数据如何助力人工智能的到来
扫描二维码
随时随地手机看文章
国家层面来看,2015年至2019年,人工智能行业政策也在不断迭代更新。从最初的“智能制造”到“加速AI技术研发和转化”再到“深化大数据、人工智能等研发应用”,标示着国内人工智能正在进入全新的发展阶段,AI应用时代的大幕已然开启。
未来人工智能势不可挡是共同认知。花式炫“技”却无法支持当前实际应用落地的人工智能企业将寸步难行也是共识。
人工智能的关键要素包括算法、算力、数据。如华为、阿里等都在积极布局智能计算,芯片代表算力,智能框架代表算法,并相继投入到智慧城市、自动驾驶、新零售等众多领域。超强算力,高效算法成为巨头们必备的实力tag,再加上目前人工智能企业多半还在靠算法盈利,其重要性可想而知。
相比之下,数据作为人工智能的基础原料,在这个组合里虽然很必要却低调很多。
海量数据到AI数据的“距离”
人工智能多样化应用正在带动数据采集标注产业的发展,从前的众包数据服务模式和通用数据集无法满足AI企业的场景化需求,我们需要重新审视从海量数据到我们真正想要的AI数据究竟隔了多远。
AI企业追求速度与激情。比如,一般AI产品在发布前一个月就需要获取标注好的精准数据进行训练,数据标注前还需要先完成数据的采集。这对AI数据的质量和时效性要求很高。
举个栗子,假如你要填湖盖房子有三种方式。第一种自己召集人马买装备找石子,第二种雇多人每天往湖里扔石子,第三种是直接找卖石子的用他家的挖掘机快速填平。
Testin云测CTO陈冠诚对AI数据的描述很形象直观,AI应用落地本身是基于众多场景的。如果把AI应用看作一个个学生,他们可能有不同的性格、脾气、擅长领域,如果老师(算法工程师)想教好这些学生,需要多样化的优质数据“教材”来适应各种专长、领域教学的需求,把他们打造成更好的 AI 应用。
从自动驾驶到聊天机器人再到医学诊断和成像,AI应用的成功落地与企业效率、用户体验和产品质量息息相关,其背后能够起到有效支撑作用的优质AI数据才代表了真正的数据价值。随着人工智能产业落地的发展加速,AI应用对优质数据的需求越来越强烈。定制化和场景化的优质数据正在为人工智能应用落地带来更多的可能性。
基于场景化应用高效提供优质数据,保证数据安全,在我看来,这是TesTIn云测旗下的云测数据作为唯一一家数据标注服务商与第四范式等多家AI企业同时登上ToB行业影响力·产品价值榜的原因,这也表明了AI数据的重要性日渐突出。
AI数据服务领域的头部玩家云测数据通过在华北、华东、华南自建数据场景实验室和数据标注基地,为智能驾驶、智能家居、智慧城市、智慧金融、新零售等领域提供定制化的数据标注、数据采集服务,支持文本、语音、图像、视频等各类型数据的处理。其目前拥有行业内最大规模的专业数据服务全职人员,用来构建整体 AI 数据的生态。
除了这些硬实力之外,云测数据还有自研数据标注系统、数据采集系统,并构建了完善的数据生产流程等,通过专业的项目经理来把控每一个AI数据的精准,以保证数据质量的先进性。
在数据安全方面,云测数据始终主张:
第一,不滥用数据,数据交付后清毁数据不留底,绝不二次使用;第二,不侵犯隐私,与所有数据采集的用户都签订数据授权协议,确保AI企业用于训练的数据合法合规;第三,建立了相关的数据保障机制,如从防火墙的设置、内部信息系统的管护乃至标准化的流程作业体系等。
现在的人工智能,一定不是我们理想中的样子,我们想要的是BB-8、贾维斯还有莫斯,然而行业中我们接触更多的是引导型机器人、X脸识别、语音助手等等,这是我们与未来的距离。
在这段路程中,会有更多的AI企业为了提升自身的竞争力,追求最新技术,优先创新落地应用,而AI数据服务专业领域的挑战也会随之增多,我们期待云测数据能够提供出更多的高质量数据教材,推动人工智能应用时代加速到来。