AI效率260倍CPU:阿里双11大规模部署NVIDIA GPU
扫描二维码
随时随地手机看文章
一年一度的双11、双12购物狂欢都已经过去,而在苏州举办的GTC CHINA 2019大会上,NVIDIA和阿里巴巴共同透露了一个小“秘密”—;—;原来,双11 2684亿元创纪录成交额的背后,离不开NVIDIA GPU的大规模部署。
阿里巴巴异构计算总监徐凌杰表示,每天有超过1亿购物者在阿里网站上浏览数十亿种商品,在购物高峰日,阿里的系统每秒需要处理数十万个查询,而能够保证了这一切都能正常运行,正是AI 的功劳。
阿里引入了NVIDIA加速计算平台,大规模部署先进的AI技术,包括Tesla T4 GPU、cuBLAS运算库、自定义混合精度、推理加速软件等,通过其直观的搜索功能和可靠的推荐,能够支持比过去复杂6倍的模型,从而使点击率提高10%。
据悉,相比于CPU,Tesla T4将最大模型的吞吐量提高了100倍,能够为阿里广泛、深入的推荐模型提供加速,每秒可处理780个查询,而基于CPU的推理每秒只能处理3个,效率差了足足260倍。
对电商来说,推荐系统是至关重要的应用程序,可以向用户展示与其喜好相匹配的商品,从而提高点击率,而点击率的每一次小幅提高,都会直接影响用户的体验和商家的营收。使用能够实时大规模运行的先进推荐系统模型使点击率提高10%,目前这只能通过GPU实现。
据介绍,阿里使用NVIDIA GPU支持资源分配、模型量化和图变换三项优化策略,从而提高吞吐量和响应性,还部署NVIDIA GPU为各类系统提速,包括自动广告横幅生成、广告推荐、帮助识别假冒产品的图像处理、语言翻译、语音识别等系统。
除了阿里云,百度、字节跳动、滴滴、快手、美团点评、平安科技、搜狗、腾讯、小米等中国科技巨头的云服务也都部署着NVIDIA GPU。