黄仁勋:英伟达 T4 CLOUD GPU只是加速计算的开始
扫描二维码
随时随地手机看文章
日前,在苏州举行的英伟达GPU技术大会(GTC China 2018)上,英伟达CEO黄仁勋介绍了两个多月前推出的全新NVIDIA T4 CLOUD GPU加速超大规模集群。
黄仁勋表示,T4 GPU只是一个开始。基于 Turing Tensor Core GPU的T4是全新的适用于超大规模集群的GPU,支持多精度计算。
与P4不同,T4在训练和推理方面都很出色,FP32,FP16TC,INT8TC,INT4TC可以混合匹配,以实现最高的性能和精度,理论性能从65 TFLOPS到230 TOPS。而且T4还拥有着70W的适用于超大规模集群的理想功耗。
黄仁勋还介绍了一款新的开源软件——TRT,支持单个GPU上运行多种模型。其推理服务器是容器化的,可以再Kubernetes上运行。TRT5这推理优化工具,支持Tensor Core和丰富的模型类型,例如CNN、RNN、MLP和许多其他模型。
黄仁勋表示目前T4已经达到了英伟达所有服务器GPU的最快采用率,超过50款服务器设计正在进行中,且每一个重要的OEM都正将T4服务器推向市场。
另外他还宣布H3C、华为、浪潮及其商用机器、联想、QCT和曙光都正在制造T4服务器,而百度云,科大讯飞,京东云和腾讯云将在云端提供T4。