世界最大AI芯片升级,采用7nm工艺
扫描二维码
随时随地手机看文章
在日前举办的Hotchips 32会议上,美国AI初创企业CerebrasSystems旗下的明星产品WES(Wafer Scale Engine)芯片公布了第二代芯片的相关信息。据悉,WES 2代芯片核心数翻倍到了85万个,晶体管数量翻倍到2.6万亿个,最关键的是,将从16nm工艺进入7nm工艺。
造出世界最大芯片,Cerebras Systems是家什么样的公司?
作为一家在2016年才创立的公司,CerebrasSystems的资历并不算长,但是却经历了三轮融资,分别是2016年5月份的2700万美元的A轮融资,2017年1月2500万美元的B轮融资,随后不到一年时间里,CerebrasSystems再次融资6000万美元,彼时估值达到8.6亿美元。
恰好人工智能产业也是在那个时候开始盛行,CerebrasSystems也因此被许多人看好。而这家公司造AI芯片就是奉行一个路子:“简单,粗暴”。
在去年CerebrasSystems推出巨型芯片WES的时候,就引起了业界轰动。在关于WSE介绍的白皮书中,有这么一句话——“通过加速人工智能计算,WSE清除了阻碍人工智能进步的最大路障——时间。将训练时间从几个月缩减为几分钟,从几周减少到基瞄。让深度学习实践者更快的验证自己的假设,从而不用去担心一些体系机构导致无法测试或者太大风险。WSE降低了好奇心的成本,加速了人工智能新思想和新技术的到来。”
在WES这颗采用台积电16nm工艺,面积46000平方毫米,拥有1.2 万亿个晶体管40万个核心,片上18G内存的芯片上,性能之强大让当时的芯片“大块头”甘拜下风。
比如英伟达的GV100芯片也不过用上了211亿晶体管,核心面积815mm2,所以WSE芯片晶体管数量是最强GPU芯片的60倍,面积则是它的56倍多。WSE与当时的CPU芯片相比同样震撼,AMD的64核EPYC二代处理器才320亿晶体管,封装总面积也不过4410平方毫米,光是核心面积WSE就是EPYC二代处理器的10倍有余。
从性能上来看,WES芯片带宽超过100Pb/s,一般的计算芯片以Tb/s级别的单位都难以跟起比较。总之,WES芯片的出现堪称芯片工艺史上的一大“奇迹”。不出预料的话,WES 2代芯片性能跟价格都会大幅提升。
虽然CerebrasSystems造出芯片的芯片性能确实强大,但是投入的成本也十分高昂,不是哪个公司都有这个实力“烧钱”玩的。据悉一块WES芯片的价格约在200万美元(约合人民币1384万元)左右,在当时也只有美国国家科学基金会(NSF)为了打造超算CS-1而购买了WES芯片。
性能为先,芯片是不是越大就越好?
目前,象CerebrasSystems一样专门走巨型芯片路线的企业少之又少,这可能除了是他们的企业特色以外,也涉及大整个芯片产业对于芯片大小的共同认知。
之前就有人提出过这么一个问题,现在厂家都专注与缩小晶体管尺寸,目的就是为了在芯片内部打造更大规模的集成电路,那为什么不通过增大芯片的面积来提高性能?
首先从构造上来说,如果是将芯片面积越大来保证刻画更多的电路,实际上不会减少电路布线的复杂程度,反而还更难。大芯片也也意味着片内器件之间的传输要走更长的互连线进行传输,造成信号传输延迟,可能有人会觉得都是在一块芯片上,能延迟多少?可是当你将不同芯片内部放大一百、一千倍来看就会发现延迟快慢的差距了。而更长、更多、更复杂的互连线也意味着在芯片设计的过程中,工程师要更周全地考虑阻抗匹配、信号中断等问题。
二是功耗成本问题,现在的芯片厂商为什么想把芯片做小?就是为了降低功耗,芯片的功耗直接和金属的寄生电容成正比,更宽的线宽会导致更大的功耗。同样,晶体管体积缩小也是为了降低功耗,可是同时却增加了翻倍的数量,还怎么谈降耗?同时还需要提供更大的供电输入,更强的散热处理,都会让成本增加。
最后一个也是最重要的一个问题,良品率。很多公司都会提到良品率问题,一般来说芯片良品率随核心面积指数降低,成本指数上升。芯片的设计和生产过程极度复杂,尤其是芯片面积越大,在晶圆片上刻画的电路也越多越复杂,越容易失败。
当然有些失败不会影响整个芯片的大体性能,只是说会让其产生“瑕疵”,而这种有瑕疵的芯片也刻意正常使用,但就是厂商可能会把有瑕疵的模块直接关闭,芯片也就缺失某些功能。