明芯会客室|专访王惟林:投身国产芯片18年,每一天都在和时间赛跑
扫描二维码
随时随地手机看文章
当国产芯片再次飞上风口,王惟林早已投身其中超过18年。
从中科院毕业后他, 一直在计算机芯片设计中拼搏,并先后组建了国产x86 CPU和芯片组研发团队,如今作为兆芯的总工程师,指导着500人规模的研发团队,先后负责了多颗CPU和x86-SOC芯片的自主设计研发和量产。
王惟林用“很难,真的很难”来形容从无到有的研发之路。他不仅要跟时间赛跑,用尽可能少的时间去追赶国际巨头多年的积累, 用少得多的资源去实现技术上的突破,更需要和难以控制的外部因素较劲,比如弥漫整个行业的人才荒、成熟工程师的中途“跑路”,以及对国产芯片的质疑等等。
“一点点前进,一点点改变现状”,王惟林深知,差距无法一日弥合,但在中国芯片人的努力下,整个行业已经以可感知的速度向前进步了。
王惟林,国家科技重大专项课题研发负责人,国产x86 CPU技术团队负责人,上海兆芯集成电路有限公司总工程师
1
18年奋斗,从0到IC生态链完备
王惟林2019年的目标很明确,“完成下一代7nm验证芯片的开发,包括新工艺下的高速高功耗设计流程和最新规格的接口IP。”
尽管又是一场硬仗,但打过硬仗的王惟林有信心。
剑指国产处理器芯片的研发和量产,兆芯虽然成立于2013年,但它的研发团队却要远早于此,王惟林是重要的组建者。“兆芯这支研发团队其实2001年就成立了,最早是在威盛电子做芯片组。在威盛时期,这支设计团队就是芯片组核心的研发团队,完成了很多美国和台湾同事认为不可能做到的项目, 曾经2次在半年内完成了新型芯片组和手机芯片的研发流片任务。可以说,在进入处理器设计之前,我们已经是国内最好的设计团队之一,有培养好的人才、有良好的设计流程、丰富的设计经验,”王惟林说,“到2010年,很多员工从芯片组研发的工作中分离出来,组建成了CPU研发团队。到后来兆芯成立,这支全部由本土员工组成的国内研发团队也随之被纳入到兆芯的体系之下。”
所谓芯片组,是一组共同工作的集成电路“芯片”,它负责将计算机的核心——微处理器和机器的其他部分相连接,是发挥处理器性能,保证整机性能和系统可靠稳定的重要部件。而CPU则是一台计算机的运算核心和控制核心,每一台电脑、每一部手机都由它控制,每年,我国从国外进口的CPU金额有550亿到600亿美元之多。
如今,CPU和芯片组,是兆芯的研发重点,有一只500人规模的软硬件工程师团队。王惟林仍然记得这支团队在研发第一颗处理器芯片时的酸甜苦辣。
从0开始,消化吸收再创新。当年,兆芯引进了第一颗x86高性能处理器芯片,王惟林的团队吸收了它的微架构,同时复现了完整的流程,“初步了解了高性能处理器完整的设计流程。”
在完成了第一颗高性能处理器芯片的消化之后,研发团队开始对微架构和设计方法进行重新设计,他们对内核做了优化,把频率往上拉,把功耗往下降,同时把共享总线改成共享缓存来提高效率。这样相较于第一代芯片的40nm两核1.6GHz 60平方毫米,20瓦功耗,第二代处理器芯片在频率和IPC(每时钟周期指令数)提高的同时,还把内核增加了一倍,面积压缩20平方毫米,功耗压缩到十几瓦。
最为重要的是,经此一役,兆芯的处理器研发团队彻底掌握了高性能处理芯片研发的精髓。
但教训也有很多。“做完之后发现有些性能功耗和我们的预期的不太一样。有些设计当时考虑的比较简单,需要再次优化。处理器需要在在选定工艺下,把握微架构,主频,功耗的平衡,我们努力补上性能评估、功耗评估等设计流程缺失的环节,现在终于把功耗和性能的误差控制在了1%之内。”
基于此前芯片的设计经验和教训,重新设计的芯片——开先KX-5000系列处理器在2016年8月成功流片了。“开先KX-5000系列处理器在内核流水线、分支预测、内存带宽、调度算法优化和多核节点互连优化的同时,IO、Memory性能改进了很多。整机性能达到了英特尔I3的标准,除了办公, 很多桌面娱乐,游戏支持的也不错”。
兆芯国产通用处理器性能显著提升,应用体验不断改善
从最初到现在,兆芯CPU单核性能提高了2.5倍,整机性能提高了8倍多;芯片组则一直跟国际最新芯片保持同样的性能和设计规格。在芯片生态方面,兆芯与工艺、操作系统、中间件、应用软件、整机开发制造等环节的合作伙伴形成了一个完备的生态链。
2
衔枚疾进,呼吁破局IC产业「人才荒」
表面上,一切顺利,但研发中的波折和困难,王惟林记忆犹新。
人力上一直处于紧绷的状态,一两个人的去留甚至会影响到一个设计特性的开发进度。“工程师稍微有些变化,就有可能放弃或者降低一些设计规格,”王惟林说,“第六代产品开先KX-6000的一些优化本在开先KX-5000的时候就准备做进去,但因为当时负责的工程师离职,只好收缩战线。”
有处理器领域的权威人士曾说95年以后的论文不用看,因为架构讲得都差不多了。在传统的高性能处理器领域,这个说法确实比较贴近事实。但是国内,甚至很多国外的设计公司在面向高性能处理器芯片的研发中,设计技术和方法依然十分生涩。“这就好比,我们知道过河要搭桥,但不知道如何搭个好的桥, 甚至我们猜到了很多方法, 但由于时间和成本很难去试一试,”王惟林说“方法和流程,如同材料学和飞机发动机一样,需要大量的试错和基础预研。”
我们要确保每一颗芯片成功。Intel、AMD研制一款芯片,大概需要5年以上的时间,甚至很多技术很早就开始预研了,而且各方面成本投入非常大,积累深厚。“我们一直处于赶路的状态,很多现实压力让你没有时间去看清楚、看细致,也没办法进行试错,找出某些关键问题的更优解。”
而从2.0GHz到3.0GHz,到更高频率,随着处理器主频的上升,芯片设计也出现新的课题。“我们只能在短时间内尽力做好, 同时在一步一步往前赶,一点点改变这个现状,一次到位很难,”王惟林说。
与此同时,可能是出于宣传的需要或是工程师的个人偏好,注重单点性能而罔顾整体性能、稳定性、可靠性的风气,一度也把芯片设计带到了歧路上。“处理器要量产一定要保证可靠性、稳定性和兼容性。这个控制不住,肯定会出问题。所以,我们在做的产品, 最重要的是在保证用户性能需球的同时,要确保用户使用起来稳定兼容,设计上要处理好这些, 比如功耗,信号的完整性,电源平面的抖动等。”
人才荒,则是整个行业的面临的共通困难。
王惟林每年都会去大学招聘,“以前去某中部地区著名大学招聘,每年都能招来十几人。大概从前两年开始,我每年只能招来几个”,王惟林很纳闷,回过头去问这些专业的情况,才发现很多研究方向都改为软件了。
集成电路设计行业是人才、资金和技术密集型的行业,高性能处理器更是其中尖端复杂的代表,兆芯的研发人员大部分都是硕士、博士毕业,研究方向偏硬件,投入时间和经济回报上的不对称,让越来越多的优秀人才流出。“小朋友也要养家糊口,”王惟林理解这些压力。
虽然现实艰难,但是王惟林也注意到,政府在提供更好的支持。在北京,政府做出了IC产业北设计、南制造的产业规划,北边的中关村集成电路产业园,集合了海思、展讯等企业,南边则有亦庄。“这很像美国硅谷,一个园区集聚了产业链上下游的企业,”王惟林说。
值得关注的是,北边的中关村集成电路产业园去年还落成了中关村集成电路科技馆,面向公众、在校学生、业内人士开放,意在提升IC产业的社会影响力,让更多年轻人接触IC、了解IC、投身IC,从根子上提升年轻人对这一生涩产业的认知和兴趣。
改变在发生,王惟林也期待和呼吁政府等部门,在人才培养、人才引进、户口、住房等问题上,让IC企业得到持续的支持,多方位破局困扰行业发展的「人才荒」难题。
3
国产芯片关键是要能响应国家的使命召唤
一个“奇怪”的现象是,国产芯片喊了很多年,也时有成果发布,但是普通人的手机和电脑上,仍然是进口芯片一统江湖。国产芯片去哪儿了?
也正是这样的情况,形成了大众对国产芯片的直观印象:砸了很多钱,但不争气。
“可以理解。爱之弥深、恨之弥深,大概是这样一种态度。”对于公众对国产芯片的质疑,王惟林认为有几个原因:一是整个国产芯片行业的发展水平与国际相比,确实还比较初级;二是在产业的初期,很多芯片为了获取经费拼命宣传,只强调一些不实用的单点指标,整体的处理性能还非常差,同时不注重稳定性和可靠性,宣传效果和实际可用性落差大。
但在经过近20年发展之后,国产芯片设计水平在摸爬滚打中取得的显著进步也应该被看到。国产高性能处理器在很多领域是可以胜任需求的。在民政系统的婚姻登记系统、在上海银行的柜面业务中,兆芯CPU驱动的整机都已投入使用。
兆芯平台整机已经获得广泛的行业应用和认可
“兆芯ZX-C CPU完全可以支持WPS\OFFICE这些办公软件,支持打印机、扫描机这样的扫描装置,兆芯最新的处理器性能也足以支持当下的热门游戏,比如让吃鸡,使命召唤流畅地跑起来,这些应用都没问题”王惟林介绍。
现在,摆在国产处理器面前的还有一个重要的“路线争论”:我们知道,处理器只是硬件,需要配合整机、操作系统、中间件,应用软件一起才能发挥作用,这也反映出了生态的重要性。那么到底是从头开始原创自建生态?还是融入已有生态,基于此开发自己的产品?兆芯走的是第二条路线。“我们的长期目标是要建设自己的生态,那么短期呢?芯片关系着信息产业的发展,国产高性能处理器仍然是行业的追赶者,想要更加快速的赶上来,站在巨人的肩膀上是一种投入产出比更高的途径。另外,在国际主流生态几乎占据垄断地位的现实下,一旦再度发生影响产业安全的情况,从头做起的薄弱生态如何能弥补产业的空白,这对产业安全是格外严峻的考验。在拥有更大市场,更多话语权之后,我们的长期目标——建立自己的产业标准和产业生态,这个工作就会容易一些了。”
而随着摩尔定律遇到瓶颈,新成果迭出,王惟林也在关注量子芯片、神经网络芯片等新兴技术。
“我们现在还是典型的冯·诺依曼架构,存储和计算分离。一个指令出来,去memory抓取,memory没有就去硬盘里找,非常漫长。但人的大脑不是这样,每一个神经元都是存储和计算在一起。”王惟林和他的团队两年前就在探讨国际最前沿的科研趋势,“未来,可能会走到这一步,但现在,我们要认认真真做好每一个细节”。