所有IP自主研发 性能成倍增长!龙芯3A/B4000发布:下代追平AMD
扫描二维码
随时随地手机看文章
12月24日,国产CPU厂商龙芯在北京正式发布自主研发的新一代通用处理器—;—;龙芯3A4000、龙芯3B4000,其中桌面版的龙芯3A在性能上提升一倍以上,多路服务器版可提升3倍性能。
与此同时,龙芯还宣布2019年其处理器累计出货已达50万颗。此外还透露,12nm工艺的下代CPU性能可达同期AMD水平。
在当天的发布会上,联想、中科曙光、方正、中国运载火箭技术研究院等也发布了基于龙芯新一代通用处理器的桌面计算机、笔记本、服务器、网络安全设备、工业控制计算机等产品。
龙芯2019年出货已达50万颗
目前龙芯主要有三大系列产品:
龙芯1号:面向特定应用需求的定制的“小CPU”系列,为32位低功耗、低成本处理器,主要针对低端嵌入式和专用应用领域;
龙芯2号:面向工控和终端应用的“中CPU”系列,主要为64位低功耗单核或双核列处理器;
龙芯3号:面向桌面/服务器类应用的“大CPU”系列,主要为为64位多核系列处理器。
据龙芯中科副总裁张戈介绍,目前龙芯在政企、安全、金融、能源等应用场景均有广泛应用,2019年龙芯芯片出货量已达到50万颗以上,在国产化应用市场份额领先。
虽然50万片的出货量看上去并不大,但是对于一款完全自主可控的国产CPU来说,已经是非常不错的成绩了,也已经是目前国产CPU厂商当中出货最大的了。
值得注意的是,在今年10月的第十四届“中国芯”集成电路产业促进大会在青岛隆重举办。龙芯提报的龙芯3A/B3000处理器,凭借其优秀的市场表现,荣获第十四届“中国芯”“优秀市场表现产品”称号。
据介绍,龙芯3A/B3000系列累计出货量已达30万片以上,已应用于政企办公、网安、能源、交通、教育等多个领域,并得到了用户的广泛认可,具备相当的市场竞争力。
龙芯3A/B4000系列发布,单核性能与ADM“挖掘机”相当
相比上一代的龙芯3A/B3000系列来说,此次时隔近两年才发布的龙芯3A/B4000系列,虽然采用的还是28nm FDSOI工艺,但是在性能上有了成倍的提升。
据介绍,龙芯3A4000/3B4000采用了龙芯最新研制的新一代高性能处理器内核GS464V(上一代是GS464E),支持片内互联网总线、HT3.0系统总线、DDR4内存总线,同时还支持UART、SPI等接口。主频提升至1.5GHz-2.0GHz。
其中龙芯3A4000是针对桌面级的,核心数量可达4-8核,拥有双DDR4-2400/2133内存通道,双HT3.0系统总线,效率提升一倍。而龙芯3B4000则是面向高性能计算的,核心数量可达16-32核。
在性能方面,龙芯3A4000系列的SPEC CPU2006定点和浮点单核分值均超过20分,达到了上一代产品的两倍。
反映传统桌面性能的SPEC INT2000的单核base测试分数也从上一代的930分提高到了2090分,达到了与AMD 28nm最后产品“挖掘机”相当,高于14nm ARM处理器的水平。
龙芯3B4000支持4路直连,四路服务器性能是上一代的3B3000双路服务器性能的4倍。此外,虚拟机效率也从上一代产品的88%提高到98%。
中科院计算技术研究所总工程师、龙芯中科总裁、首席科学家胡伟武博士表示,龙芯3A/B4000系列已经基本完成了设计能力方面的补课,我们通过设计优化实现了单核通用处理性能的提升。
在封装和功耗方面,龙芯表示,龙芯3A4000的封装尺寸比3A3000更小,尺寸为37.5mm*37.5mm,支持普通BGA、LGA和CBGA多种封装形式,同时其桌面主板可支持四层板,典型功耗为30-40W。
值得一提的是,龙芯4000系列内部的GS132E核心主要负责监控主核运行,并进行动态功耗管理。
在具体体验方面,基于龙芯3A4000的笔记本工作时间比基于3A3000的笔记本提高了一倍以上。
不过,胡伟武也指出,龙芯3A4000的30-40W的典型功耗还是比较大,这主要是由于所采用的是工艺不够先进。所以,建议在科学计算环境下使用256位浮点向量时,适当降低电压和频率。
所有模块源代码均为自主研发
需要指出的是,作为脱胎于中科院计算所的国产CPU厂商,龙芯CPU目前主要应用领域也是在党政办公、航天、金融、能源等领域,因此对于CPU的自主可控及安全方面也有着更高的要求。
胡伟武强调,龙芯芯片所有源代码均为自主设计,所有模块源代码和各类全定制模块均为自主研发,除了厂家提供的标准单元库和Memory Compiler(内存编译器)外,没有任何第三方IP。
在CPU的安全方面,龙芯4000系列拥有强大的片内安全机制。通过专门指令实现了对MD5、AES、SHA等加解密算法的支持;同时集成了专用的安全可信模块,支持国密算法;支持“影子栈”等访问控制机制,对于操作系统函数调用、进程切换、IO访问可以有效监督。可以有效的防范此前x86和Arm处理器爆出的Meltdown和Spectre漏洞。
操作系统及软件生态建设
得益于PC市场数十年的积累,X86架构的CPU的系统及软件生态是最为丰富的。而Arm架构的CPU也受益于Arm在移动市场的霸主地位,系统及软件生态也是非常丰富。相比之下,对于既非X86也非Arm架构的龙芯来说,在系统及软件生态上则需要花费更多的精力去建设。
目前龙芯针对不同的应用场景,已经推出了适配不同操作系统的解决方案。比如,Loongnix是面向通用信息化系统的,基于通用Linux平台进行完善和优化,为统一操作系统UOS龙芯版提供支撑。
LoongOS是面向高可靠实时终端的,基于Linux/RT-Linux构建了简洁高效的OS。
LoongWorks是面向实时嵌入式应用的,针对历史应用,基于VxWorks内核,完善图形和网络等API。
值得注意的是,就在本月初,国产统一操作系统UOS(unity operating system)龙芯版正式发布,已适用龙芯3A3000系列、龙芯3B3000系列、3A4000系列、龙芯3B4000系列。
据介绍,在近半年的时间里,UOS开发团队与龙芯中科的系统软件研发团队针对Linux内核、BIOS固件、编译器、浏览器、图形驱动等多项基础软件共同解决了几十项问题,确保UOS在龙芯平台上功能完善、体验流畅、质量稳定。
另外,为了提升兼容性,胡伟武表示,龙芯将进一步统一系统架构,构建标准规范体系,实现操作系统跨主板整机兼容和CPU代际兼容。
从龙芯3A4000开始,龙芯也将参考设计全面支持统一系统架构,开发支持ACPI主板、固件、内核及OS的参考设计,以及基于ACPI/EC笔记本标准的解决方案。
下一代产品将实现“突破”
胡伟武表示,龙芯第一代产品算是“基本可用”,属于“小学毕业”水平;第二代产品则提升到了“可用”的阶段,属于“中学毕业”水平;第三代产品已经“好用”了,属于“大学毕业”水准了;下一代产品将要与国际芯片巨头同台竞技。
“要想实现与国际芯片巨头同台竞技,首先需要通过几级阶梯登上‘台’去,龙芯现在就是在走最后一级阶梯。”胡伟武说到。
据胡伟武透露,龙芯的下一代产品,龙芯3A5000将采用12nm工艺,主频将提高到2.5GHz,同时,其内存控制器延迟/宽带进一步优化,LLC增加一倍,实现操作系统级二进制兼容。单核性能届时将提高至30分左右,通用性能达到同期AMD的水平,计划于2020年上半年流片。
龙芯3C5000将同样采用12nm工艺,核心数会进一步增加,支持4至16路服务器,计划将于2020年下半年流片。