加速芯片设计,实现EDA工具和算力资源高效连接——专访速石科技高级技术总监张大成
扫描二维码
随时随地手机看文章
芯片设计需要大量的算力资源,尤其是在超大规模芯片的仿真和建模方面,对计算存储和网络资源的要求很高,只是依靠自己的PC远远不够。芯片设计团队希望能够得到成千上万颗CPU的计算能力,借助超大计算集群实现设计加速。但常规的云资源平台提供的是企业通用服务,很难满足芯片设计这种细分领域的业务需求。而各个EDA工具家的自己的云平台,灵活度和计算资源又相对受限。正是瞄准了这一行业机会,速石科技杀入了这一领域,迅速构建了适合于芯片设计公司的一站式研发平台,帮助客户实现EDA工具和算力资源之间的结合,并且在短短三年的时间内实现了数百家行业客户的案例落地,真正帮助中国芯片公司实现了设计加速。
近日在ICCAD2023上,我们有幸采访到了速石科技高级技术总监张大成,他就芯片设计的业务需求趋势进行了精彩分享。
高效连接EDA工具与算力资源的一站式研发平台
在半导体芯片设计的产业发展过程中,随着工艺制程愈发先进、芯片晶体管数量越来越多,研发过程中需要大规模地调度算力运算。速石科技正是基于这样的客户诉求,构建了自己的一站式芯片研发平台。该产品通过速石自研的调度器Fsched对企业的资源和任务状况进行实时的监控和管理,配合Auto-Scale(自动伸缩)、实时告警、可视化监控等功能,从资源调度、运营管理、工具自动化等多维度满足企业在芯片设计、开发、验证等环节的业务和管理需求。
据张大成介绍,速石科技的一站式研发平台可以给客户带来诸多价值。例如当某一个客户随着设计业务发展,经常会遇到算力不足、任务排队、运维困难等问题。速石科技可以帮助客户实现云上数万核规模的设计回归验证,通过旗下的企业级产品调度海量云端算力,提供针对EDA产品的优化与适配,从而帮助客户加速流片过程。同时,速石科技还能提供专业的IT-CAD技术支持,有效降低了企业客户的研发和运维压力,
张大成表示,“当你仿真高峰来临资源不足的时候,当你的研发环境没法满足业务使用的时候,当你对降低成本控制预算有需求的时候,当你想要持续优化研发效率的时候,当你希望获得包括CAD能力与大客户支持在内的一站式平台服务的时候,速石科技做的就是这件事情,这是我们给客户带来的价值。”
安全可靠,满足企业复杂研发环境的管理需求
据张大成分享,最近几年半导体芯片设计遇到比较大的一个挑战是,芯片设计的质量要求不断提升,芯片验证的复杂程度也随之不断的提高,从而对资源、平台、服务提出了更高的要求。速石科技的企业级产品能够实现对企业本地及云端复杂研发环境的统一协调管理,并可支持全球化的项目协同管理。结合IT自动化管理、行业最佳实践流程和基于业务的功能模块,为用户提供完整的研发环境搭建和管理,满足了企业全研发周期的需求。
“速石科技有一整套产品可以帮助客户管理调度自己的验证任务,帮助其更好地运行;同时速石科技在云上帮助客户大规模地调用资源以完成验证和开发任务,这其实为客户带来了整体的效率提升。而且像有的企业,发展阶段不一样,研发环境也会产生比较大的变动,比如从单纯的云端或者本地环境变成混合云,或者像有了多个研发中心,甚至有海外的研发协同需求,这些我们都可以满足。”
同时,对于芯片设计企业来说,研发环境的安全性也至关重要,而速石科技也能就此提供一份让用户满意的答卷,从研发网络安全、研发数据物理安全防护、研发数据安全访问及设备安全等多个方面提供了安全保障。
“例如我们有一个初创客户,他获得了某晶圆厂的先进制程的准入资格,但该厂的安全审计对整个研发环境有非常严格的安全规范要求,客户的研发环境必须要符合要求,才能开展后续的一系列工作。”张大成分享到,“我们速石底层数据的安全措施和防范规则级别非常高,客户很顺利地通过了晶圆厂的审核,最后成功流片。”
优化运营,本土化带来的高性价比
半导体行业的国产化是一种趋势,也是企业的一种选择。企业选择国产化不仅仅是为了满足合规需求,更重要的是能获得基于本土的高质量服务、成本上的优惠和技术上的协同。一些企业已经在寻找上下游的国产化替代方案,以满足自身业务连续性的需求。
如当前大部分的芯片公司使用的调度器,基本上都是海外软件,很难获得及时的技术支持,而且成本高昂。速石平台的自研调度器Fshced,能够提供多种灵活调度策略,实现代码级支持,并可兼容用户已有的研发环境和市面主流调度器,最大限度满足企业不同阶段的业务需求。国内某家上市存储芯片公司在积极寻求国产化替代方案,速石科技的产品提升了其30%的研发效率,有效降低了CAD工程师的维护开发精力,成功提升了企业的流片速度,为巩固其市场地位起到了支撑作用。
当然,调度器只是速石产品的一个模块,作为国产化的一站式研发平台,速石产品在三年时间服务了数百家企业,深入了解行业需求,并以此为基础提供运营优化分析。如可视化监控信息,速石能够从使用模式、资源利用率、机型选择等维度,按周期为用户提供运营优化方案,从而降低企业的总体拥有成本。而且像License其实也可以看作是一种资源,而且费用高昂,需要规划更为合理的使用方式。速石科技可以结合平台高效的管理和调度能力,帮助客户更合理地分配License资源,从而助力其优化运营成本。
针对芯片设计的研发特性,速石科技的企业级产品FCC-B,能够帮助企业找到成本和效率之间的关键平衡点,在保障企业研发效率的同时,显著降低成本支出。“我们的产品有独占的大内存资源供应给企业客户,一方面能满足企业在后仿阶段特定的业务需求,另一方面能进一步控制他们的硬件支出和构建研发环境的整体成本。”张大成总结到。
减少研发技术债,助力高效AI训练
随着近年来EDA厂商纷纷布局AI/ML实现设计加速,AI对芯片设计效率提升的话题也尤为受到关注。而在AI模型研发的整体框架中,诸如数据处理、生产环境部署、算力资源管理、研发环境管理等环节成为了AI研发中隐藏的技术债务,对企业在系统性和规范化上有很高的要求。针对此问题,张大成也进行了深入讲解。
据了解,企业在AI模型的研发和训练中,通常会遇到两大问题。
第一个问题是用户体验。研发人员在进行算法训练和模型调试的时候,会涉及到很多如进项管理、模型数据集管理、容器化应用等,但这些工作会消耗研发人员的大量精力进行试错和调优。速石科技的MLOps模块能够弥合研发团队与AI基础设施间的差距,简化模型研发流程,快速实现模型的部署和落地,从而帮助企业实现自身商业价值。
第二个问题则是研发资源。GPU当前资源紧缺、成本高昂,如何提高GPU资源的利用率,从客户运维角度来看有非常大的阻碍。速石科技的MLOps模块通过集群实现对企业云端和本地算力资源的统一管理,确保每个用户都能及时获取所需资源,减少任务排队和资源浪费,帮助客户实现成本的高效控制,提升企业研发的投资回报率。
据张大成介绍,速石科技的MLOps模块已经正式上线,有包括手机厂商和芯片厂商在内的客户投入使用,并获得良好反馈。
Fabless竞争加剧,更要实现高效开发
当前行业处于波动调整的底部周期,对芯片供应商而言面临着多重压力。在这种环境下,Fabless的产品竞争愈加激烈,在制程规格、车规芯片、先进封装等方面的要求不断提升。
张大成表示,在当前这种市场大环境下,其实很多初创型企业在资金控制、成本控制、效率提升等方面都面临着更大的压力。而速石科技可以帮助他们从资金、成本、效率等维度控制企业支出,帮助他们未来能够走得更远。