中国最强AI芯片问世, 今年底量产已是板上钉钉!
扫描二维码
随时随地手机看文章
AI芯片也被称为AI加速器或计算卡,即专门用于处理人工智能应用中的大量计算任务的模块(其他非计算任务仍由CPU负责)。当前,AI芯片主要分为 GPU 、FPGA 、ASIC。
AI的许多数据处理涉及矩阵乘法和加法。大量并行工作的GPU提供了一种廉价的方法,但缺点是更高的功率。具有内置DSP模块和本地存储器的FPGA更节能,但它们通常更昂贵。AI芯片该使用什么方法原理去实现,仍然众说纷纭,这是新技术的特点,探索阶段百花齐放,这也与深度学习等算法模型的研发并未成熟有关,即AI的基础理论方面仍然存在很大空白。这是指导芯片如何设计的基本前提。
因此,集中在如何更好的适应已有的数据流式处理模式进行的芯片优化设计。技术手段方面AI市场的第一颗芯片包括现成的CPU,GPU,FPGA和DSP的各种组合。虽然新设计正在由诸如英特尔、谷歌、英伟达、高通,以及IBM等公司开发,但还不清楚哪家的方法会胜出。似乎至少需要一个CPU来控制这些系统,但是当流数据并行化时,就会需要各种类型的协处理器。
近日在苏州举行的中国人工智能产业2020年年会上发布的《2020年中国人工智能发展报告》显示,在过去10年里,全球人工智能专利申请超过52万件。其中,我国人工智能专利申请量近39万件(38.9571万件),占全球总量的近3 / 4(74.7%),居世界第一。全球数字经济加速发展,人工智能逐渐形成商业化规模。作为人工智能产业的核心硬件,AI芯片以高效的数据处理能力著称,弥补了CPU在计算能力上的不足。近年来,人工智能处于爆发式发展阶段,大批优秀企业纷纷涌入,越来越多的AI应用落地。7月7日,酷芯携多款人工智能方案亮相2021 世界人工智能大会,并推出全新一代高性能AI SoC。
自2018年,酷芯发布第一款AI芯片之后,对接的客户已有上百家,全面助力人工智能芯片应用落地。沈泊表示,本次推出的AR9341芯片可以说是恰逢其时,鉴于目前市场对中高端智能相机芯片的需求十分迫切,该芯片将会在高端智能IPC、车载辅助驾驶、边缘计算盒子、智能机器人等领域大放异彩。沈泊透露,AR9341预计将在今年9月份提供工程样片,12月量产。
在不少芯片创业企业追求最新的工艺以实现最佳性能时,AI芯片厂商燧原科技两代芯片却采用了相同的工艺。
7月7日,腾讯投资的国内AI芯片初创企业燧原科技发布第二代人工智能训练产品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”训练加速卡和“云燧T21”训练OAM模组,全面升级的“驭算TopsRider”软件平台以及全新的“云燧集群”。
燧原科技创始人、CEO赵立东在接受第一财经专访时表示,“邃思2.0”和第一代产品均由格芯的12nm FinFET工艺打造,“邃思2.0”将于年底量产。
为了获得高的性能,大部分AI云端芯片厂商都采用最新的制程,为何燧原科技第二代产品没有使用更先进工艺?
具体而言,燧原科技新一代全自研的GCU-CARA全域计算架构,针对人工智能计算的特性进行深度优化,支持全面的计算精度,涵盖从FP32、TF32、FP16、BF16到INT8,单精度FP32峰值算力达40 TFLOPS,单精度张量TF32峰值算力达到160 TFLOPS。
其实成本也是影响工艺选择的重要因素。赵立东表示,从设计到流片,12纳米制程和7纳米制程成本完全不同,“一个3亿多人民币,一个7亿多,公司的商业本质还是要考虑成本。”
此外,同时改架构和工艺的风险太大,他介绍称,“如果最后有问题不知道是工艺造成的还是架构造成的。先进制程的性能、功耗会更好,但是综合考虑成本、风险和供应商产能,我们选择改架构。”
TF32代表的是张量单精度32位数据类型,相比传统的FP32,TF32在位宽更大的同时,消耗的带宽以及计算资源显著更小,被业界视为能够取代全尺寸单精度数据的革新性数据精度。
AI芯片的比拼上升到系统级
“客户并不会直接关心芯片层面的理论参数,AI落地的时候,他们更看重的是包括硬件、软件、互联的整体解决方案的有效利用率。所以我们已经从单芯片的维度升级到了更高的系统层面。这也是燧原推出整机多卡、多卡互联、分布式软件、云端部署的一整套交钥匙解决方案的原因。”张亚林说道,“我们也更强调通过低碳绿色化的云燧智算集群服务客户。”
AI芯片的比拼要升级到AI系统的比拼,从用户角度,对比AI系统的维度就会包含五个:软硬件一体的性价比、能效比、易用性、迁移成本、范化性。
视觉AI芯片发展至今,仍然存在着很多痛点和难题。在很多环境条件恶劣的场景,比如,在光照条件不佳或逆光情况下,AI成像的画质较差,导致AI算法准确度大幅降低。此外,从应用层面来看,市场需求算力强大的芯片来应对大模型系统的挑战,而目前市面上很多芯片算力不足。另一方面,在AI视觉芯片实际落地过程中,嵌入式芯片的AI工具链使用困难,软件、硬件和算法整合难度大,极大拖延了算法落地周期,增加了成本。
高性能ISP在2D/3D降噪、HDR、去雾、EIS等方面表现优异;
AI处理器将深度学习与机器视觉算法相结合,通用性强、扩展性能好;完整易用的工具链,使得浮点、定点网络的导入更加方便,且不会降低精度;一站式Turnkey解决方案,完整的应用参考方案。
在生物识别、安防监控、汽车辅助驾驶、智能无人机等领域,基于本次发布的AI相机芯片,酷芯也提供了完整的智能解决方案。长期以来,酷芯始终以技术为核心,不断经过锐意创新,加速AI视觉芯片的更新迭代,拓展AI芯片应用场景,推动人工智能市场发展,联合合作伙伴共同打造完整的AI芯片应用生态系统。
AI技术的革新,其从计算构架到应用,都和传统处理器与算法有巨大的差异,这给创业者和资本市场无限的遐想空间,这也是为什么资本和人才对其趋之若鹜的原因。
但是,产业发展还是要遵循一定的产业规律,笔者认为,绝大多数AI芯片公司都将成为历史的炮灰,最后,在云端和终端只剩下为数极少的几个玩家。
作为AI和芯片两大领域的交差点,AI芯片已经成了最热门的投资领域,各种AI芯片如雨后春笋冒出来,但是AI芯片领域生存环境恶劣,能活下来的企业将是凤毛麟角。
谷歌在I/O大会发布了其第三代TPU,并宣称其性能比去年的TUP 2.0提升8倍之多,达到每秒1000万亿次浮点计算,同时谷歌展示了其一系列基于TPU的AI应用。
可以说,AI已经成为科技行业除了区块链之外最热门的话题。AI芯片作为AI时代的基础设施,也成为目前行业最热门的领域。