PyTorch 宣布支持苹果 M1 芯片,GPU大大加速,训练推理都加速
扫描二维码
随时随地手机看文章
今年 3 月,苹果发布了其自研 M1 芯片的最终型号 M1 Ultra,它由 1140 亿个晶体管组成,是有史以来个人计算机中最大的数字。苹果宣称只需 1/3 的功耗,M1 Ultra 就可以实现比桌面级 GPU RTX 3090 更高的性能。
随着用户数量的增长,人们已经逐渐接受使用 M1 芯片的计算机,但作为一款 ARM 架构芯片,还有人在担心部分任务的兼容性问题。昨天,通过与苹果 Metal 团队工程师合作,PyTorch 官方宣布已正式支持在 M1 版本的 Mac 上进行 GPU 加速的 PyTorch 机器学习模型训练。此前,Mac 上的 PyTorch 训练仅能利用 CPU,但随着即将发布的 PyTorch v1.12 版本,开发和研究人员可以利用苹果 GPU 大幅度加快模型训练。现在,人们可以在 Mac 上相对高效地执行机器学习工作,例如在本地进行原型设计和微调。苹果芯片的 AI 训练优势PyTorch GPU 训练加速是使用苹果 Metal PeRFormance Shaders ( MPS ) 作为后端来实现的。MPS 后端扩展了 PyTorch 框架,提供了在 Mac 上设置和运行操作的脚本和功能。MPS 使用针对每个 Metal GPU 系列的独特特性进行微调的内核能力来优化计算性能。新设备将机器学习计算图和原语映射到 MPS Graph 框架和 MPS 提供的调整内核上。
PyTorch的前身是Torch,其底层和框架一样,但是使用Python重新写了很多内容,不仅更加灵活,支持动态图,而且提供了Python接口。它是由Torch7团队开发,是一个以Python优先的深度学习框架,不仅能够实现强大的GPU加速,同时还支持动态神经网络。PyTorch既可以看作加入了GPU支持的numpy,同时也可以看成一个拥有自动求导功能的强大的深度神经网络。除了Facebook外,它已经被Twitter、CMU和Salesforce等机构采用。
M1 Ultra将两个M1 Max芯片融合在一起,组成了一个具有20个CPU核和64个GPU核的处理器,以及高达128GB的RAM,这是我们测试过的速度最快的处理器之一。随着 Mac Studio 的推出,苹果还发布了全新的 Apple Silicon 芯片 M1 Ultra。这实际上是将两个 M1 Max 芯片合二为一。Geekbench 测试显示它比 Intel Mac Pro 中提供的最高规格 CPU 更强大时,我们初步了解到 M1 Ultra 芯片的强大程度。 “28 核 Intel Xeon W-3275M 处理器是 Mac Pro 中最好的处理器,多核得分为 19951。这意味着 M1 Ultra 比英特尔 Mac Pro 可用的最昂贵的 CPU 快约 20%。”Macworld 运行了一组非常全面的基准测试,这表明高端芯片的优势差异很大,ProRes 摄像师看到了最大的改进。 “如果你对 ProRes 和 H.265 等视频编解码器很感兴趣,那么拥有双倍于 Ultra 中的加速器将带来巨大的性能提升。如果你关心照片编辑器,那么两种型号的单核性能几乎相同,这意味着可以选择更便宜的版本。但是,如果你确实需要进行较重的照片工作,Ultra 的更高内存限制可以派上用场。再次,认识到你的工作流程需要什么,然后做出相应的选择。”
一般认为,苹果的UltraFusion封装架构是基于台积电(TSMC)的CoWoS(Chip-on-Wafer-on-Substrate),这是一项2.5D封装技术,可以将多个小芯片封装到一个基板上。不过半导体封装方面的专业人士Tom Wassick则放出了相关的幻灯片,显示M1 Ultra采用的是名为“InFO_LI”的封裝方式,属于本地芯片互联的晶圆级封装。
此前在春季发布会上,苹果并没有更新自家的笔记本产品线,而是“另起炉灶”推出了Mac Studio产品线,以替代此前设计稍显过时的Mac Mini。芯片方面,Mac Studio采用的是将两颗M1 Max“缝合”在一起的M1 Ultra芯片。那么在此后的WWDC 2022上,有业内人士预测M2芯片将有极大可能正式亮相,并且实装在全新的MacBook Air上。
同时,MacBook Air也将会更换全新的模具,并且像此前的M1 iMac一样,拥有更多的配色。M2还将会可能被应用在入门款的MacBook Pro和iMac系列产品上,这两类产品也将有可能在WWDCC 2022上迎来更新。不知道,新的M2芯片,什么时候能被Torch兼容呢?这样,Mac的优势就更大了。