近日,谷歌 DeepMind 公布了其最新的 AI 系统 ——AlphaChip。这一系统致力于加速和优化计算机芯片的开发,AlphaChip 所设计的芯片布局已经在谷歌的 AI 加速器中得到应用。

AlphaChip 的工作原理类似于我们之前所听说的 AlphaGo 和 AlphaZero,采用强化学习技术,迅速生成经过优化的芯片布局。

根据谷歌 DeepMind 的介绍,AlphaChip 已经在过去三代的张量处理单元(TPU)AI 加速器中被使用。其中,在最新的第六代 TPU——Trillium 中,AlphaChip 实现了25个模块的布局设计,相比于人类专家,电线长度减少了6.2%。这表明,AlphaChip 在性能上取得了显著提升。

AlphaChip 的设计过程可以想象成一种游戏,系统像在网格上一个接一个地放置电路组件。为了帮助系统学习连接组件之间的关系并在不同的芯片上进行推广,DeepMind 专门开发了一种图神经网络。值得一提的是,不仅仅是谷歌,其他公司如芯片制造商联发科技也在利用 AlphaChip,尤其是在开发其最先进的芯片,如为三星智能手机提供的 Dimensity 旗舰5G 芯片。

除了提高芯片设计的速度和效率外,谷歌 DeepMind 还看到了进一步优化整个芯片设计周期的潜力。未来的 AlphaChip 版本预计将覆盖从计算机架构到制造的各个环节,目标是让芯片变得更快、更便宜、更节能。

为此,DeepMind 也将一些 AlphaChip 的资源开源。他们发布了一个软件库,可以完整复现原研究中描述的方法。外部研究人员可以利用这个库对不同的芯片模块进行预训练,然后将其应用到新的模块上。

此外,DeepMind 还提供了一个经过20个 TPU 模块训练的预训练模型检查点,建议外部研究人员在特定的应用模块上进行预训练,以达到最佳效果。关于如何使用这些开源资源进行预训练,DeepMind 还提供了相应的教程,并将其上传到了 GitHub 上。

划重点:

🌟 AlphaChip 是谷歌 DeepMind 推出的 AI 系统,旨在加速和优化芯片设计。

🔍 该系统已在谷歌的最新 TPU 系列中应用,并实现了显著的布局优化。

📚 DeepMind 将部分 AlphaChip 资源开源,外部研究人员可以利用这些资源进行预训练和应用。