万亿级芯片

2019-12-26 原文 #Nei.st 的其它文章

如何用超大芯片打造小型超级计算机

硅芯片的一生很孤独。它们通常与几万个一模一样的兄弟姐妹一起出生,每个只有几毫米宽,排列在与老式黑胶唱片一般大小的一片晶圆上。然后,它们从自己的晶圆出生地上被拆下来——就像是从一板巧克力上掰下小块,再用塑料和金属一个一个封装起来。只有在这之后,芯片才又与其他同类芯片重新连接起来,因为封装好的芯片要连接在一起,在电路板上协同运作,并被置入产品中。

多年来,许多发明家已经注意到,如果一开始在晶圆上就连接好芯片,便可省去很多成本和麻烦。但是,在晶圆上集成芯片的努力始终没能成功,原因要么是技术不到位,要么是做出来的电路板无法与传统设计的新版本竞争。

位于加州洛斯阿尔托斯市 (Los Altos) 的公司 Cerebras 觉得现在可以再试一次了。该公司的新产品 CS-1 超级计算机的核心很难说是一块「芯片」。那是一块 21.5 厘米见方的硅片,该公司称它为晶圆级引擎 (wafer-scale engine,简称 WSE)。但不管叫什么名字,这都是一项突破性技术。高端现代计算机芯片的表面可能有数十亿个晶体管,而 WSE 上有超过一万亿个。

Cerebras 的芯片除了突破了一万亿个晶体管的门槛 (实际上它有 1.2 万亿个) 之外,还打破了其他许多记录。它的晶体管构成了 40 万个独立处理单元 (行话叫「核心」),每秒可在内部传输 9PB(9000 万亿个字节) 的数据。相比之下,现代个人电脑中最典型的芯片、英特尔的 i9-9900k 只有八个核心,每秒传输 40GB 的数据。

CS-1 还有一些参数之小令人瞩目。诚然,IBM 的 Summit 有约 240 万个核心,在已公开的超级计算机中属于最炫目的一类。但 Summit 是按传统方式用封装电路板打造的。它重 340 多吨,占地 520 平方米。CS-1 仅重约 250 公斤,只有一台家用冰箱那么大。CS-1 的耗电量仅为 15 至 20 千瓦,Summit 是它的 1000 倍。

打造这样庞大的计算能力是为了运行线性代数运算,这是用于一般数据处理的数学方法,在机器学习中尤其常用。在风行又赚钱的「人工智能」计算领域,机器学习处于核心地位。

CS-1 的编译器 (将人类编写的程序转换为计算机可以理解的二进制代码的软件) 经过调整,将生成的代码结构与硬件结构相匹配,以此实现核心之间尽可能高效的数据传输。而且,由于核心与它们使用的内存相距不到一毫米,数据在电路板上不同位置间的传输已经远快于通常所需的远距离传输。

WSE 本身由台湾公司台积电制造,据称采用了非常精密的工艺,每个 WSE 只有 150 至 200 个缺陷。由于有大量其他可用的晶体管,这些缺陷可被轻松绕过。晶圆级集成还面临许多其他挑战,例如保持所有部分同步、保证输入功率、散热,以及有效地与计算机的其他部分传输 GB 级的数据。但是,如果 CS-1 投入商用后能经受住实际应用的挑战,那么晶圆级集成最终将证明自己的实力,「孤单芯片」的日子可能也就屈指可数了。

Related


文章版权归原作者所有。
二维码分享本站