首页资讯科技 超导计算机采用纳米技术

超导计算机采用纳米技术

李实计算机是推动人类进入信息技术时代的核心设备。随着计算机和相关产业的快速发展,人类社会的技术能力也得到了大幅度的增强,互联互通的程度也得到了极大提高。但是,随着计算机持续发展以及人类所使用计算机的数量成倍增加,计算机背后的能耗问题逐渐凸显…

超导计算机采用纳米技术

李实

计算机是推动人类进入信息技术时代的核心设备。随着计算机及相关产业的快速发展,人类社会的技术能力大大增强,互联程度也大大提高。然而,随着计算机的不断发展,人类使用计算机数量的成倍增长,计算机背后的能耗问题逐渐凸显。2015年,EnergyEfficiency杂志披露了一份研究报告,报告显示,游戏PC的耗电量占当年所有PC的21%,达到75TWh,相当于1.6亿台冰箱的耗电量。根据2017年的数据,当时全球数据中心的总耗电量约为416TWh,约占当年地球总发电量的3%。此外,随着超级计算机在世界各地的发展和越来越多的部署,超级计算机背后的能源消耗越来越受到人们的关注。比如目前世界排名第一的超级计算机——日本Fugaku,其耗电量为29899kW,运行一小时相当于近3万度电,这还不包括这台超级计算机相关设备和维护的消耗。

另一方面,计算机及相关设备日益增长的能耗需求也带来了一个严重的问题——散热。甚至有人估计,未来超级计算机等设备可能不得不建在河流、湖泊甚至南北极周围,因为在超级计算机达到其计算能力上限之前,散热和功耗的问题首先会成为最大的障碍,需要流动的河流、湖泊或极地的低温气候才能使超级计算机等设备保持在能够正常工作的温度范围内。所以从目前的技术发展来看,计算机尤其是超级计算机的功耗和散热问题,在不久的将来可能会成为人们获取更多计算能力的绊脚石。

为了解决这个问题,研究者开始考虑现有技术路径之外的实现方法。例如,采用全新的计算架构、专用单元或不断改进软件架构。但这些技术都不是直接的,即利用超导效应和量子力学相关技术实现超导计算机。超导的特点是无电阻,能耗极低,有助于人们构建低功耗的计算设备。关于超导计算机的研究和发展,自从1956年麻省理工学院的D.A.Buck在论文《低温子超导计算机部件》中提出超导态量子计算的概念以来,人们一直在努力工作。现在,中国、欧盟、日本和美国都在超导计算方面推出了自己独特的技术和理念。近日,日本横滨国立大学的一位研究人员在《MANA:AMONOLITHICADIABAC Integrative Architecture微处理器1.4-ZJ/op unshored超导体Joseph SonjunctionDevices》一文中提到了超导计算机的一种实现方法。借助这篇论文,我们来了解一下超导计算机及相关内容。

约瑟夫超导结构和AQFP逻辑

想做电脑,首先要有最基本的制作电脑芯片的材料,然后制作一系列具有非门、与门、与非门等功能的逻辑门,一起使用实现其功能。在目前的硅基芯片中,人们使用半导体材料制作P型半导体、N型半导体、PN结等结构。组合使用后,获得完整的半导体芯片和相关功能。

如果是超导计算机,需要类似的步骤。在这里,本文首先介绍一个概念,即超导约瑟夫森结。

超导约瑟夫森结是超导计算研究和发展的一个重要方向。约瑟夫森结由两个相互弱连接的超导体组成。这里的弱连接是指在两个超导体之间可以使用一个薄的绝缘层,一小片非超导金属或者一个可以削弱接触点超导性的狭窄部分。不同的连接有不同的名称,如SIS、SNS或SsS。本文采用SIS技术。

超导约瑟夫森结以临界电流为特征。当流过超导约瑟夫森结的电流小于临界电流时,超导约瑟夫森结两端没有电压降。但如果流过超导约瑟夫森结的电流略大于临界电流,就会触发多次安德雷耶夫反射,在电路测试中会出现明显的尖峰。如果电流继续增大,超过超导体之间绝缘体的带隙,电流和电压就会变得非常线性。由于超导约瑟夫森结在临界电流方面的独特性能,它有可能成为逻辑电路的候选结构。

实际上,根据日本横滨国立大学的论文,超导约瑟夫森结已经成功实现了多种逻辑电路结构,包括高效快速单通量逻辑结构(ERFQ)、高效SFQ逻辑(eSFQ)、倒易量子逻辑(RQL)、LR偏置RSFQ逻辑和低压RSFQ逻辑(LV-RSFQ)。但这些逻辑都属于非绝热逻辑,虽然凭借超导性,无论这些逻辑单元工作在什么频率,其开关能耗都是恒定的。但考虑到其非绝热逻辑电路的特点,其工作能耗较高,因此并不是超导计算机的最佳选择。事实上,日本研究人员使用的是绝热逻辑电路。所谓绝热逻辑电路,是指电路可以通过将节点电容上的电荷回收到电源上来循环利用能量。与非绝热逻辑电路相比,绝热逻辑电路的功耗大大降低,其能耗只会随着频率的增加而增加,且呈线性状态。另外,在时钟频率方面,绝热电路的最高时钟频率在10GHz左右,可能无法保持绝热状态,但非绝热电路的最高时钟频率可以达到770G Hz,但代价是更高的开关能量。

日本研究人员使用一种叫做绝热量子通量参数逻辑电路(AQFP)的设计。在使用无分流超导约瑟夫森结器件的测试中,在4.2K温度和四相5GHz交流电驱动下,每个逻辑开关的能量仅为1.4zJ每单位,约为1×10的-21次方焦耳。考虑到将周围环境降低到4.2K的能量成本,每个AQFP逻辑开关的能量乘以1000,结果是1.4aJ,只需要1×10焦耳的-18次方。这个数值比目前7nm工艺、0.8V电压的同类电路高出约80倍。事实上,即使考虑散热的能源成本,1000倍的膨胀也是一个非常夸张的数字。由于AQFP工作在超导状态下,其功耗比非超导状态下的电路有几个数量级的优势,所以无论如何比较,仍然能带来巨大而显著的能耗降低。

从AQFP到MANA

在这里,研究人员决定用AQFP制作超导计算机,并给出了用AQFP制作的加法器。研究人员发现,AQFP单元的驱动距离是有限的,只有1mm左右,因为互连线中存在寄生电感,然后必须插入另一个缓冲器作为中继器来放大信号。当然,在真正的芯片制造中,这样的问题可能会得到更好的解决。解决了这些问题后,研究人员带来了一种叫做MANA的微架构,即单片绝热集成架构绝热集成微处理器架构。

研究人员引入MANA架构的目的是为了证明AQFP逻辑也可以进行计算,包括逻辑处理和数据存储等。,所有这些工作都可以基于单一技术、单一逻辑系列和单一芯片来完成。因为这个芯片只是用来验证芯片的逻辑设计和工作可行性,所以包括芯片的IPC和吞吐率在内的指标并没有被科研人员考虑。而且由于这是全新的芯片架构,缺乏系统集成工具,所有的设计都是手工完成,所以整体规模比较小,架构也比较简单。时钟单元采用四相时钟设计,需要程序控制的配合。

MANA的架构图,支持的核心指令等。研究人员给出的。MANA的功能包括指令缓冲、解码、发布、带外部IO访问的RF阶段、执行阶段和回写阶段等。在架构图中,研究人员用不同的颜色来标识法力的不同部分。绿色部分是指令缓冲、存储和发布,包括4×16b缓存、PC取指令和指令解码、棕色RFX寄存器阶段、橙色ALU和位移执行阶段、蓝色数据回写和缓冲阶段。

整个法力过程非常简单。例如,它的寄存器只是一个小寄存器,容量为16×4b,2次读取/1次写入。寄存器和用于保存IO数据,而[19]是一个恒零寄存器。外部IO数据以串行模式进入和,前者包含内存字节数据的高部分,后者包含低部分。数据输入后,控制符号可以表示和是有效数据,可以处理并发送给后面的执行部分。执行部分只有一个4位整数ALU和一个4位移位单元。值得一提的是,这两个单元是串行的,也就是说无论数据需要整数还是位移计算,都必须经过这两个单元。数据经过处理后,交给回写单元进行判断。

整个处理器的架构可以用“简陋”来形容。考虑到MANA只是用来验证AQFP能不能做出超导计算机,这样的逻辑关系和计算架构基本足够了。

基本架构确定后,研究人员可以根据这个基本架构构建包括软件环境、组合逻辑设计、存储器和时钟在内的设计。此外,他们需要集成组件。事实上,由于这种芯片采用了全新的架构,而且它的大部分组件都没有先例可循,所以RD的人员不得不手工制作。超导材料方面,AQPF是由金属铌和绝缘氧化铝制成,所以也叫Nb-AlO材料。铌可以在低于10K的温度下展现超导性,而最终的晶片也应该可以在这个温度下运作。

从法力到第一个测试芯片

MANA从蓝图到实际产品采用了AITHSTP 10KA/CM2NB/ALOX/NB超导芯片制造工艺。不过有点沮丧,因为前期对芯片尺寸的估计比较保守,后期不得不用更大的1cm×1cm的衬底来完成芯片的制作。然而,研究人员发现他们的高频探针设备不支持这么大的尺寸,所以他们不得不改用低频探针来完成功能测试,整个芯片的频率被限制在100KHz以下,即0.1MHz,但为了证明MANA确实可以在高频即GHz下运行,研究人员在后期还单独制作了一个包括ALU和数据传输设备在内的小尺寸设备。这款芯片名为“EX”,尺寸只有2mm×3.5mm,运行频率大于1GHz,已经顺利完成测试。

测试人员将整个芯片放入温度只有4.2K的液氦中进行测试。经过一系列的设置和启动,测试人员开始以较低的频率,也就是100KHz运行MANA芯片,并演示了两个简单的四指令程序,比如将数据加到寄存器中的某个数据,比较两个数据的大小,将寄存器中的数据相加,比如“3+2”、“9-5”、“9-(4+3)”等等。

对于“EX”芯片,由于缺少一些功能,RD人员只能通过一些更简单的方法进行测试,包括临界进位传播测试,其中控制信号设置为固定加法。测试共在12个EX芯片上完成,其中7个芯片能够执行正确的功能,最高工作频率约为1.2 GHz ~ 2.5 GHz。部分芯片输出不稳定或振荡,可能是因为磁通俘获或其他原因。

如何判断超导芯片的功耗和性能

MANA的出现和成功实践证明,用超导材料和AQFP制造芯片是完全可行的。那么,超导芯片和传统芯片在能耗和性能上哪个更好呢?

MANA在RD使用液氦冷却并进行测试。因此,研究人员认为,这样一来,这种芯片对应的计算机设备就不可能出现在移动市场和个人电脑市场,只能用于超大型计算机,也就是超级计算机。

起初,研究人员使用了两个LindeLR280液氦冷却系统,并认为整个系统,包括室内设备的其余部分,需要2MW的功率。接下来,研究人员计算了如果在2MW冷却设备的支持下,使用AQPF芯片实现类似GA100和英特尔北极星芯片的功能,可以冷却多少芯片。为此,RD人员设定了两个假设。a是芯片仿真使用的AQPF数量相当于当前芯片晶体管的数量,B是达到相同性能使用的AQPF数量是当前晶体管的4倍。相比之下,假设B相当保守。

在这个估算中,如果AQPF芯片的总开关量在1.5GHz时为每单位0.2zJ,在5GHz时为每单位1.4zJ,那么AQPF芯片制成的GA100GPU功耗在假设A下为15.2mW,假设B下为60.9mW,假设A下为0.7mW,假设B下为2.9mW,无论是CPU还是GPU,其功耗都明显低于现有产品几个数量级。例如,如果使用GA100芯片,TDP在实际应用中的功耗不会低于350W,比用AQPF材料制作并保持超导状态时的功耗大约高23026倍。因此,即使采用2MW的散热设计,整个系统在假设A下也可以容纳66980个GPU和1429000个CPU,或者在假设b下可以容纳16750个GPU和357100个CPU。

那么,两个LindeLR280液氦冷却系统冷却的AQFP超级计算机能达到怎样的计算水平?以美国能源部的千万亿次计算机为例。这台电脑的散热功耗为20MW,计算能力预计超过1EFLOPS。如果同样冷却功耗的LindeLR280液氦冷却系统设置AQFP超导超级计算机,使用AQPF版本的NVIDIA GA100芯片,A预测下双精度性能可达6.5EFLOPS,B预测下可达1.6EFLOPS。对于英特尔来说,计算性能在A预测下可以达到23.3EFLOPS,在B预测下可以达到5.8EFLOPS。因为这只是一个预测,实际的计算性能更有可能在A和B条件预测中。但即便如此,这已经是一个令人惊讶的业绩数据了。

可能只是一小步,但也能看到未来。

根据日本研究人员所做工作的介绍,超导计算机及相关产品的研究已经从以前的理论进入实用阶段。研究人员开始试制超导芯片并进行简单测试,然后通过实验数据预测超导计算机在超算等效设备中的应用。当然,日本研究人员这次进行的研究还是初步的。这只是超导计算的一小步,但可以窥探的未来是广阔而无限的。

接下来,人们将在超导材料、制造工艺和实现方法上做更多的探索。比如目前使用的金属铌和匹配的液氦,价格太贵。如果使用高温超导材料,会不会得到同样的结果,更容易生产和推广?如果高温超导材料能在液氮温度下超导,并能用于计算机设计,那么超导芯片将迅速崛起。在芯片设计环境和软件包方面也有一系列产品。可想而知,这又是一个巨大的万亿级市场。超导的未来值得期待。

本文来自网络,不代表管理窝立场。转载请注明出处: https://www.guanliwo.com/a/zx/61711.html
上一篇做设计显卡
下一篇 分毫必争的“战场”助你夺得先机
管理窝

作者: 管理窝

这里可以再内容模板定义一些文字和说明,也可以调用对应作者的简介!或者做一些网站的描述之类的文字或者HTML!

为您推荐

评论列表()

    联系我们

    联系我们

    0898-88888888

    在线咨询: QQ交谈

    邮箱: email@wangzhan.com

    工作时间:周一至周五,9:00-17:30,节假日休息

    关注微信
    微信扫一扫关注我们

    微信扫一扫关注我们

    关注微博
    返回顶部