微软公司研发人员将ProjectNatick的装机多台服务器的机架安装在一个密封水舱中,沉入了苏格兰奥克尼群岛海岸附近的海底运行了两年的时间。与ProjectNatick项目一样,浸入低沸点液体中的几十台服务器运行真正的生产软件,这是解决一系列问题的一种初始方法,然后再进行大规模部署以测试其冷却设计对服务器可靠性的运行影响。
微软数据中心高级开发小组副总裁ChristianBelady在接受行业媒体采访时表示,这一阶段旨在测试服务器的基本功能和可操作性。浸入式冷却技术将以何种方式影响服务器性能?数据中心技术人员如何轻松地运营和维护浸入冷却液中的服务器?这些是他的开发团队在现阶段研究的问题。
这个实验项目的规模比ProjectNatick水下数据中心的规模要小得多,但是这个实验解决的关键问题将决定未来大规模计算的发展轨迹。通过将更多、更小巧的晶体管集成在芯片中,芯片制造商希望能够遵循摩尔定律,每两年将处理器的速度提高一倍而不增加功耗。Belady带领研究团队试图通过在数据中心中运行更多的服务器,来探究是否能够利用摩尔定律的好处。
他说:“数据中心基础设施是否也能遵循摩尔定律?我们希望将研究和观察数据中心整体足迹是否遵循摩尔定律进行扩展。”
对于一直在关注数据中心领域发展的业界人士来说,那么可能会认为这个实验项目与谷歌公司几年前部署液冷人工智能硬件相类似。但对于运行要求更苛刻工作负载的功能最强大的计算机,微软公司并未考虑使用液体冷却技术,只是将其看作提高数据中心处理负载能力的一种方式,希望其速度的提高遵循摩尔定律。
Belady说:“由于物理特性的限制,我们如今不再奢望通过不断改进芯片来提升更高的性能。”
微软公司部署中使用的这项技术是计算机设计人员可以使用的几种液体冷却类型之一。在两相浸入式冷却系统中,采用可以在低温下沸腾(冷却液的沸点比水低90~122华氏度)的工业合成液体进行冷却,冷却液在与高温的处理器接触时会变成蒸汽将热量带走,这些蒸汽上升之后,与容器中的冷凝器接触时将会转化成液体,然后滴落下来再重复这一循环。
Belady强调说,微软公司对于大规模部署的服务器采用液体冷却技术仍然持怀疑态度。他和该公司首席工程师HusamAlissa和服务器和基础设施开发管理与工程高级总监BrandonRubenstein等研发人员在几年前就开始研究液体冷却技术。他们了解和观察处理器设计的趋势,希望在芯片的功耗达到空气冷却技术处理的极限时,采用可用的替代的冷却方案。Belady说:“虽然现在还没有达到极限,但是将会很快出现。”
他预计,完全采用液体冷却技术的数据中心将在5到10年内成为主流,这并不只是在超级计算机和比特币采矿领域中看到的现象。即使五年后所有服务器都可以使用液冷技术,但仍然等待多年的时间才能淘汰空气冷却技术。
微软公司数据中心高级开发团队的首席硬件工程师HusamAlissa在2019年OCP峰会上展示了使用多种液体冷却技术的实验结果,该峰会是OpenComputeProject在圣何塞举行的2019年度超大规模数据中心硬件和基础设施设计会议。他在演讲中介绍了两相浸没冷却和单相浸没冷却(碳氢化合物流体在硬件和热交换器之间循环)和冷却板(主板上的传统散热器由扁平的矩形金属导热片代替)等技术的应用。
Belady表示,在浸入式和冷板设计中都发现了很多相似之处,例如都允许运行比空气冷却要热得多的服务器,并且都可以摒弃服务器风扇。浸入式冷却技术真正新颖的一个方面是能够冷却更多的设备。
Belady说,“我们仍然对这个发展方向持怀疑态度,但在未来将会看到空气冷却和液体冷却技术并存。现在重要的是,服务器设计师已经开始利用液体冷却技术。在采用液体冷却技术之后,数据中心PUE值将有可能接近于1。”