正文复制

把准高性能计算时代脉动
高性能计算被视为计算机科学与工程的“皇冠”。近年来,各国频繁启动国家层面的研发计划。所谓的高性能计算,其与一般计算相比,本质特征在于“算力聚合”,它的计算能力比一般计算机的计算能力要高出一个数量级。高性能计算通过聚合结构,使用多台计算机和存储设备,以极高速度进行计算,帮助人类探索科学、工程及社会领域中的一些世界级重大难题。
高性能计算的发展历史。1964年控制数据公司推出了CDC6600计算机。该型号计算机由西摩·克雷设计,综合采用了当时多项领先的技术,包括硅晶体管、多功能单元并行技术、专用I/O处理机等。CDC6600每一秒能执行三百万条指令,与当时其他型号的计算机相比,至少快3倍以上,其在算力的统治地位保持了5年之久。自此,高性能计算成为一个新术语,CDC6600通常被认为是第一台高性能计算机,西摩·克雷也被公认为“高性能计算机之父”。
自诞生以来,高性能计算的发展可以大致划分为四个阶段。
第一个阶段是“向量机时代”,伴随着1975年Cray-I计算机的问世,向量机成为高性能计算机的主流,向量部件、向量流水线、向量化、向量编译等向量化技术蓬勃发展。
第二个阶段是“并行处理时代”,在20世纪80年代后期,使用分布式内存的大规模并行计算在高性能计算领域大行其道。思维机器公司在1985年推出的CM-1是一台典型的大规模并行计算机,每个CM-1微处理器都配有4K比特随机存取存储器,基于超立方体的阵列被设计为同时对多个数据点执行相同的操作,即以单指令、多数据方式执行任务。CM-1最高可装配65536个独立处理器,每个处理器都非常简单,一次处理一位。在这个阶段中,并行向量机、对称多处理机、非一致性存储结构等技术迅速发展。
第三个阶段是“微处理时代”,在2000年初,基于微处理机的集群系统在高性能计算领域声名鹊起。与其他并行处理系统的核心区别在于,集群没有专用的、定制的硬件或软件,而是由廉价的个人计算机通过高速网络连接构成。在这一时期,多级互联网络、胖树和网格等成为新的研究热点。
第四个阶段是“异构混合与云计算时代”,2005年以来,图形处理单元(GPU)已成为一个强大的计算平台,并已成功用于加速许多科学工作负载。通常,应用程序的计算密集型任务被卸载到GPU,GPU充当CPU的并行协处理器。在实际应用中,高性能计算机系统由许多节点组成,每个节点包含2到32个传统CPU和1到6个GPU,通常还包括一个高速网络和一个数据存储系统。
高性能计算扮演着越来越重要的角色。高性能计算的发展已历经了近1个甲子,从当初的M级计算到今天的E级计算,其计算速度已经增长了12个数量级。伴随着算力的不断增长,高性能计算在解决科学、工程与社会的“大挑战”过程中也扮演着越来越重要的角色。从宇宙学中天文N体模拟到高分辨率全球海洋模式,从高能物理中的格点量子色动力学到化学中的第一性原理计算,从全球气候预测到基因测序,从新材料研发到新药物研制,无一不依赖高性能计算。
可以说,高性能计算的发展日新月异,应用覆盖了人类经济社会的各个方面,要想窥高性能计算发展之全豹,可以透过“一榜一奖”管而窥之。这里所谓的“一榜”指的是TOP500榜单,“一奖”指的是戈登·贝尔奖。
TOP500榜单始于1993年,每年发布两次,汇编了世界前500台算力最强的计算机及其一些主要性能指标,其排名依据Linpack基准测试的结果。计算机的算力强弱通过求解密集线性方程组的速度来体现,通常以每秒浮点运算次数为重要的性能衡量指标。在2023年11月发布的最新TOP500榜单中,“前沿系统”(FrontierSystem)蝉联榜首,其最高性能达到E级(1.194EFLOPS)。“前沿系统”搭载了基于最新的惠普CrayEX235a架构的AMDEPYC64C2GHz处理器,共装配有近870万枚CPU和GPU核。