2 图形处理单元在加速计算方面的新用途通过提供针对算法要求量身定制的专门工作流程,彻底改变了高性能科学计算领域。 4 随着摩尔定律时代接近尾声,许多新型非冯·诺依曼处理器正在成为潜在的计算加速器,包括基于神经形态计算、张量代数和量子信息原理的处理器。虽然这些新处理器的开发正在不断成熟,但预计对加速计算的潜在影响将是深远的。我们讨论了不同的处理模型如何推动关键科学范式的计算:机器学习和约束满足。 9 值得注意的是,每一种新的处理器类型都采用了根本不同的计算模型, 10 这就引发了如何在应用程序的设计和实施中最好地使用这些处理器的问题。 11虽然许多处理器都是针对特定领域开发的,但自旋玻璃 12 模型和神经网络的普及为多功能应用提供了途径。这也暗示了将下一代处理单元集成到未来高性能计算 14 系统所需的基础设施。15
我第一次接触计算机是在 1966 年,当时我参加了埃文斯维尔学院(印第安纳州南部的一所小型私立学校)的一门(为期一季度)二年级数学课程(因为当时还没有计算机科学系)。这台机器是 IBM 1620,配备了(当时很现代的!)晶体管和正好 20,000 个十进制数字的磁芯存储器。它是用机器语言(不是汇编语言!)编写的,使用两个十进制数字操作码、十进制地址和通过标记内存位置内容定义的字段。它没有寄存器,也没有硬件十进制算术指令(算术是由软件完成的,存储乘法表并进行查找!)。所有 I/O 都是通过 80 列 IBM 打孔卡、行式打印机和只有学院管理部门才能访问的旋转磁盘进行的。我用低级机器语言编写代码没有问题,但使用 IBM 026/029 打卡机时却遇到了很大困难,它经常卡住、损坏卡片,并且随机无法在卡片顶部打印打卡的字符。我记得花在将程序打到卡片上的时间比编写程序的时间还多!下一季度的计算课程是关于数值方法(更多的是数学而不是计算机科学),使用非常早期的(NCE FORTRAN)编译器,更像现代计算,但有一个很大的区别——20,000 个十进制数字内存和唯一的输入设备是读卡器。任何严肃的数值计算都必须分阶段进行,中间结果打入卡片,然后读回以供下一阶段使用。请注意,加载所有
我第一次接触计算机是在 1966 年,当时我在印第安纳州南部的一所小型私立学校埃文斯维尔学院上了一门(为期一季度)二年级数学课(因为当时还没有计算机科学系)。这台机器是 IBM 1620,配备了(当时很现代的!)晶体管和正好 20,000 个十进制数字的磁芯存储器。它是用机器语言(不是汇编语言!)编写的,使用两个十进制数字操作码、十进制地址和通过标记内存位置内容定义的字段。它没有寄存器,也没有硬件十进制算术指令(算术是由软件完成的,存储乘法表并进行查找!)。所有 I/O 都是通过 80 列 IBM 打孔卡、行式打印机和只有学院管理部门才能访问的旋转磁盘进行的。我用低级机器语言编写代码没有问题,但使用 IBM 026/029 打卡机时却遇到了很大困难,它经常卡住、损坏卡片,并且随机无法在卡片顶部打印打卡的字符。我记得花在将程序打到卡片上的时间比编写程序的时间还多!下一季度的计算课程是关于数值方法(更多的是数学而不是计算机科学),使用非常早期的(NCE FORTRAN)编译器,更像现代计算,但有一个巨大的区别——20,000 个十进制数字内存和唯一的输入设备是读卡器。任何严肃的数值计算都必须进行