[深度学习和神经网络处理器设计] 深度学习算法最近受到了极大的关注。GPU 被广泛用于运行神经网络,但由于其能效低,不适合集成到智能手机、可穿戴设备和无人机等移动设备中。我们专注于高性能和节能的专用神经网络处理器的设计和实现。为此,我们正在研究针对神经网络优化的数据路径和内存架构、处理各种神经网络模型的灵活硬件架构以及硬件友好的神经网络算法。最后,基于我们的想法设计、制造和测试了神经网络处理器芯片。我们正在最受认可的会议上进行最先进的研究。[深度学习的内存处理] 传统的冯诺依曼架构在处理以内存为主的深度学习算法时严重受到内存瓶颈问题的困扰,因为大量数据必须通过窄总线从主内存传输到处理器。同时,遵循非冯·诺依曼架构的内存处理(PIM)技术将数据处理在内存中,只将必要的数据传输到处理器,降低了内存传输的能耗成本。因此,内存处理范式是高效处理大规模深度神经网络的重点方向和下一代平台。
主要关键词