在资源受限环境(例如微控制器和AI加速器)中,对人工智能(AI)应用的需求不断增长,提出了重大挑战。在这些平台上部署深度学习模型对于将AI扩展到边缘计算,可穿戴设备和智能眼镜至关重要。但是,现有模型通常是为通用硬件设计的,导致资源约束设置的效率低下。这项研究重点是优化嵌入式系统的深度学习模型,特别关注智能眼镜应用。通过利用模型压缩,量化和神经体系结构搜索等技术,目标是在满足这些平台的严格约束时确保高性能。该研究将强调软件优化和与硬件设计人员的合作,以确保与新兴AI加速器的无缝集成。目标是开发能够在低功率设备上运行的高效,健壮和准确的模型,从而在智能眼镜中实现实时AI应用程序。这些进步将支持新颖的用例,例如凝视估计,意图识别和增强现实,提高可用性和可访问性,同时减少对云基础架构的依赖。这项研究解决了对可伸缩,可访问的AI的关键需求,
简而言之,电位计的分辨率是相邻抽头位置之间差异的度量。在比率应用中,这对应于电压阶跃,而在电阻应用中,分辨率更接近于增量电阻。理论分辨率可以定义为输出比率可调节的灵敏度的测量值,相当于抽头数(忽略零抽头)的倒数,以百分比表示。可以设置的精度通常称为可调性或可设置性。在标准 XDCP 上,硬件设计人员可以使用 256、124、32 或 16 个抽头,分别提供 1.01%、1.59% 和 3.23% 的分辨率。这些分辨率在各个抽头之间大致恒定(尽管相对线性度更保守地指定为 20%),并且电位计在滑动片移动时表现出单调行为。对于四路器件(例如 X9241A),可以使用软件命令实现内部级联,最多允许 253 个抽头(0.39% 分辨率)。在新一代 XDCP 上,使用双 128 抽头和双 256 抽头器件甚至可以实现更高的分辨率。但是,对于标准 XDCP,使用外部硬件或使用某些软件方案已经可以实现极高的分辨率(请参阅 Intersil 应用笔记 AN43“软件实现高分辨率非易失性数字电位计”)。类似的分析将成立
1,4,5 3-4 1 可在任一学期修读。 2 自由选修课总计至少须达到 12 个学分。 3 有关满足专业发展 - 技术问题与解决方案要求的课程列表,请参阅注册处“学术规划”网页上的“专业发展课程”链接。该课程应在顶点设计课程之前完成。 4 建议学生使用选修课来形成专业。请参阅 ECSE 网页以获取专业列表。 5 满足技术和限制选修课的综合要求时,不得使用超过一门独立学习课程。 6 可用 ENGR-1100 工程分析简介代替。 7 希望将 ENGR-1600 材料科学作为数学/科学选修课的学生必须选修 CHEM-1100。 8 每年秋季和春季学期提供。学生应在满足先决条件后选修这些课程。至少 128 个学分 限制选修课 任何 3 或 4 个学分的课程,名称为 ECSE-4xxx 或 ECSE-6xxx。 技术选修课 任何 3 或 4 个学分的工程、数学或科学课程,4000 级或更高。 实验室选修课 ECSE 4090 机电一体化 ECSE-4130 电力工程实验室 ECSE-4220 VLSI 设计 ECSE-4760 实时控制与通信 ECSE-4770 计算机硬件设计 ECSE-4790 微处理器系统 ENGR-4710 制造过程与系统实验室 I
摘要 —ZuSE-KI-Mobil (ZuKIMo) 是一个国家资助的研究项目,目前处于中期阶段。ZuKIMo 项目的目标是开发一个新的片上系统 (SoC) 平台和相应的生态系统,以实现具有特定要求的高效人工智能 (AI) 应用。借助 ZuKIMo,我们专门针对移动领域的应用,即自动驾驶汽车和无人机。初始生态系统由来自德国学术界和工业界的七个合作伙伴组成的联盟建立。我们围绕一种新颖的 AI 加速器设计开发 SoC 平台及其生态系统。可定制的加速器从头开始构思,以满足雄心勃勃的用例所产生的功能和非功能性要求。计划于 2023 年采用 22 nm FDX 技术进行流片。除了片上系统硬件设计本身之外,ZuKIMo 生态系统还旨在提供软件工具,以便轻松部署新用例和硬件-CNN 协同设计。此外,在安全关键型应用(如我们的移动用例)中,AI 加速器必须满足安全要求。因此,我们研究了用于深度神经网络 (DNN) 故障分析的新设计方法,并介绍了我们用于 AI 加速器的新冗余机制。索引术语 — 片上系统、AI 加速器、开发方法、故障模拟、功能安全
摘要:本文介绍了一种结合硬件和软件的定制系统,该系统可感知表演者身体因肌肉收缩而产生的生理信号,并将其转换为计算机合成的声音。我们的目标是在该领域研究历史的基础上开发一个完整的集成系统,供非专业音乐家使用。我们描述了 Embodied AudioVisual 交互肌电图,这是一个端到端系统,涵盖音乐家身体上的可穿戴传感、基于定制微控制器的生物信号采集硬件、基于机器学习的手势到声音映射中间件和基于软件的粒度合成声音输出。一种新颖的硬件设计以最少的模拟预处理将来自肌肉的肌电图信号数字化,并在音频信号处理链中将其作为类兼容的音频和无线 MIDI 接口处理。映射层在强化学习配置中实现了交互式机器学习工作流程,并可以将手势特征映射到多维信息空间中的听觉元数据。该系统调整了现有的机器学习和合成模块,使其与硬件配合使用,形成了一个集成的端到端系统。我们通过一系列公开演讲和一系列音乐从业者的音乐会表演探索了其作为数字乐器的潜力。
摘要:本文介绍了一种结合硬件和软件的定制系统,该系统可感知表演者身体因肌肉收缩而产生的生理信号,并将其转换为计算机合成的声音。我们的目标是在该领域研究历史的基础上开发一个完整的集成系统,供非专业音乐家使用。我们描述了 Embodied AudioVisual 交互肌电图,这是一个端到端系统,涵盖音乐家身体上的可穿戴传感、基于定制微控制器的生物信号采集硬件、基于机器学习的手势到声音映射中间件和基于软件的粒度合成声音输出。一种新颖的硬件设计以最少的模拟预处理将来自肌肉的肌电图信号数字化,并在音频信号处理链中将其作为类兼容的音频和无线 MIDI 接口处理。映射层在强化学习配置中实现了交互式机器学习工作流程,并可以将手势特征映射到多维信息空间中的听觉元数据。该系统调整了现有的机器学习和合成模块,使其与硬件配合使用,形成了一个集成的端到端系统。我们通过一系列公开演讲和一系列音乐从业者的音乐会表演探索了其作为数字乐器的潜力。
审查深度脑刺激(DBS)的抽象目的是在包括帕金森氏病,肌张力障碍,震颤和图雷特综合征在内的多种运动障碍中建立的治疗方法。在这篇评论中,我们将审查并讨论最新发现,包括但不限于临床证据。最新发现的新DBS技术包括新型硬件设计(电极,电缆,植入脉冲发生器),可实现新的刺激模式和适应性DBS,可为患者病情的瞬间变化量身定制潜在的刺激。更好地理解运动障碍的病理生理学和功能解剖学对于研究DBS对脑脑运动区域,Meynert核心核的影响的影响至关重要。最终,神经外科实践通过更准确的目标可视化或组合靶向进行了改善。一个上升的研究领域强调桥接神经调节和神经保护。总结DBS治疗的最新进展带来了更多的可能性,可以有效治疗运动障碍的人。未来的研究将着重于改善自适应DB,领导更多有关新目标的临床试验,并探索神经调节对神经保护作用。
文档修订 3.2 2010 年 9 月 22 日 版权所有 1996-2010 Alcorn McBride, Inc. 保留所有权利。我们已尽一切努力确保本手册所含信息的准确性以及 Alcorn McBride Digital Binloop 硬件和软件的可靠性。但有时可能无法检测到错误。如果您发现错误,请告知我们,以便我们为其他错误更正。Alcorn McBride 欢迎对其文档的内容和布局提出意见和建议。此处描述的应用程序仅用于说明目的。Alcorn McBride Inc. 对这些产品的使用不承担任何责任或义务,并且不声明或保证这些产品在未经进一步测试或修改的情况下适用于特定应用。Alcorn McBride 产品不适用于故障可能导致人身伤害的应用。使用或销售 Alcorn McBride 产品用于此类应用的客户自行承担风险,并同意对因此类不当使用或销售而导致的任何损害向 Alcorn McBride 进行全额赔偿。Alcorn McBride Inc. 保留更改这些产品的权利,恕不另行通知,以改进其设计或性能。Digital Binloop™ 和 A/V Binloop™ 是 Alcorn McBride Inc. 的商标,保留所有权利。Dolby 是 Dolby Laboratories 的商标。CobraNet 是 Cirrus Logic 的商标。硬件设计:Jim Carstensen、Scott Harkless 和 Joy Burke 固件设计:Jim Carstensen、Scott Harkless 软件设计:Adam Rosenberg 文档:Jim Carstensen、Scott Harkless、John Conley 和 Adam Rosenberg 机械设计:Martin Chaney
摘要 — 随着基于脉冲的深度学习推理应用在嵌入式系统中的增多,这些系统倾向于集成神经形态加速器(如 µ Brain)以提高能源效率。我们提出了一种基于 µ Brain 的可扩展多核神经形态硬件设计,以加速脉冲深度卷积神经网络 (SDCNN) 的计算。为了提高能源效率,内核在神经元和突触容量方面设计为异构的(即大核与小核),并且它们使用并行分段总线互连,与传统的基于网格的片上网络 (NoC) 相比,这可以降低延迟和能耗。我们提出了一个名为 SentryOS 的系统软件框架,将 SDCNN 推理应用程序映射到所提出的设计中。SentryOS 由一个编译器和一个运行时管理器组成。编译器利用大和小 µ Brain 内核的内部架构将 SDCNN 应用程序编译成子网络。运行时管理器将这些子网络调度到内核上并流水线执行以提高吞吐量。我们用五个常用的 SDCNN 推理应用程序评估了所提出的大多核神经形态设计和系统软件框架,并表明所提出的解决方案可降低能耗(37% 至 98%)、降低延迟(9% 至 25%)并提高应用程序吞吐量(20% 至 36%)。我们还表明 SentryOS 可以轻松扩展到其他脉冲神经形态加速器,例如 Loihi 和 DYNAP。索引术语 — 神经形态计算、脉冲深度卷积神经网络、多核、嵌入式系统、µ Brain
项目文档第 1 组 II 目录 1. 执行摘要 1 2. 项目描述和背景 2 2.2. 动机 3 2.3. 目标和目的 4 2.4. 要求和规范 5 2.5. 框图 7 3. 相关项目研究 9 3.1. 自动售货机和相关技术 9 3.2. 光学元件 12 3.3. 电子元件 20 3.4. 软件相关组件 41 3.5. 机器学习 52 3.6. 其他感兴趣的组件 61 4. 项目标准和设计 67 4.1. 硬件标准和约束 67 4.2. 软件标准和约束 70 5. ChatGPT 和类似算法 81 5.1. ChatGPT 81 5.2. 类似算法 84 6. 硬件设计 86 6.1.电源子系统 86 6.2. ESP-WROOM-32 88 6.3. GPIO 外设 90 6.4. 完整原理图 95 6.5. 外壳设计 96 7. 软件设计 97 7.1. ESP32-WROOM-32 97 7.2. LED 软件设计 98 7.3. 前置红外传感器设计 98 7.4. LCD 设计 99 7.5. 风扇系统设计 101 7.6. 物体检测设计 102 8. 光学设计 106 8.1. 摄像头镜头系统设计 106 8.2. 红外系统设计 112 9. 测试和质量保证 114 10. 管理内容 121 10.1. 里程碑 121 10.2. 物料清单 122 11. 结论 124