本文介绍了我们对葡萄牙国家铸币厂提出的独特挑战的回应:使用人工智能设计一枚纪念币来庆祝“数字世界”。我们解释了这枚硬币的共同创作过程,从概念化到生产,重点介绍了设计过程、基本原理、遇到的主要障碍以及为应对挑战而进行的技术创新和发展。其中包括开发由对比语言-图像预训练 (CLIP) 和基于机器学习的美学模型指导的进化艺术系统、快速进化系统以及以可铸造格式编码基因型的表示。此次合作生产了一枚限量版 10 欧元银币,国家铸币厂共铸造了 4,000 枚。这枚硬币受到了热烈追捧,两个月内就销售一空。这项工作促进了计算创造力,特别是共同创造力、共同设计和数字艺术,代表了人工智能在钱币学中的应用迈出了重要一步。
费米大面积望远镜等太空伽马射线望远镜已使用单面硅条探测器以高分辨率测量入射伽马射线产生的带电粒子的位置。在康普顿区及以下的能量下,需要单个探测器内的二维位置信息。双面硅条探测器是一种选择;然而,这种技术难以制造,大阵列易受噪声影响。这项工作概述了单片 CMOS 有源像素硅传感器 AstroPix 的开发和实施,用于未来的伽马射线望远镜。基于卡尔斯鲁厄理工学院使用 HVCMOS 工艺设计的探测器,AstroPix 有可能保持中能伽马射线望远镜所需的高能量和角分辨率,同时通过 CMOS 芯片的双重检测和读出功能降低噪声。介绍了 AstroPix 的开发和测试状态以及未来望远镜的应用前景。
语言引导的图像编辑扩散模型的最新进展通常由繁琐的及时工程设计,以精确表达所需的更改。从野外图像示例中对指导的直观替代呼吁,可以帮助用户将他们想象中的编辑栩栩如生。基于现代示例的编辑方法回避利用预先现有的大型文本对图像(TTI)模型所学到的丰富潜在空间,并以精心策划的目标功能来重新接受培训以完成任务。尽管有些有效,但这需要重要的构成资源,并且缺乏与不同的基本模型和任意示例计数的兼容性。在进一步研究中,我们还发现这些技术将用户控制限制在整个编辑区域中仅应用统一的全球变化。在本文中,我们介绍了一个新颖的框架,用于使用现成的扩散模型(称为像素)进行典范驱动的编辑,以通过对编辑进行粒状控制,从而在像素或区域水平上进行调整,从而实现自定义。我们的方法仅在插入期间运行,以促进模仿编辑,使用户能够从动态数量的参考图像或多模式提示中汲取灵感,并逐步合并所有变化,而无需重新调整或调整现有TTI模型。这种细粒度控制的能力开辟了一系列新的可能性,包括对单个对象的选择性修改和指定逐渐的空间变化。我们证明,像素可以很好地编辑高质量的编辑,从而显着改善了定量指标和人类评估。通过使高质量的图像编辑更易于访问,Pixels有可能在易于使用任何开源图像生成模型的情况下向更广泛的受众提供专业级的编辑。
LED 灯带对从哪一侧接收电源没有要求,只要求接收数据。如果情况真的需要,您可以在灯带的输出端连接电池组(如果使用二极管,则带二极管)然后从输入端的 + 和 - 连接为 Arduino 供电(以及串行数据和时钟信号)。但是不建议这样做,因为电压会沿着灯带的长度略有下降,并且 Arduino(应该运行所有功能)会在电池耗尽时更快耗尽。在靠近电池的地方为 Arduino 供电可确保电压正常,从而尽可能长时间保持控制。
本课程介绍了整个历史上的媒体技术与社会转型之间的复杂关系。该跨学科课程对约翰内斯·古滕伯格(Johannes Gutenberg)的印刷媒体发明的演变进行了全面的探索,到当代社交媒体平台的兴起,由马克·扎克伯格(Mark Zuckerberg)等人物开创。通过历史分析,文化研究和媒体理论的融合,学生将研究如何从印刷机到广播,电视和互联网的每种技术进步,都可以重塑沟通实践,文化规范和个人行为。该课程将严格分析这些媒体转型对社会各个方面的影响,包括政治,经济学,教育和人际关系。通过追踪媒体发展的轨迹,学生将深入了解技术创新如何不仅促进信息传播,还影响了身份,意识形态和社会结构的形成。通过案例研究,讨论和研究项目,学生将研究媒体历史上的关键时刻,询问媒体在塑造公共话语中的作用,并评估媒体技术的道德意义。此外,该课程将研究当代问题,例如数字素养,算法偏见,隐私问题以及媒体生产和消费的民主化。在课程结束时,学生将对媒体技术如何催化文化转变并影响社会动态,使他们有能力在越来越相互联系的世界中与媒体进行认真互动。
摘要:云和其他数据伪像经常限制从远程感知的地球观测中检索关键变量。我们训练具有高保真海洋模拟的自然语言处理(NLP)启发的算法,以准确地重建海面温度(SST)领域的掩盖或缺失数据,这是由全球气候观察系统确定的54个基本气候变量之一。我们证明,所谓的模型(称为e nki)反复超过先前采用的钻头技术,最多可以在重建错误中的数量级,同时即使在大多数像素被掩盖的情况下也显示出非凡的性能。此外,对具有至少40%的掩盖百分比的真实红外传感器数据的实验显示出比该传感器的已知不确定性少的重建误差(均方根误差(RMSE)≲0.1K)。我们将E nki的成功归因于NLP的细心性质与现实的SST模型输出相结合,这种方法可以扩展到其他远程感知的变量。这项研究表明,基于E nki或其他类似的先进系统的系统可能会产生最佳解决方案,以减轻气候关键海洋数据集中对迅速变化的地球进行采样的蒙面像素。
最初应用于1996年制药的开发,制药的3D印刷已成为许多研究和相当大的进步的来源。自那个时期以来进行的许多研究集中在探索和完善制药应用的3D打印技术。仍然,近年来,商业规模能力的发展已经大大提高。FDA批准了第一个3D印刷制药,Spritam,这项3D打印的研究,再加上其商业制造规模,证明了3D打印方法可用于大规模制造制药的事实。1
摘要 - 次数是最敏捷的飞行机器人之一。尽管在基于学习的控制和计算机视觉方面取得了进步,但自动无人机仍然依赖于明确的状态估计。另一方面,人类飞行员仅依靠从板载摄像头的第一人称视频流将平台推向极限,并在看不见的环境中坚固地飞行。据我们所知,我们提出了第一个基于视觉的四摩托系统,该系统自动浏览高速的一系列门,而直接映射像素以控制命令。像专业的无人机赛车飞行员一样,我们的系统不使用明确的状态估计,并利用人类使用的相同控制命令(集体推力和身体速率)。我们以高达40 km/h的速度展示敏捷飞行,加速度高达2 g。这是通过强化学习(RL)的基于识别的政策来实现的。使用不对称的参与者批评,可以促进培训,并获得特权信息。为了克服基于图像的RL训练期间的计算复杂性,我们将门的内边缘用作传感器抽象。可以在训练过程中模拟这种简单但坚固的与任务相关的表示,而无需渲染图像。在部署过程中,使用基于Swin-Transformer的门检测器。我们的方法可实现具有标准,现成的硬件的自动敏捷飞行。尽管我们的演示侧重于无人机赛车,但我们认为我们的方法超出了无人机赛车的影响,可以作为对结构化环境中现实世界应用的未来研究的基础。
摘要 - 随着城市化的加速和车辆数量的增加,对有效的停车管理系统的需求也会增长。本研究介绍了基于Python的停车空间检测应用程序的创建。该申请的目标是在指定的停车区内提供空置停车位的瞬时数据,从而完善停车经验并减轻交通拥堵。中央元素包括一个以用户为中心的接口,可促进各种设备之间的平稳互动,停车场布局的图形描述以及有关空间可用性的实时更新。核心功能在于使用图像处理技术和计算机视觉算法查明可用的停车位。摄像机集成和视频镜头分析根据预定义的标准确定空白空间。强大的后端逻辑保持了停车空间状态的动态数据库,并核对来自多个来源的冲突输入。该应用程序可以包装以在各种平台上分发,从而促进可访问性。持续改进和用户反馈机制可以迭代增强,以确保应用程序的功能随着时间的推移而发展。
摘要:随着对沉浸式体验的需求的增长,显示器的大小和更高的分辨率越来越接近眼睛。但是,缩小像素发射器降低了强度,使其更难感知。电子纸利用环境光进行可见性,无论像素大小如何,都可以保持光学对比度,但无法实现高分辨率。我们显示了由WO 3纳米散件组成的大小至〜560 nm的电气可调节元像素,当显示大小与瞳孔直径匹配时,可以在视网膜上进行一对一的像素 - 示波器映射,我们将其称为视网膜电子纸。我们的技术还支持视频显示(25 Hz),高反射率(〜80%)和光学对比度(〜50%),这将有助于创建最终的虚拟现实显示。主要文本:从电影屏幕和电视到智能手机以及虚拟现实(VR)耳机,显示器逐渐越来越靠近人眼,具有较小的尺寸和更高的分辨率。随着展示技术的进步,出现了一个基本问题:显示大小和分辨率的最终限制是什么?如图1a,为了获得最沉浸和最佳的视觉体验,该显示应与人瞳孔的尺寸紧密匹配,每个像素与视网膜中的光感受器单元相对应。人类视网膜包含约1.2亿光感受器细胞。假设瞳孔直径为8毫米,理想的像素大小为〜650 nm,导致分辨率约为每英寸40,000像素(PPI)。随着像素尺寸收缩,主流发射显示器正在接近其物理极限。这个理论像素大小接近人眼的分辨率极限,代表了显示技术的最终边界,我们将其命名为“视网膜”显示。较小的像素尺寸降低了发射极尺寸,从而导致亮度显着下降,从而使它们越来越难以通过肉眼感知(1,2)。当前,市售的智能手机显示像素通常约为60×60μm²(〜450 ppi),比最终视网膜显示所需的理论尺寸大约10,000倍。已经在这个规模上,肉眼很难感知,尤其是在