抽象准确地定位了3D声音源并估算其语义标签(其中可能不可见,但假定源位于场景中物体的物理表面上)具有许多真实的应用,包括检测气体泄漏和机械故障。在这种情况下,视听弱相关性在得出创新方法时提出了新的挑战,以回答是否或如何使用交叉模态信息来解决任务。朝着这一目标,我们建议使用由针孔RGB-D摄像头和共面四通道麦克风阵列(MIC-ARRAY)组成的声学相机钻机(MIC-Array)。通过使用此钻机来记录来自多视图的视听信号,我们可以使用跨模式提示来估计声源3D位置。特别是,我们的框架Soundloc3d将任务视为集合预测问题,集合中的每个元素都对应于潜在的声源。鉴于视听弱相关,首先是从单个视图mi-crophone阵列信号中学到的集合表示,然后通过主动合并从多视rgb-d图像揭示的物理表面提示来确认。我们证明了Soundloc3d在大型模拟数据集上的效率和优势,并进一步显示了其对RGB-D测量不准确性和环境噪声干扰的鲁棒性。
SoundHound(Nasdaq:Soun)是对话智能的全球领导者,提供了语音和对话的AI解决方案,使企业为客户提供了令人难以置信的体验。基于专有技术,Soundhound的声音AI通过零售,金融服务,医疗保健,汽车保健,汽车,智能设备和餐馆的产品创建者和服务提供商提供一流的速度和准确性,并通过开创性的AI-Driend驱动产品(如智能订购,智能订购,动态驱动器thru和Amelia aiia ai ai ai ai ai ai ai agents)。与SoundHound Chat AI一起,一位强大的语音助手,具有集成的生成AI,Soundhound为数百万的产品和服务提供了动力,并且每年为世界一流的业务处理数十亿美元的互动。www.soundhound.com。
共同创造是一种独特的艺术情境,人与计算机互动,对互动性、可操控性和个性化提出了挑战。我们提出了一种新的共同创作音乐创作方法,我们在参加“2021 年人工智能歌曲大赛”时采用了这种方法,这是一项涉及人工智能 (AI) 的国际音乐比赛。我们对人工智能创作方法进行了个性化,以适应作曲家的需求和期望。作曲家与不同人工智能方法之间的互动贯穿整个作曲过程,包括通过基于机器学习的人工智能的数据共享和基于规则的人工智能的知识共享来生成旋律、和弦进行、整体结构和纹理变化。我们描述了这些人工智能方法以及作曲家如何与它们互动:人工智能方法的个性化使作曲家能够在保持原有风格的同时探索新的音乐领域,人工智能音乐生成“听起来就像是专门为他生成的”。歌曲“The last moment before you fly”在本次比赛中排名第三,评委强调了这首歌的“个人感觉”。我们在这里讨论这些方法如何为使用人工智能和个性化的新共同创作方法开辟道路。
1 太平洋西北研究所,美国华盛顿州西雅图 2 华盛顿大学,美国华盛顿州西雅图 3 西华盛顿大学香农角海洋中心,美国华盛顿州安娜科特斯 4 波特兰州立大学环境科学与管理系,美国俄勒冈州波特兰 5 科罗拉多学院,美国科罗拉多州科罗拉多斯普林斯 6 加利福尼亚大学海洋科学系,美国加利福尼亚州圣克鲁斯 7 俄勒冈大学分子生物学研究所,美国俄勒冈州尤金 8 华盛顿大学基因组科学系,美国西雅图 9 自然资源部,斯蒂拉瓜米什部落,美国华盛顿州阿灵顿 10 自然与文化资源部贝类项目,华盛顿州图拉利普部落,美国图拉利普 11 华盛顿大学华盛顿海洋酸化中心,美国华盛顿州西雅图 12 爱德华王子岛渔业、旅游、体育与文化部,加拿大爱德华王子岛 * 这些作者的贡献相同
2024 年,Drake 发布了两首引起轰动的新歌。两首歌都针对 Kendrick Lamar,他们争夺最佳说唱歌手的头衔。4 “Push Ups” 5 是 Drake 的第一首“diss”曲目,非常粗俗——贬低了 Lamar 的身高——以至于人们认为这是别人制作的 AI 深度伪造。6 Drake 很快就毫无疑问地证明了这是他的作品。7 几天后,Drake 又推出了另一首 diss 曲目“Taylor Made Freestyle”。8 这一次,Drake 更进一步,使用 AI 模仿已故的 Tupac Shakur(也称为“2Pac”)和 Snoop Dogg,似乎都在嘲笑 Lamar。9 AI 语音克隆让粉丝们“震惊”。10 在他的手机“爆炸”后,人们提醒他 Drake 的歌曲,Snoop Dogg 发布了一段视频,问道:“他们做了什么?什么时候?怎么做的?你确定吗?” 11 然后,他无奈地说:“我要回去睡觉了。晚安。” 12
我们多久更新一次产品的碳足迹?我们推出了新产品后,我们会跟踪和审核设备所有生命周期阶段的碳排放。,当设备的估计碳足迹增加10%或由于改变我们的模型输入的新信息时,我们会更新产品可持续性事实表。亚马逊控制范围内的这些更改包括对产品设计的调整,产品能源使用情况的变化以及运输数据的更新。为了确保我们对新产品进行公平比较,我们重新计算了它们的比较产品的足迹,并将其纳入了我们的方法和排放因素中。本报告是信息指南,不应依靠用于产品比较。在我们的完整方法论中,了解了有关我们的产品碳足迹方法和局限性的更多信息。
摘要:近年来,光子计算的显着进步突显了需要光子记忆,尤其是高速和连贯的随机记忆。应对实施光子记忆的持续挑战才能充分利用光子计算的潜力。基于刺激的布里鲁因散射的光子传声记忆是一种可能的解决方案,因为它一致地将光学信息传递到高速下的声波中。这样的光声内存具有巨大的潜力,因为它满足了高性能光随机记忆的关键要求,因为它的相干性,芯片兼容性,频率选择性和高带宽。但是,由于声波的纳秒衰减,到目前为止,迄今为止的存储时间仅限于几纳秒。在这项工作中,我们通过实验增强光声内存的固有存储时间超过1个数量级,并在存储时间为123 ns后连贯地检索光学信息。这是通过在4.2 K处高度非线性纤维中使用光声记忆来实现的,从而使内在的声子寿命增加了6倍。我们通过使用直接和双同性恋检测方案测量初始和读数光学数据脉冲来证明我们的方案能力。最后,我们分析了4.2 - 20 K范围内不同低温温度下光声记忆的动力学,并将发现与连续波测量值进行了比较。关键字:布里渊散射,光子神经形态计算,光学记忆,非线性光学,低温■简介延长的存储时间不仅对光子计算,而且对需要长声子寿命的Brillouin应用程序,例如光声过滤器,真实时延迟网络和微波光子学中的合成器。
心音听诊在先天性心脏病的诊断中具有重要意义。然而,现有的心音诊断 (HSD) 任务方法主要局限于几个固定的类别,将 HSD 任务视为一个严格的分类问题,与医疗实践不完全相符,并且只能向医生提供有限的信息。此外,这种方法不利用超声心动图报告,而超声心动图报告是诊断相关疾病的黄金标准。为了应对这一挑战,我们推出了 HSDreport,这是 HSD 的新基准,它要求直接利用从听诊中获得的心音来预测超声心动图报告。该基准旨在将听诊的便利性与超声心动图报告的全面性结合起来。首先,我们为这个基准收集了一个新数据集,包括 2,275 个心音样本及其相应的报告。随后,我们开发了一个基于查询的知识感知转换器来处理这项任务。目的是利用医学预训练模型的功能和大型语言模型 (LLM) 的内部知识来解决任务固有的复杂性和多变性,从而提高方法的稳健性和科学有效性。此外,我们的实验结果表明,我们的方法在检测心音中的关键异常方面明显优于传统的 HSD 方法和现有的多模态 LLM。
数据增强已证明对通过深度学习提高准确性非常有益。在这里,我们探讨了数据增强对Birnn-CNN分类器的通用能力的影响。总体而言,总共使用了2595个ECG和PCG数据文件进行培训,因此相对于报告的案件增加了7倍。为了显示增强对HSD任务的有效性,表2显示了在有或没有数据扩展的情况下获得的结果。可以看出,ECG和PCG特征的融合以及增强方法显示,相对于单独的每种模式(即表2),就灵敏度和特异性而言,相对于每种模式的融合(即表2)。对于ECG数据集,17、132和1%的迹象,已通过提出的方法(包括融合加上增强)观察到仅在精度,敏感性和特异性方面,已经观察到了1%的迹象。相反,我们观察到
这一年尤其特殊,因为在美国大陆可以观测到两次日食。2023 年 10 月 14 日,新墨西哥州白沙导弹靶场 (WSMR) 非常接近日环食路径的顶峰,而 2024 年 4 月 8 日,弗吉尼亚州瓦洛普斯岛观测到近 80% 的日全食。六枚 Terrier-Black Brant 火箭被发射,用于研究日食期间的电离层,每个位置发射三枚。安柏瑞德航空大学的 Barjatya 博士是首席研究员,所有运载工具和有效载荷均表现正常。为了实现多点测量,有效载荷使用了最近开发且符合飞行要求的可弹射子有效载荷。探空火箭计划的首项任务是 2024 年春季在阿拉斯加州 Poker Flat 研究靶场 (PFRR) 进行的太阳耀斑活动。两个有效载荷,之前都用于不同的研究,聚焦光学 X 射线太阳成像仪 (FOXSI) 4 和高分辨率日冕成像仪耀斑 (Hi-C Flare) 已准备就绪,以应对太阳耀斑事件。PFRR 延长了发射窗口,每天都有发射机会。科学家使用 GOES X 射线数据监测太阳活动,并能够在 M 级耀斑期间发射。该活动的目标是获取太阳耀斑的多尺度、多波长观测数据,并为验证耀斑优化仪器提供可能性。