dMel: Speech Tokenization Made Simple
大型语言模型通过利用自我监督的大量文本数据预处理来彻底改变了自然语言处理。受到这一成功的启发,研究人员研究了复杂的语音令牌化方法,以离散连续的语音信号,以便将语言建模技术应用于语音数据。但是,现有方法要么模型语义(内容)令牌,可能会丢失声学信息或模型声音令牌,从而冒着语义(内容)信息丢失的风险。拥有多种令牌类型也使体系结构复杂化,并且需要……
GAO发现美国陆军工程兵团(CORPS)管理水资源项目(例如大坝,锁和水道),以增强国家安全,保护和管理水上生态系统,降低灾难的风险,并支持商业。在2018年至2023年的财政年度,该军团分配了约285亿美元的拨款资金,向47个州的278个项目,华盛顿特区,波多黎各联邦和美国维尔京群岛分配了278个项目(请参阅图)。美国陆军工程兵团水资源项目,2018财年至2023年2018年至2023年是由拨款立法和军队和陆军指导文件中的因素产生的。国会在年度拨款法中指示87亿美元(占所有建筑资金的30.5%)。对于剩余的198亿美元(占资金的69.5%),国会包括影响资金分配的拨款法中的项目资格标准和其他
Grounding Multimodal Large Language Models in Actions
多模式大语言模型(MLLM)已证明了包括体现AI在内的许多领域的广泛功能。在这项工作中,我们研究了如何将MLLM最佳地扎根于不同的实施方案及其相关的作用空间,以利用MLLM的多模式世界知识。我们首先通过统一体系结构和动作空间适配器的镜头概括了许多方法。对于连续的动作,我们表明,学识渊博的令牌化可以实现足够的建模精度,从而在下游任务上产生最佳性能。对于离散的动作…
FlexTok: Resampling Images into 1D Token Sequences of Flexible Length
这项工作是与瑞士联邦技术学院Lausanne(EPFL)合作完成的。图像令牌化已通过提供比原始像素更有效处理的压缩,离散表示,从而实现了自回归图像生成的重大进展。尽管传统方法使用2D网格令牌化,但诸如Titok之类的最新方法表明,1D令牌化可以通过消除网格冗余来实现高生成质量。但是,这些方法通常使用固定数量的令牌,因此无法适应图像的固有复杂性。我们介绍…
The Pulsed Pace of Glacial Erosion
巴塔哥尼亚拉戈·阿根廷的新数据表明,冰川侵蚀发生在离散的脉冲中,这挑战了先前的想法,即由于气候变化,侵蚀率随着时间的推移而增加。
When Algorithms Dream of Photons: Can AI Redefine Reality Like Einstein?
光电悖论:人工智能揭示了人类的哪些才华……照片由 Greg Rakozy 在 Unsplash 拍摄1905 年,阿尔伯特·爱因斯坦发表了一篇关于光电效应的论文——一个看似简单的观察,即光可以从金属中弹出电子。这项工作后来为他赢得了诺贝尔奖,它不仅解释了物理学中的一个怪现象。它打破了经典力学,催生了量子理论,并重塑了我们对现实的理解。但这是一个发人深省的问题:一个接受 19 世纪数据训练的人工智能能否实现同样的飞跃?答案不仅仅与物理学有关。它关乎机器能否复制——甚至超越——人类天才的火花。让我们来分析一下。1. 光电效应:天才的完美风暴照片由 Michael Held 在 Unsplash 拍
Human-AI collaboration in physical tasks
TL;DR:在 SmashLab,我们正在创建一个智能助手,它使用智能手表中的传感器来支持烹饪和 DIY 等物理任务。这篇博文探讨了我们如何使用与摄像头相比侵入性更低的场景理解来实现有用的、情境感知的交互,以便在日常生活中执行任务。想过让 AI 助手执行数字世界以外的任务吗?每天,我们都会执行许多任务,包括烹饪、手工制作和医疗自我护理(例如 COVID-19 自检试剂盒),这些任务涉及一系列离散步骤。准确执行所有步骤可能很困难;例如,当我们尝试一种新食谱时,我们可能会在任何步骤产生疑问,并且可能会因为跳过重要步骤或按错误顺序执行而犯错。这个项目,即传感模块的程序交互 (PrISM),旨在通过基
Light exercise can yield significant cognitive benefits, new research shows
日常体育活动,如短距离散步或与孩子玩耍,可能对认知健康产生短期益处,相当于逆转四年的认知衰老。这是我和同事在新研究中发现的重要结果,该研究发表在《行为医学年鉴》杂志上。在此之前 […] 新研究表明,轻度运动可以产生显著的认知益处,该文章首次发表在 Knowridge Science Report 上。
Leveraging Periodicity for Robustness with Multi-modal Mood Pattern Models
*平等贡献者来自可穿戴传感器的数据(例如心率、步数)可用于模拟情绪模式。我们使用多模态离散时间序列数据表征特征表示和建模策略,使用具有自然缺失的大型数据集(n=116,819 名参与者)进行情绪模式分类,使用 12 个可穿戴数据流,重点是捕捉数据的周期性趋势。综合考虑性能和鲁棒性,基于周期性的具有梯度提升模型的聚合特征表示优于其他表示和架构……
GENOT: Entropic (Gromov) Wasserstein Flow Matching with Applications to Single-Cell Genomics
单细胞基因组学极大地促进了我们对细胞行为的理解,促进了治疗和精准医疗的创新。然而,单细胞测序技术本质上具有破坏性,只能同时测量有限的数据模式。这一限制凸显了对能够重新排列细胞的新方法的需求。最佳传输 (OT) 已成为一种有效的解决方案,但传统的离散求解器受到可扩展性、隐私和样本外估计问题的阻碍。这些挑战刺激了神经网络的发展……
Super-bright black holes could reveal if the universe is pixelated
时空可能不是连续的,而是由许多离散的位组成——我们可能能够在异常明亮的黑洞边缘附近看到它们的影响
Dry Heat, Wet Heat, and Wetland Methane Emissions
复合天气事件(例如极冷或高温与严重干旱或降水相结合)对湿地甲烷排放的影响大于离散极端天气。
IEEE Transactions on Fuzzy Systems, Volume 32, Issue 11, November 2024
1) 在多创新背景下的在线主动学习,用于不断发展的误差反馈模糊模型作者:Edwin Lughofer、Igor Škrjanc页数:5998 - 60112) 具有输入饱和的非线性系统的灵活规定性能输出反馈控制作者:Yangang Yao、Yu Kang、Yunbo Zhao、Pengfei Li、Jieqing Tan页数:6012 - 60223) 通过动态事件对具有未知控制系数的 p-正态系统进行自适应模糊预定性能控制作者:Qidong Li、Changchun Hua、Kuo Li、Hao Li页数:6023 - 60344) 离散时间非线性复杂网络的模糊结构自适应最优控制的强化学习作
Ngamugawi wirngarri Clement, Cloutier, Lee, King, Vanhaesebroucke, Bradshaw, Dutel, Trinajstic & Long, 2024 DOI:10.1038/s41467-024-51238-4摘要 现存的腔棘鱼 Latimeria (Sarcopterygii: Actinistia) 是一种标志性的所谓“活化石”,属于形态最保守的脊椎动物群之一。我们描述了一种新的 3-D 保存的腔棘鱼,来自西澳大利亚的晚泥盆世 Gogo 组。我们对该群体进行了全面的分析,以评估所有腔棘鱼的系统发育、进化速度和形态差异。我们发
Oversampling and Undersampling, Explained: A Visual Guide with Mini 2D Dataset
数据预处理人工生成和删除数据,以造福大众⛳️ 更多数据预处理,解释:· 缺失值插补 · 分类编码 · 数据缩放 · 离散化 ▶ 过采样和欠采样收集每个类别都有完全相同数量的类别需要预测的数据集可能是一个挑战。实际上,事情很少能完美平衡,当你制作分类模型时,这可能是一个问题。当一个模型在这样的数据集上训练时,一个类别比另一个类别有更多的示例,它通常会变得更擅长预测较大的组,而更不擅长预测较小的组。为了解决这个问题,我们可以使用过采样和欠采样等策略——为较小的组创建更多示例或从较大的组中删除一些示例。目前有许多不同的过采样和欠采样方法(名字吓人,如 SMOTE、ADASYN 和 Tomek Lin
Boulenophrys lichun Lin, Chen, Li, Peng, Zeng & Wang, 2024 立春角蟾 | 立春角蟾 || DOI: 10.3897/zookeys.1216.130017摘要描述了中国福建省东部沿海丘陵地区发现的 Boulenophrys 属的一个新种。该新分类单元可通过离散的形态特征状态差异和线粒体 16S + CO1 基因组合中的遗传分歧与所有已知同类相区分。我们还提供了福建省 Boulenophrys 物种分布模式图和省级检索表,这将有助于地方当局在实地鉴定和数据收集工作中准确识别物种,从而有助于其保护。关键词:Boulenophrys lic
Gaussian Naive Bayes, Explained: A Visual Guide with Code Examples for Beginners
分类算法钟形假设以获得更好的预测⛳️ 更多分类算法,解释:· 虚拟分类器 · K 最近邻分类器 · 伯努利朴素贝叶斯 ▶ 高斯朴素贝叶斯 · 决策树分类器 · 逻辑回归 · 支持向量分类器 · 多层感知器(即将推出!)基于我们之前关于处理二进制数据的伯努利朴素贝叶斯的文章,我们现在探索用于连续数据的高斯朴素贝叶斯。与二元方法不同,该算法假设每个特征都服从正态(高斯)分布。在这里,我们将看到高斯朴素贝叶斯如何处理连续的钟形数据(产生准确的预测),而无需深入研究贝叶斯定理的复杂数学。所有视觉效果:作者使用 Canva Pro 创建。针对移动设备进行了优化;在桌面上可能显得过大。定义与其他朴素贝叶斯
Coastal Hazards System–South Atlantic (CHS-SA)
摘要:美国陆军工程兵团完成了南大西洋沿岸研究 (SACS),以量化风暴潮和海浪危害,从而将沿海灾害系统 (CHS) 扩展到南大西洋分部 (SAD) 领域。CHS-SACS 的目标是量化当前条件和未来海平面上升情景下的风暴危害,以降低洪水风险并提高沿海环境的恢复力。CHS-SACS 已在 SAD 领域内的三个地区完成,本报告重点关注南大西洋 (CHS-SA)。本研究应用 CHS 的概率框架和增强元建模预测的联合概率方法 (JPM-AMP) 对热带气旋 (TC) 和温带气旋 (XC) 响应进行概率沿海危害分析 (PCHA),利用新的大气和流体动力学数值模型模拟合成 TC 和历史 XC。本报告记录了