由IEEE计算机学会数学基础计算机基础委员会赞助的第66届计算机科学基础研讨会(2025年)将于12月14日至17日在澳大利亚悉尼举行。介绍了有关计算理论的新的和原始研究的论文。典型但不是独家感兴趣的主题包括:算法编码理论,代数计算,算法图理论,算法游戏理论,算法和数据结构,布尔函数的分析,近似算法,平均库复杂性,逻辑,计算,计算,计算,计算,计算,计算,计算,计算,计算复杂性,沟通复杂性,电路复杂性,组合优化,计算游戏理论,计算几何学,计算学习理论,连续优化,加密,机器学习的基础,在线算法,优化,并行和分布式算法,参数化算法,随机算法,随机算法,Sublinear Algorithm,Sub
[Botany • 2025] Gynoxys yasgolgensis (Asteraceae: Senecioneae) • A New Species from northern Peru
Gynoxys yasgolgensis Revilla & E. Coronel-Castro,2025 年,Revilla、Coronel-Castro、Meza-Mori et Amasifuen Guerra。DOI:doi.org/10.11646/phytotaxa.684.2.1 摘要Gynoxys(菊科)包括栖息在南美安第斯山脉(从委内瑞拉到阿根廷北部)的多种物种。该属目前包含 130 个物种,其中 65 个已在秘鲁记录。在本研究中,我们描述了一个新物种,即来自秘鲁北部的 G. yasgolgensis。该物种是在海拔 3,300-3,500 米的 Yasgolga 山脉中发现
IEEE Transactions on Neural Networks and Learning Systems, Volume 36, Issue 2, February 2025
1) 特邀编辑:机器学习泛化、稳健性和可解释性的信息论方法特刊作者:Badong Chen、Shujian Yu、Robert Jenssen、Jose C. Principe、Klaus-Robert Müller页数:1957 - 19582) 用于阿尔茨海默病分类和致病因素识别的社区图卷积神经网络作者:Xia-An Bi、Ke Chen、Siyu Jiang、Sheng Luo、Wenyan Zhou、Zhaoxu Xing、Luyun Xu、Zhengliang Liu、Tianming Liu页数:1959 - 19733) RSS-Bagging:通过训练数据的 Fisher 信息
What is a good economic model?
虽然增加模型与目标系统之间的差异可能具有使模型更容易研究的优势,但研究模型的最终目的是为了了解目标系统的一些情况。因此,额外的近似会导致模型和目标系统之间的对应关系变得不那么直接。最终,[…]
P. occitanica sp. 属的修订。十一月(蜘蛛目,蜘蛛科)摘要在奥克西塔尼亚(前南比利牛斯省和朗格多克 - 鲁西永地区)发现新物种后,法国和比利牛斯山脉对 Pireneitega 属(Kishida, 1955)进行了修订。 Pyreneitega occitanica sp.十一月之前曾与比利牛斯山脉东部的 P. pyrenaea (Simon, 1870) 以及阿列日省的 P. segestriformis 相混淆,这两个物种在那里共存。作为本次修订的一部分,Simon (1937) 提出的同义词得到确认,并更正了另外两个同义词:Amaurobius roscidus C.L.
Serbia completes fielding of Chinese air-defense system
这个巴尔干国家没有加入北约的计划,其加入欧盟的愿望最近似乎也不太明朗。
我们引入了形状标记,这是一种连续、紧凑且易于集成到机器学习模型中的 3D 表示。形状标记用作条件向量,表示 3D 流匹配模型中的形状信息。此流匹配模型经过训练,可以近似对应于集中在 3D 形状表面上的 delta 函数的概率密度函数。通过将形状标记整合到各种机器学习模型中,我们可以生成新形状、将图像转换为 3D、将 3D 形状与文本和图像对齐,并直接在变量处渲染形状……
Raveniola fuzhouensis Zhou,载于 Zhou, Lu, Cui et Xu, 2025。DOI:doi.org/10.3897/BDJ.13.e142264 摘要背景:Raveniola Zonstein, 1987 属包括 66 个种,分布于从东亚到高加索的地区,中国记录了约 20 种。根据 Zonstein 等人 (2018) 和 Zonstein (2024) 的研究,Raveniola 属成员可通过以下特征来识别:雄性胫骨 I 上有两到三个连续排列的后腹巨刺,雌性有成对的受精囊,每个受精囊有两个分枝的头部或一个侧憩室。新信息:在中国福建省描述了一种新的 myga
Climate Science—Settled Until It’s Not
与此同时,每隔几年,就会出现另一个关键因素(如 MeSH),需要进行重大的重新校准,但我们不断确信这些模型过去的准确性和未来的可靠性,好像这些启示仅仅是脚注而不是范式转变。这些模型是现实的近似值,还是披着复杂数学外衣的随意猜测?
To understand things sometimes requires appropriate training
。所以他不明白为什么,我想那是因为他所受的训练从未使他能够理解这样的事情,即使事后看来也是如此。这是一个数字和计算非常重要的问题,而且以抽象的方式,大多数职业的准备工作中根本没有教授。因此,作为一名内心和职业的商船海员,他认为苏伊士运河非常重要。甚至是“最重要的生命线”。这是相当多的散文。经济学家对这样的散文不满意。经济学家问“有多重要?”,并期望用带有货币符号的数字作为答案。“苏伊士运河关闭会给普通美国人带来多少美元损失?”“短期内美国 GDP 会减少多少,长期来看会减少多少百分比?”然后经济学家会试图至少做一个快速而粗略的一阶近似计算(或者对于有科学倾向的人来说,在科学论文数据库中进行全文
Virtual Personas for Language Models via an Anthology of Backstories
我们介绍了 Anthology,这是一种通过生成和利用具有丰富个人价值观和经验细节的自然背景故事来将 LLM 调节为具有代表性、一致和多样化的虚拟角色的方法。大型语言模型 (LLM) 在由数百万和数十亿不同的人类作者共同制作的海量文本语料库上进行训练意味着什么?在“语言模型作为代理模型”中,令人信服的证据表明,最近的语言模型可以被视为代理模型:在提供文本上下文的情况下,LLM 能够生成代表可能产生该上下文的代理特征的条件文本。这表明,通过适当的调节,可以引导 LLM 近似特定人类声音的响应,而不是以其他方式出现的混合声音。如果实现,LLM 的这种能力将对用户研究和社会科学产生重大影响——作为人
Optimizing Contextual Speech Recognition Using Vector Quantization for Efficient Retrieval
神经语境偏差允许语音识别模型利用语境相关信息,从而提高转录准确性。然而,偏差机制通常基于音频和偏差条目目录之间的交叉注意模块,这意味着计算复杂性可能会对偏差目录的大小造成严重的实际限制,从而影响准确性的提高。这项工作提出了一种基于矢量量化的交叉注意评分近似值,并实现了计算和内存高效的大偏差使用……
A budget that points the way but doesn’t get us very far
Rachel Reeves 是否让工党走上了结束紧缩政策并弥补过去十四年公共投资不足的道路?在这篇文章中,我将遵循预算前文章的格式,将讨论分为三个部分:公共投资、当前公共支出和税收。我还添加了一个额外的、相当烦人的财政规则部分和一个摘要。公共投资下图比较了 Reeves 从上一届政府继承的净公共投资计划和她提交给预算责任办公室的预算计划。在保守党执政期间,公共投资占 GDP 的比例预计将从目前的 2.5% 左右稳步下降到 1.7%。Reeves 给预算责任办公室的假设意味着,在第一次近似中,公共投资将保持在 GDP 的 2.5% 左右。这是一个进步,但考虑到过去十四年公共投资的缺乏,这是一个相
Mastering Back-of-the-Envelope Math Will Make You a Better Data Scientist
一个快速而粗略的答案往往比一个花哨的模型更有帮助作者图片(改编自 Midjourney)1945 年 7 月 16 日,在洛斯阿拉莫斯进行的第一次核弹试验中,物理学家 Enrico Fermi 扔下了一些小纸片,并观察了当冲击波到达他身边时它们移动了多远。据此,他估算出了炸弹当量的大致大小。没有花哨的设备或严格的测量;只有一些方向数据和逻辑推理。爆炸发生后大约 40 秒,空气冲击波到达了我身边。我试图通过在冲击波通过之前、期间和之后从大约六英尺高的地方扔下小纸片来估计其强度。[…] 我估计这相当于当时一千吨 T.N.T 产生的爆炸。— Enrico Fermi 考虑到这个估计是如何产生的,它竟
Using PCA for Outlier Detection
一种识别数值数据中异常值的令人惊讶的有效方法PCA(主成分分析)通常用于数据科学,通常用于降维(通常用于可视化),但它实际上对于异常值检测也非常有用,我将在本文中描述它。本文延续了我的异常值检测系列,其中还包括关于 FPOF、计数异常值检测器、距离度量学习、共享最近邻和兴奋剂的文章。这还包括我书《Python 中的异常值检测》的另一段摘录。PCA 背后的想法是大多数数据集在某些列中的方差比其他列大得多,并且特征之间也存在相关性。其中一个含义是:为了表示数据,通常不需要使用尽可能多的特征;我们通常可以使用更少的特征(有时要少得多)很好地近似数据。例如,对于包含 100 个特征的数值数据表,我们可
从人类反馈中进行强化学习 (RLHF) 是一种将语言模型与人类偏好保持一致的有效方法。RLHF 的核心是学习用于对人类偏好进行评分的奖励函数。学习奖励模型的两种主要方法是 1) 训练显式奖励模型(如 RLHF)和 2) 使用通过直接偏好优化 (DPO) 等方法从偏好数据中学习的隐式奖励。先前的研究表明,DPO 的隐性奖励模型可以近似训练有素的奖励模型,但尚不清楚 DPO 在多大程度上可以推广到分布……
Reinforcement Learning, Part 8: Feature State Construction
通过将状态特征巧妙地纳入学习目标来增强线性方法强化学习是机器学习的一个领域,它引入了代理在复杂环境中学习最佳策略的概念。代理根据环境状态从其行为中学习,从而获得奖励。强化学习是一个具有挑战性的话题,与机器学习的其他领域有很大不同。强化学习的显著之处在于,可以使用相同的算法使代理适应完全不同、未知和复杂的条件。关于本文在第 7 部分中,我们介绍了可扩展标准表格方法的值函数近似算法。除此之外,我们特别关注了一个非常重要的情况,即近似值函数是线性的。我们发现,线性保证了收敛到全局最优值或 TD 不动点(在半梯度方法中)。问题是,有时我们可能希望使用更复杂的近似值函数,而不仅仅是简单的标量积,而不离开
Physics heresy: projectiles don’t actually make parabolas
几个世纪以来,抛物线一直是物理入门课上必修的课程,但它只是对物体真实路径的不完美近似……继续阅读《从一声巨响开始!》