特征选择是高维统计和机器学习的重要主题,用于预测和理解潜在现象。它在计算机视觉,自然语言处理,生物信息学等中都有许多应用。但是,文献中的大多数特征选择方法已提出用于离线学习,现有的在线功能选择方法在真正的支持恢复中具有理论和实际限制。本文提出了两种新型的在线特征选择方法,该方法由随机梯度下降和硬阈值操作员提出。提出的方法可以同时选择相关特征,并基于所选变量构建线性回归或分类模型。为提出方法的一致性提供了理论上的理由。对模拟和实际稀疏数据集的数值实验表明,所提出的方法与文献的最新在线方法相比有利。关键字:变量选择,流数据,随机算法,退火过程,大数据学习
* Riga 0/1定义为实现VIGA-AD 1的响应,仅存在几乎不可感知的红斑或VIGA-AD 0
Kyowa Kirin通过遵守所有相关法律,法规,
摘要 — 可再生能源发电水平的提高激发了人们对数据驱动的交流最优功率流 (AC OPF) 方法的兴趣,以管理不确定性;然而,缺乏规范的数据集创建和基准测试,阻碍了对文献中的方法进行有用的比较。为了树立信心,模型必须能够可靠地预测各种运行条件下的解决方案。本文为 Julia 和 Python 开发了 OPF-Learn 包,它使用一种计算效率高的方法创建代表性数据集,涵盖交流 OPF 可行域的广泛范围。负载曲线是从包含交流 OPF 可行集的凸集中均匀采样的。对于找到的每个不可行的点,使用不可行性证书来减少凸集,这些证书是通过使用宽松公式的性质找到的。与文献中看到的传统技术相比,该框架可以生成更能代表整个可行空间的数据集,从而提高机器学习模型的性能。
数字原生业务模式的稳步崛起见证了各行各业中大量且种类繁多的个人层面行为微观数据带来的巨大机遇。例如,亚马逊、Netflix 或 Meta 等公司会跟踪客户的行为,以获得个性化推荐和有针对性的营销活动。其他公司意识到与其他方共享客户信息(例如,与“物联网”元素链接,如移动跟踪仪、医疗或健身设备等)可以为双方创造协同效应。同样,非营利部门和研究机构越来越依赖公开可用或开放的行为数据的可用性或“可共享性”(Beaulieu-Jones 等人,2019 年)。然而,所有这些好处与个人保护隐私和避免共享个人数据的合法愿望形成了鲜明对比(Wieringa 等人,2021 年)。继 Facebook-Cambridge Analytica 丑闻之后,企业也越来越重视保护客户数据免遭重新识别攻击,保护品牌免遭客户信任损失(Schneider 等人,2017 年、2018 年)。所有这些担忧导致了现代隐私法规(特别是欧盟的 GDPR 和加州的 CCPA)的出台,这些法规对数据匿名化施加了非常严格的标准。GDPR 和 CCPA 都没有规定任何具体的匿名化流程,但它们要求结果必须是
摘要:如今,人们对在日常生活场景中收集生理数据和人类行为的兴趣日益浓厚,与此同时,记录大脑和身体信号的无线设备也越来越多。然而,这些解决方案所特有的技术问题往往限制了现实生活中与大脑相关的全面评估。在这里,我们介绍了 Biohub 平台,这是一个用于多流同步采集的硬件/软件 (HW/SW) 集成可穿戴系统。该系统由现成的硬件和最先进的开源软件组件组成,它们高度集成到一个高科技低成本解决方案中,完整且易于在传统实验室外使用。它可以灵活地与多种设备配合使用,无论制造商是谁,并克服了记录设备可能有限的资源。通过表征 (i) 多流同步、(ii) 与医疗级高密度设备相比的实验室脑电图 (EEG) 记录的质量,以及 (iii) 真实驾驶条件下的脑机接口 (BCI),对 Biohub 进行了验证。结果表明,该系统能够可靠地获取具有高时间精度的多数据流并记录标准质量的脑电信号,成为用于驾驶、远程康复和职业安全等高级人体工程学研究的有效设备。
科学探测器是许多学科的关键技术推动因素。许多科学探测器都使用了专用集成电路 (ASIC)。直到最近,像素探测器 ASIC 主要用于传感器层电荷的模拟信号处理和探测器 ASIC 上原始像素数据的传输。然而,随着更先进的 ASIC 技术节点在科学应用中的出现,更多来自计算域的数字功能(例如压缩)可以直接集成到探测器 ASIC 中以提高数据速度。然而,这些计算功能通常具有高且可变的延迟,而科学探测器必须实时运行(即无停顿)以支持采样数据的连续流式传输。本文介绍了一个来自像素探测器领域的示例,该探测器具有片上数据压缩功能,可用于 X 射线科学应用。为了应对来自并行压缩器流的可变大小数据的挑战,我们提出了一种 ASIC 设计架构,用于合并可变长度的数据,以便通过固定位宽的网络接口进行传输。索引术语 — 科学仪器边缘系统、X 射线科学、数据传输技术、流数据压缩、X 射线探测器、ASIC、硬件构造语言
摘要:雪的热和辐射特性对陆地表面能量平衡产生强烈影响,从而对其上方的大气产生影响。山区的陆地表面积雪信息知之甚少。很少有研究检查过中纬度冷季高分辨率、对流允许的数值天气预报模型中初始陆地表面积雪条件的影响。使用天气研究和预报 (WRF) 模型的高分辨率 (1 公里) 配置,测试陆地表面积雪对大气能量输送和随后的地面气象状态的影响程度,包括平静条件和 3 月下旬温暖大气河流的天气特征。一组合成但真实的雪状态被用作模型运行的初始条件,并比较了产生的差异。我们发现,在这两个时期,雪的存在 (不存在) 会使 2 米空气温度降低 (升高) 多达 4 K,并且大气通过从邻近地区平流湿静态能量来响应雪扰动。雪量和积雪面积都是影响 2 米空气温度的重要变量。最后,WRF 实验产生的气象状态用于强制离线水文模型,表明融雪率可以增加/减少 2 倍,具体取决于主天气模型中使用的初始雪况。我们提出,中尺度模型中陆地表面雪特性的更真实表示可能是水文气象可预报性的来源
与 Arne、Elia、Evgeniya、Gust、Jan、Jessa、Jonas (x2)、Kilian、Laurens、Maaike、Mohit、Pedro、Pieter (x2)、Robin、Sebastijan、Stella、Tim、Toon、Vincent、Vova、Wannes 和许多其他人一起。一些同事也值得单独致谢。Robin 和 Laurens,我委托你们在我离开后让西佛兰德方言在走廊里回荡。对于 DTAI 的团体道歉(以前称为 DTAI 的跑步者),感谢你们总是让我对跑步不够感到内疚。Vincent、Laurens 和 Jonas,我非常享受我们去华沙的暑期学校假期旅行。最后,我相信没有人能找到比 Jessa、Vincent 和 Maaike 更好的同事了。我认为我们在闲逛和努力工作之间找到了最佳平衡点。我特别喜欢我们之间的互动,因为我们都意识到生活不仅仅是研究,而且有时在面对令人厌烦的会议截止日期时也必须付出非凡的努力。我真诚地感谢您的支持以及我们多年来在 02.144 办公室留下的美好回忆!