在不同训练的模型之间预测的差异是公平二进制分类中的重要,爆炸率不足的错误源。实际上,某些数据示例的差异是如此之大,以至于决策可以有效任意。为了调查这个问题,我们采用了一种实验方法,并做出了四个总体贡献。WE:1)定义一个称为自矛盾的度量,源自差异,我们将其用作衡量和降低任意性的代理; 2)开发一种结合算法,即预测是任意的时弃权分类的; 3)对公平二进制分类中方差(相对于自愿和任意性)的作用(相对于自愿和任意性)的作用进行最大的实证研究;以及4)释放一种工具包,该工具包使《美国房屋抵押贷款披露法》(HMDA)数据集易于用于未来的研究。总的来说,我们的实验揭示了关于基准数据集上结论的可靠性的令人震惊的见解。在考虑预测中存在的任意性数量时,最公平的二进制分类台 - 在我们甚至尝试采用任何公平干预措施之前。这一发现质疑了常见算法公平方法的实际实用性,进而表明我们应该重新考虑如何选择如何测量二进制分类中的公平性。
摘要:量子计算有望实现比经典计算更快的速度,这引发了人们对探索用于数据分析问题的新型量子算法的兴趣。特征选择是一种从数据集中选择最相关特征的技术,是数据分析中的关键步骤。通过文献中提出的几种量子特征选择技术,本研究展示了量子算法在增强特征选择和其他利用方差的任务方面的潜力。本研究提出了一种用于估计一组真实数据的方差的新型量子算法。重要的是,在状态准备之后,该算法的复杂度在宽度和深度上都表现出对数特性。量子算法通过设计混合量子特征选择 (HQFS) 算法应用于特征选择问题。这项工作展示了 HQFS 的实现,并在两个合成数据集和一个真实数据集上对其进行了评估。
我们在市场上研究持续的时间平均变化投资组合选择,这些市场是由可观察的因素驱动的股价扩散过程,这些因素也是扩散过程,但这些过程的系数尚不清楚。基于最近开发的扩散过程的强化学习理论(RL)理论,我们提出了一种通用数据驱动的RL算法,该算法直接学习了预先合同的投资策略,而无需尝试学习或估计市场系数。对于没有因素的多股黑色 - choles市场,我们进一步设计了一种基线算法,并通过在Sharpe比率方面获得了Sublinear后悔来证明其性能保证。为了提高性能和实践实施,我们将基线算法修改为四种变体,并进行了广泛的经验研究,以与许多共同指标相比,将其绩效与大量广泛使用的投资组合分配策略在S&P 500成分上进行比较。结果表明,连续的RL策略始终是最佳的,尤其是在动荡的熊市中,并且果断地超过了基于模型的连续时间对应物的大幅度利润率。
摘要 - 为训练神经网络提供了一个新框架,该框架基于测量变化的表征和稳定。该框架产生了许多有用的属性,可最大程度地利用数据的使用以及以原则上的方式解释结果的解释。这是通过方差稳定和随后的标准化步骤来实现的。该方法是一种通用方法,可以在可重复性数据可用的任何情况下使用。以这种方式进行标准化允许从统计的角度来解释拟合的良好和测量数据。我们在分析高级制造数据中证明了该框架的实用性。索引术语 - 变化稳定,神经网络,多层感知器,降低的卡 - 清点,CHI-Square每度自由度,这项工作中的金属添加剂制造作为一种普遍的回归,用于研究金属添加性制造(AM)过程参数和所致的融合属性属性的金属添加性生产(AM)的关系。在这里将对添加剂数据的分析作为用例表示,但是框架本身是一般的,可以在可重复性数据可用的任何方法中使用。添加剂制造是一个3D打印过程,它以逐层方法构建组件; Meltpool是熔融原料和底物材料的体积。这通常会导致数据集的样本数量少[1],[2],这些数据集需要一种系统的方法学方法来帮助鲁棒解释。了解材料和熔体之间的基本物理和关系是过程优化的关键,但是对原位测量的机会是有限的,因此缺乏基本的过程理解。使用神经网络在分析高级制造过程数据中提出了特定的困难,因为收集高质量的数据是充分的,复杂的,需要仔细的计划。
差异和场地规划审查是向申请人提供关于拟议建筑物退缩和增建意见的唯一机会。详细规划可在 www.hanovermn.org 上找到。单击主页左侧的“城市项目页面”,然后单击“山顶”。信息/联系人:
摘要 - 由于测量结果并不比其不确定度更好,因此指定不确定度是计量学的一个非常重要的部分。人们倾向于相信物理学中的基本常数随时间不变,并且它们是建立国际系统 (SI) 标准和计量学的基础。因此,在最先进的水平上明确指定这些物理不变量的不确定性应该是计量学的主要目标之一。但是,通过观察某些物理量的行为,我们可能会扰乱标准,从而引入不确定性。一系列观测中的随机偏差可能是由测量系统、环境耦合或标准中的固有偏差引起的。由于这些原因,并且由于相关随机噪声在自然界中与不相关随机噪声一样普遍存在,因此普遍使用经典方差和均值标准差可能会混淆而不是澄清有关不确定性的问题;即,这些测量仅适用于随机不相关偏差(白噪声),而白噪声通常是观察到的偏差频谱的子集。如果事实上该系列不是随机和不相关的,即没有白色频谱,那么由于测量是在不同时间进行的,因此系列中每个测量都是独立的假设应该受到质疑。在本文中,频率标准、标准电压电池和量块的研究提供了长期随机相关时间序列的例子,这些时间序列表明行为不是“白色”(不是随机和不相关的)。本文概述并说明了一种简单的时域统计方法,该方法为幂律谱提供了一种替代估计方法,可用于大多数重要的随机幂律过程。了解频谱可以在存在相关随机偏差的情况下提供更清晰的不确定性评估,所概述的统计方法还为白频谱提供了一个简单的测试,从而使计量学家能够知道使用经典方差是否合适或是否要结合更好的不确定性评估程序,例如,如本文所述。
在经典测量中,观察通过揭示系统被认为是预先存在的、独立于观察的属性来消除我们对状态的无知。香农信息是量化经典系统所携带信息量的理想度量。它也是我们对经典系统属性的无知的自然度量。然而,对于量子测量,情况则大不相同,因为不能说量子测量揭示了量子系统的预先存在的属性。因此,香农熵在量子物理学中可以被认为是概念上的不足。布鲁克纳和泽林格引入了一个量作为总信息的新度量,该量是通过对一组完整的相互补充的测量中的单个测量求和而获得的[1,2]。这种量子信息度量考虑到在测量之前已知的量子系统的唯一特征是各种事件发生的概率。这个量可以表示为
与重视一致性的常规任务不同,创造力和创新的目标是创造多样化的想法。本文深入探讨了人们对使用人工智能 (AI) 来提高创意生成过程的生产力和质量的日益增长的兴趣。虽然之前的研究发现人工智能创意的平均质量相当高,但之前的研究也指出,基于人工智能的头脑风暴无法创造足够分散的想法,这限制了新颖性和整体最佳创意的质量。我们的研究调查了增加人工智能生成创意分散性的方法。使用 GPT-4,我们探索了不同的提示方法对余弦相似度、独特创意的数量以及创意空间耗尽速度的影响。我们在为大学生开发新产品的领域开展了这项工作,价格低于 50 美元。在此背景下,我们发现 (1) GPT-4 使用各种合理提示生成的想法池的多样性不如人类受试者群体生成的想法 (2) 人工智能生成的想法的多样性可以通过提示工程显着提高 (3) 思路链 (CoT) 提示导致我们评估的所有提示中想法的多样性最高,并且能够接近人类受试者群体所取得的成就。它还能够生成我们研究的任何提示中最多的独特想法。
