我们研究一家公司工厂的数量、规模和位置。公司的决策权衡了使用多家工厂向客户提供商品和服务的好处、建立和管理这些工厂的成本以及随着工厂数量的增加而产生的相互蚕食的可能性。在一个拥有大量不同地点的经济体中,对异质性公司的决策进行建模是复杂的,因为它涉及一个大型组合问题。利用离散几何的见解,我们研究了这个问题的一个可处理的极限情况,其中这些力量在局部层面上起作用。我们的分析对跨空间排序提供了清晰的预测。与生产率较低的公司相比,生产率高的公司在租金高的密集地点设立更多的工厂,而在密度低、租金低的市场设立的工厂较少。控制工厂数量,生产率高的公司运营的工厂也比生产率低的公司运营的工厂更大。我们使用美国机构级别的数据提供了与这些和其他几个预测一致的证据。
机器学习伦理研究显然是偏见的。的工作将公平性定义为分布或分配的问题,并且提出了公平性的计算可及其定义的定义,已经过度生产和发布过多。本文采用了一种社会学方法来解释计算机科学领域中社会生产的微妙过程部分解释了这一结果。认为,分配公平本质上是对正义的定义的限制,我指出该领域的研究人员如何从政治哲学,知识哲学以及女权主义和批判种族理论中更广泛地利用知识分子的见解。我认为,对不公平性的不公平性的定义不是统治,主要源于哲学家艾里斯·马里恩·杨(Iris Marion Young)的论点,可以更好地解释该研究社区广泛承认的算法伤害的观察。此替代定义扩展了算法正义的解决方案空间,包括其他形式的相应行动,包括法规修复,例如立法,参与性评估,用户重新利用和抵抗的形式以及行动主义,可以禁止对技术的某些使用进行禁止。
Muth (1961) 的理性预期假说仍然是宏观经济学和金融学中占主导地位的信念模型。它的主导地位并不难理解:理性预期为建模经济行为提供了一种可行的方法(Lucas (1972)),同时限制了计量经济学家的自由度(Lucas (1976))。然而,理性预期从来就不乏证据和其他理论来质疑其主导地位。这些模型将我们置于 Sims (1980) 提出的替代预期的“荒野”中。2 成功探索这片荒野的尝试主要依靠调查数据来寻找信念的代理(Coibion 和 Gorodnichenko (2015)、Bordalo 等人(2020)、Angeletos 等人(2021)、Nagel 和 Xu (2022a)、Lochstoer 和 Muir (2022))。在本文中,我提出了一种使用大型语言模型 (LLM) 的新信念代理来源。LLM 是一类旨在学习人类语言结构的统计模型。这些模型通过估计给定文档中所有先前观察到的标记的标记 si 的概率来实现此目标,
指纹识别(或复制检测)存储数据库中所有AI生成内容的哈希,例如。Neuralhash(Apple Inc.,2021年)。这些哈希是向量表示∈{0,1} k或r k通常是由自我保护的特征提取器生成的(Oquab等人。,2023; Devlin等。,2018年)。查询一块内容时,我们将其哈希与数据库中的哈希进行了比较,并确定它是否是重新发电的副本。在大规模上,存储哈希并通过它们进行搜索很麻烦,并且反向搜索必须近似以易于处理(Douze等人。,2024)。此外,功能提取器对内容修改并不完全鲁棒:例如,音频及其×1.25速度版本可能具有不同的哈希。这两个因素会导致错误,尤其是在对抗环境中(Douze等人,2021; Papakipos等。,2022)。另一个缺点是需要将哈希存储在数据库中,这使得很难共享,而开源场景不可能。
在数据科学和机器学习的不断发展的景观中,时间序列建模的领域已成为一个重要且挑战性的研究领域。时间序列数据及其独特的时间依赖性和顺序模式,在金融,医疗保健和气候科学等各个领域中找到了应用[1,2,3]。时间序列的准确建模对于创建强大的模型和理解复杂系统至关重要。建模时间序列的一种方法是通过生成模型[4],该模型在异常检测[5]和数据增强[6]中具有实际应用。在本文中,我们提出了一种基于时间序列生成和建模的神经SDE的新颖方法。尤其是,我们旨在创建一个可以利用默顿模型[3]作为跳跃框架的模型,该模型可以考虑实际市场的跳跃。归一化流是具有易生化密度估计的生成模型家族。主要思想是通过组成几个函数f i将初始复杂的数据分散分散转换为一个简单的想法。有一些
公民科学不仅是从分散来源收集科学相关数据的工具,而且还是将人们与科学联系起来并提高对自然现象的认识的机会。出于所有三个目的,必须了解影响参与公民科学项目的因素。我们已经分析了17个单独项目的地理上可探讨的记录级数据库,以揭示提供数据提供的一些环境和社会经济因素。我们将记录与管理数据库匹配,以识别相关指标。此外,我们启动了一项补充调查,以根据数据相对于参与者的房屋来表征项目。我们的初步分析证实,数据提交模式根据参与所需的技能,目的,主题和进一步的特征而差异很大。我们的结果为社区科学项目的方法和设计提供了新的见解。资金:国家研究,发展与创新办公室(K135841,RRF-2.3.1-21-2022- 00006),匈奴 - 伦敦匈牙利研究网络
基于得分的生成模型(SGM)旨在通过仅使用来自目标的噪声扰动样本来学习得分功能来估算目标数据分布。最近的文献广泛地集中在评估目标和估计分布之间的误差上,从而通过Kullback-Leibler(KL)Divergence和Wasserstein距离来测量生成质量。在对数据分布的轻度假设下,我们为目标和估计分布之间的KL差异建立了上限,这取决于任何依赖时间依赖的噪声时间表。在额外的规律性假设下,利用了有利的潜在收缩机制,与最新结果相比,我们提供了瓦斯坦斯坦距离的更严格的误差。除了具有易处理外,该上限还结合了在训练过程中需要调整的目标分布和SGM超参数的特性。最后,我们使用模拟和CIFAR-10数据集1通过数值实验来说明这些边界,并在参数族中识别最佳的噪声时间表范围。
基于得分的生成模型(SGM)旨在通过仅使用来自目标的噪声扰动样本来学习得分功能来估算目标数据分布。最近的文献广泛地集中在评估目标和估计分布之间的误差上,从而通过Kullback-Leibler(KL)Divergence和Wasserstein距离来测量生成质量。在对数据分布的轻度假设下,我们为目标和估计分布之间的KL差异建立了上限,这取决于任何依赖时间依赖的噪声时间表。在额外的规律性假设下,利用了有利的潜在收缩机制,与最新结果相比,我们提供了瓦斯坦斯坦距离的更严格的误差。除了具有易处理外,该上限还结合了在训练过程中需要调整的目标分布和SGM超参数的特性。最后,我们使用模拟和CIFAR-10数据集1通过数值实验来说明这些边界,并在参数族中识别最佳的噪声时间表范围。
摘要 - 数字时代的开始和快速进步为科学研究带来了挑战和机会,其特征是在大数据的四个V中反映了一个不断发展的数据格局:数量,品种,真实性和速度。大数据格局取代了传统的存储,处理,管理和探索方式,并且需要在整个数据生命周期(即收集,存储和处理,分析和代表性)中进行适应和创新。主题问题是“数字时代和整个数据生命周期的太空天气研究”,从整个数据生命周期(收集,管理,分析和通信;集体“数据科学”)中收集了研究,并提供了可拖动的汇编,以说明最新的计算和数据科学,工具,工具,工具以及太空天气研究的进步。我们介绍了太空天气和局部问题中的文章的范式变化。我们创建了研究的网络视图,该视图突出了对范式变化的贡献,并揭示了以后将指导它的趋势。
高管摘要本报告评估了有关TFGBV的研究状态,以及最近在此问题上取得的全球腿部,法规和政策进展。通过一项案例研究,探讨了涉及澳大利亚Esafety专员Julie Inman Grant的在线骚扰和滥用的数据,该报告记录了TFGBV对公共生活中妇女的现实影响。我们认为,TFGBV并不是一个可行的问题,而是必须纳入主流的问题,以减轻妇女在更广泛的政策辩论中的经验。TFGBV不再仅仅是妇女倡导团体的责任。技术公司,政府,公民技术组织,执法部门,雇主,学校和其他人必须使其作品成为战斗,以打击TFGBV,以反映其对社会的主要流动影响。为此,我们建议一些实用的解决方案,以解决妇女和女孩今天在线面临的特定和紧迫问题。解决此处描述的紧急变化不仅会使妇女和女孩更安全,并确保听到她们的声音,还可以改善使用互联网的每个人,建立更强大的代表民主国家的安全和自由表达。
