摘要。前列腺癌 (PCa) 是男性人群中最常见的癌症之一。当前的临床实践导致过度诊断和过度治疗,需要更有效的工具来改善诊断,从而提高患者的生活质量。基础设施、计算能力和人工智能的最新进展使得收集大量临床和成像数据成为可能,这些数据可以帮助实现这一目标。ProCAncer-I 项目旨在开发一个集成成像数据和模型的 AI 平台,并托管全球最大的 PCa (mp)MRI 匿名图像数据集合。在本文中,我们概述了平台数据提取部分的整体架构。我们描述了上传数据所遵循的工作流程以及用于存储成像数据、临床数据及其相应元数据的主要存储库。
摘要:美国国家海洋和大气管理局 (NOAA) 国家环境信息中心 (NCEI) 生成从本地到全球范围的数字高程模型 (DEM)。总的来说,这些 DEM 对于确定沿海洪水的时间和范围以及改善社区准备、事件预报和预警系统至关重要。我们在 NCEI 启动了一个综合框架,即持续更新 DEM (CUDEM) 计划,其中包含无缝裸地、地形测深和测深 DEM,涵盖整个美国 (U.S.) 大西洋和墨西哥湾沿岸、夏威夷、美国领土和美国太平洋沿岸的部分地区。CUDEM 是目前公共领域中分辨率最高的整个美国大西洋和墨西哥湾沿岸的无缝描绘;沿海地形测深 DEM 的空间分辨率为 1/9 弧秒(~3 米),而离岸测深 DEM 则粗化为 1/3 弧秒(~10 米)。我们使用 NASA 的先进地形激光测高系统 (ATLAS) 仪器(该仪器安装在冰、云和陆地高程卫星 2 (ICESat-2) 观测站上)独立验证了 CUDEM 的陆地部分,并计算出相应的垂直平均偏差误差为 0.12 米 ± 0.75 米(一个标准差),总体 RMSE 为 0.76 米。我们使用免费开源软件 (FOSS) 通过标准化流程生成 CUDEM,并提供对我们代码存储库的开放访问。CUDEM 框架由系统化的平铺地理范围、空间分辨率以及水平和垂直基准组成,以便使用新的数据集合快速更新目标区域,尤其是风暴和海啸事件后。CUDEM 框架还能够将本地规模 DEM 中采集的高分辨率数据集合快速整合到 NOAA NCEI 的区域和全球 DEM 套件中。未来的研究工作将侧重于生成其他数据产品,例如空间明确的垂直误差估计和形态变化计算,以增强 CUDEM 计划的实用性和科学效益。
目前还没有统一的框架来访问这种不确定的、丰富的异构数据集合,因此研究人员不得不依赖临时工具。特别是,当前试图解决这一任务的工具的一个主要弱点是只开发了非常有限的命题查询语言。在本文中,我们介绍了 NeuroLang,这是一种基于一阶逻辑的概率语言,具有存在性规则、概率不确定性、开放世界假设下的本体集成以及内置机制,可保证对非常大的数据集进行可处理的查询回答。NeuroLang 的主要目标是提供一个统一的框架,无缝集成异构数据(如本体),并通过一组正式标准将细粒度认知领域映射到大脑区域,促进可共享和高度可重复的研究。在介绍该语言及其通用查询回答架构之后,我们讨论了现实世界的用例,展示了 NeuroLang 如何应用于实际场景。
第二个原则是坦诚承认任何大型组织都具备应对变化速度的能力。人口普查局工作单位必须能够在现代化工作进展的同时继续提供预定的数据产品。同时进行太多变化可能会威胁我们的交付能力。制约因素是资源(人员、资金)和时间。考虑到这一点,我们可以将现代化工作视为一个范围。在范围的一端,重点是构建运营所要求的内容,主要考虑每个理事会当前的可交付成果。在另一端,重点是尽快实施全企业转型,主要考虑首先推出一种新的统计产品 - 以数据为中心的组织,该组织具有充分利用现有人口普查/调查数据集合和行政记录数据的能力,为官方统计数据和新的相关数据产品提供创新解决方案。在任何特定时刻,各个领域都以转型为导向 - 在其他时候,它们必然以满足其特定要求为导向,并继续提供其产品。
摘要 - 健康的城市绿化是减轻气候变化现象(例如极端热量和空气污染)的基本资产。然而,城市树通常会受到非生物和生物压力源的影响,这些压力源会阻碍其功能性,并且每当不及时管理,甚至是其生存。虽然当前的绿化检查技术可以帮助采取有效的措施,但它们通常需要大量的人工劳动,因此在整个城市范围内都无法进行频繁的评估。在本文中,我们提出了Greenscan,这是一种基于地面的传感系统,旨在在高时空的高时期范围内对城市树的健康评估,价格低廉。该系统使用使用自定义计算机视觉模型融合的热和多光谱成像传感器来估计两个树健康指数。该系统的评估是通过美国剑桥市的数据集合实验进行的。总的来说,这项工作说明了一种新型的方法,用于以低成本的高时间分辨率,以高成本的高度分辨率对全市范围进行自动移动地面健康监测。
涉及自动驾驶或自动驾驶汽车(AV)的抽象高度宣传的撞车事故提出了有关安全性的问题并侵蚀了公众对技术的信任。在这种最新的审查中,我们借鉴了预防伤害和公共卫生方面的成功,将注意力集中在三种策略上,以降低风险并在公共道路上测试AV时建立公共信心。数据集合,风险敞口的分级方法以及减少危害原则,每个人都提供AV测试的实用课程。评论指出,AV技术的最终部署如何对公共卫生产生重大影响。在这方面,包容性测试,公共教育和智能政策可以通过改善移动性并指导部署到人口健康影响最大的情况来扩大AV的社会价值。这些策略的应用并不意味着放缓进步;相反,他们的实施可以加速采用,并导致更快,全面地实现AV的好处,同时最大程度地降低风险。
鉴于绿色研发支出与企业绿色创新绩效 (GIP) 之间关系的实证证据相互矛盾,本研究旨在探讨 ESG 报告对这种关系的调节作用。我们利用了 CSMAR 和彭博数据库中 2016 年至 2022 年中国 A 股上市公司 3,846 个公司年观测值的数据集合。通过查看绿色专利的总量来评估和衡量企业的 GIP。最后,采用具有多元回归分析和固定效应的模型。研究结果表明,ESG 报告对企业 GIP 与绿色研发支出之间的关联具有积极而显著的影响,这意味着它以绿色产出中的绿色信号的形式发挥着补偿和支持作用。这项研究可以帮助高管和立法者,尤其是发展中国家的高管和立法者,为企业可持续发展制定创新的环境战略。
摘要 — 社交媒体为真正互联的世界创造了机会,改变了人们沟通、交换思想和组织虚拟社区的方式。了解在线行为和处理在线内容对于安全应用都具有战略重要性。然而,大量、嘈杂的数据和主题的快速变化带来了挑战,阻碍了分类模型的有效性和语义模型的相关性。本文对用于分析社交数据流的监督、非监督和语义驱动方法进行了比较分析。本文的目标是确定实证研究结果是否支持增强决策支持和模式识别应用。本文报告了使用各种方法来识别社交数据集合中隐藏模式的研究,其中文本高度非结构化,带有多种模态,并且可能具有不正确的时空标记。结论报告指出,在挖掘社交媒体数据时,机器学习模型和语义驱动方法的脱节使用存在一些弱点。索引词 — 社交网络、混合人工智能、国防和安全
电子商务产品销售数据集是一项有价值且全面的数据集合,可提供有关电子商务电子商务平台上出售产品的性能和趋势的见解。此数据集包含大量信息,包括产品详细信息,定价,客户评论,销售量等。分析此数据集可能对寻求了解消费者偏好,优化定价策略并在竞争性的电子商务世界中做出明智的决策的企业,市场研究人员和数据科学家非常有益。随着电子商务在全球市场中不断扩展的覆盖范围和影响,对于希望在在线零售领域蓬勃发展的企业,获得此类数据的访问变得越来越重要。此数据集可以阐明消费者的行为,产品的受欢迎程度和季节性波动,使公司能够微调营销工作,确定利基市场并量身定制产品,以有效地满足客户需求。在这个以数据驱动的决策时代,电子商务产品是一项金矿,可以利用,以增强市场竞争力,推动销售增长,并最终为客户提供所需的产品。
将生成模型适应持续学习(又称cgl)最近引起了对计算机视觉的极大兴趣(Huang等,2024; Belouadah等,2021)。CGL的臭名昭著的问题是灾难性的遗忘,这反映了这样一个事实,即当发电机学习新任务时,它会忘记其以前学习的任务(Parisi等,2019)。主要的CGL方法是生成性重播(GR)(Shin等,2017; Van de Ven等,2020),该方法在混合数据集中重新训练了一个新的发电机,该数据集合了从先前的生成器和当前任务的真实样品产生的伪样品。一些扩展的CGL方法仅在当前任务数据上训练发电机,例如CEWC(Seff等,2017)和Mgan(Wu等,2018; Liu等,2020)等。然而,这些方法主要在条件生成的对抗网络(CGAN)上进行了研究,并且它们对于单个增量任务是可行的,而对于多个顺序任务,CGAN可以诱导不稳定的训练,从而导致下质量的样品(CONG等,2020)。