数据库是一个有组织的数据集合,该数据存储为多个数据集。这些数据集通常是通过计算机系统以电子方式存储和访问的,该系统允许数据易于访问,操纵和更新。
摘要。结构系统可能会由于动态激发和惯性而产生负矩。复合金属甲板平板通常设计用于承受正矩,并在底部得到加固,顶部的热增强最小。然而,在动态冲击负载下,上部的固定加固可能会导致这些平板在负矩下失败。因此,本研究调查了在自由下降重量冲击负载下复合金属甲板板的性能。该研究由两个主要部分组成:基于收集到的数据,通过NITE元素模拟分析和培训机器生成数据。LS-DYNA商业软件用于分析具有三个参数的165个模型:平板长度,前锋重量和前锋速度。在机器学习组件中,有限元建模(FEM)结果用于训练机器并准确预测这些板的性能。报告的结果是根据最大负矩,最大DE分解以及平板的弹性和塑性行为报告的。该研究表明,在高前锋速度下,标本在60至80 kN的范围内经历了最终的内部负矩。
电池技术对于全球电气化工作越来越重要。但是,电池对可能引起可靠性或安全性问题的小型制造变化非常敏感。电池质量控制的一项重要技术是计算机断层扫描(CT)扫描,该扫描被广泛用于各种临床和工业应用中的无损3D检查。从历史上看,CT扫描对大批量制造的实用性受到其低吞吐量以及处理其大型文件大小的困难的限制。在这项工作中,我们提供了一千多个CT扫描的数据集,该数据集的商业可用电池。数据集跨越各种化学物质(锂离子和钠离子)以及各种电池形式(圆柱形,小袋和棱镜)。我们总共评估了七种不同的电池类型。可以通过此数据集观察到制造可变性和电池缺陷的存在。该数据集可能对从事电池技术,计算机视觉或两者兼而有之的科学家和工程师感兴趣。
就本备忘录而言,权威数据集 (ADS) 是一种数据产品,它包含一个或多个数据元素,数据生产者与其数据管理员合作,将这些数据元素确定为具有特定范围和目的的权威数据,并定义和衡量数据质量。可以使用多个来源“构建”ADS,并通过聚合、编译或组装“创建”ADS。ADS 的范围通常仅限于一个或多个特定任务(或社区),ADS 的目的是隐含的(例如,缺乏证据)或明确的(例如,证明数据质量方面的元数据指标)。ADS 的特定范围和目的用于为消费者提供有关每个数据元素及其适当用途的见解。数据质量也是 ADS 指定的基础。数据生产者信任其数据,并具有固有的质量,因为他们了解数据是如何为特定范围和目的生成或收集的。国防部数据战略在目标 4.5“使数据值得信赖”的目标 3 中认识到了信任和数据质量的重要性:“国防部执行数据质量管理技术来评估和提高数据质量。” ADS 指定和支持文档与其他 VAULTIS 目标一起扩展了数据生产者的信任,以实现数据消费者的使命。例如,衡量数据质量、确定范围和目的可支持使用“在预期用途范围内易于发现和理解的高质量数据”,如国防部数据战略、指导原则 2.2.7 适合用途的数据所述。因此,ADS 指定和支持文档应为数据消费者提供与数据生产者类似的对数据集质量、范围和目的的信心。ADS 指定。本文档提供了有关指定权威数据集 (ADS) 的初步指导,包括应为每个 ADS 指定指定的关键要素:数据集 (1) 质量、(2) 范围和 (3) 目的。数据管理员将根据 ADS 指定执行数据质量、范围和目的评估,使用以下问卷作为初步指导。数据管理指南将更新以纳入此标准。数据管理员将在对 ADS 进行实质性更改时或至少每年一次审查和更新数据质量评估,直到数据质量测量自动化为止。在 ADS 发生更改时,还应在合理的时间内捕获对 ADS 最初记录的范围或目的的更改。ADS 指定应记录在部门的联合数据目录中。1. 数据集:ADS 数据质量维度。如果不先了解生成或使用数据的原因,数据质量 (DQ) 可能很难衡量。因此,记录 ADS 的具体范围和目的是这对于测量与 VAULTIS 相关的 DQ 维度至关重要。本节提供了 DQ 维度的初始列表。任务领导应考虑这些建议的维度
摘要 现代车辆越来越能够使用支持 GPS 的车载遥测盒实时报告位置和状态信息,这些遥测盒直接连接到车辆的控制和诊断系统。我们对从英国大型城市地区行驶的车辆获得的此类数据进行探索性分析。主要目标是设计信息丰富的汇总统计数据,以便识别不同“类型”的车辆活动并量化异常行为。我们使用位置、速度、时间和发动机状态(点火开/关)将数据组织成时间持续时间增加的工作单元。我们将层次聚类方法应用于这些工作单元的某些功能,以识别不同类型的车辆路径,并量化现代城市交通状况的周期性每日变化如何影响车队的移动和行为。
在 GridLab 的支持下,Catalyst Cooperative 将托管和分发可再生能源数据集。该数据包括按县级发布的每小时太阳能、陆上和海上风电生产情况,汇总了美国本土的 3 公里数据。首次发布包含 2019-2023 年的数据,而 2025 年第一季度的进一步发布将包含 2014-2018 年的数据。该数据集的基础是美国国家海洋和大气管理局的高分辨率快速刷新 (HRRR) 操作数值天气预报模型生成的天气变量。该方法已用于指导现实世界的进程,例如在 2020 年为 Midcontinent Independent System Operator (MISO) 开发数据集。
量子计算有望解决传统计算机无法解决的问题。除了化学或材料科学等量子系统的模拟外,适用于高维问题的量子线性代数算法也出现了激增。这些算法包括线性系统求解器、回归或机器学习算法,它们有可能执行原本不可能完成的数据科学任务。这些原本不可能完成的任务可能涉及非常大的数据集,在这些数据集中,量子算法的优越渐近复杂度扩展可以胜过高度优化的超级计算机代码。必须强调的是,我们和其他量子计算机科学家所指的“优越渐近复杂度扩展”仅评估了处理数据的复杂性。我们在本评论中的目的是阐明将数据编码为适合量子处理的格式这一经常被忽视的复杂性。我们预计量子计算机将通过采用“量子”数据编码来获得优于传统计算机的优势,这意味着数据将以某种量子叠加形式呈现。因此,量子计算机可以利用纠缠和叠加来处理数据,而不是像传统计算机那样逐位处理数据。然后,数据将呈现为无法复制的量子态,需要进行测量才能检索导致叠加崩溃的经典信息。
(这仅供参考 - 作者可以根据研究工作使用其他副标题/内容)1. 简介:当今最有趣的研究课题是机器学习,今天许多人都在机器学习领域工作,一些出版商或研究人员正在发现或更新机器学习的新算法和方法,基本上,机器学习是使机器做出与人脑相同决策的过程。机器学习是人工智能的主要部分,主要分为两类:监督学习和无监督学习。因此,学习阶段分为监督学习、无监督学习和强化学习。作为监督学习过程的一部分,会提出一个输出目标,它可以帮助或使系统学习,它还包含由不同输入属性和输出组成的训练数据实例。监督学习的一个子部分是分类,程序从给定的输入数据中学习并使用此过程对新观察结果进行分类。分类技术有多种类型,例如决策树、神经网络、贝叶斯分类器、支持向量机、K 最近邻等等。以下是一些使用离散数据和连续数据的机器学习分类任务的示例:对信用卡交易进行分类、检测人体疾病(将蛋白质分类为 α 螺旋、β 折叠或随机卷曲的二级结构)、天气预报,以及将新闻报道分类为金融、体育和娱乐。鸢尾花数据集是机器学习中最著名的数据集之一,它包含 150 个鸢尾花样本,具有萼片长度、萼片宽度、花瓣长度和花瓣宽度等测量值。这些样本分为三个不同的种类:山鸢尾、变色鸢尾和维吉尼亚鸢尾。该数据集广泛用于分类任务,由于其简单性和结构良好,是应用机器学习算法的极好起点。
由于地衣对几种环境参数(例如气候因素和空中化学物质)敏感,因此可以将它们作为气候变化和土地利用以及空气污染和其他人类影响的生物鉴定者(Giordani和Brunialti 2015,2015年,Giordani 2019)。历史记录是确定地衣多样性趋势以及解释潜在驱动因素的强制性参考(Nelsen和Lumbsch 2020)。植物标志收集被认为是关于地衣分布的时空数据的基本档案,以及进行操纵和分析研究的物质来源,支持了从当地到全球环境变化的研究(例如Farkas等。 (2022),Wu等。 (2023))。 因此,越来越多地通过多个门户提倡对标本室数据的可访问性。 就意大利而言,由于几种现代意大利地衣植物植物的数据汇总到意大利的意大利信息系统(Martellos等人)(Martellos等),产生了显着的进步 2023)。 该系统目前从13种草药中汇总了88,000多个记录,其中包括herbarium Universitatis tergestinae的数据集(TSB,Conti等人。 2023)和卡拉布里亚大学植物园的植物园(Clu,Conti等人 2024)已经在GBIF中发布。Farkas等。(2022),Wu等。(2023))。因此,越来越多地通过多个门户提倡对标本室数据的可访问性。就意大利而言,由于几种现代意大利地衣植物植物的数据汇总到意大利的意大利信息系统(Martellos等人)(Martellos等2023)。该系统目前从13种草药中汇总了88,000多个记录,其中包括herbarium Universitatis tergestinae的数据集(TSB,Conti等人。2023)和卡拉布里亚大学植物园的植物园(Clu,Conti等人2024)已经在GBIF中发布。
Monika Schwarzhappel 是维也纳国际经济研究所 (wiiw) 统计系主任。Artem Kochnev 和 Isilda Mara 是 wiiw 项目期间的经济学家。Magdalena Frei 曾是 wiiw 的研究助理。Alexandra Bykova 是 wiiw 统计系副主任兼经济学家。Hana Ruskova 和 Renate Prasch 曾是 wiiw 的统计学家。Xhesika Banushi 曾在该项目中担任自由职业者。Manuel Neubauer 曾是 wiiw 的数字化专家。David Zenz 是 wiiw 的数据科学家和 R Shiny 应用程序开发人员,负责编写查询工具和网站 (comecon.wiiw.ac.at)。本统计报告是 OeNB 项目“转型前的东欧:数据数字化和 CESEE 计划经济分析”的一部分。本文的研究由奥地利国民银行周年基金资助(项目编号 18666)。感谢奥地利国民银行为本研究提供的支持。本文中的信息和观点均为作者本人观点,并不一定反映维也纳国际经济研究所 (wiiw) 或奥地利国民银行 (OeNB) 的官方意见。