随着电动汽车(EV)的运营寿命终结,其电池保留了巨大的经济价值,并为二人使用和物质回收提供了有希望的机会。这对于全球南部和其他欠发达地区特别有说服力,在这里,可靠的能源存储对于解决弱甚至不存在的电网和能源基础设施所带来的关键挑战至关重要。,尽管存在这种潜力,但围绕第二次生命电池的技术性能,安全性和重新认证的严重不确定性阻碍了广泛的采用。在重新部署它们的情况下,估计和实际性能之间的不匹配通常会使电池在技术上不合适或危险,从而使他们成为打算受益的社区的责任。这种严重的未对准加剧了能源访问差异,并破坏了能源正义的更广泛的愿景,强调了迫切需要强大而可扩展的解决方案以释放潜力。在Pulsebat数据集中,作者测试了464个退休的锂离子电池,涵盖了3种阴极材料类型,6种历史用法,3种物理格式和6种容量设计。对每个第二寿命电池进行重复进行脉冲测试实验,其脉冲宽度,10个脉冲幅度,多重电荷和健康状况,例如,从0.37到1.03(由于不一致而导致的名义容量)。pulsebat数据集的一部分用于自然通信出版物,该出版物解决了在随机分布状态的收费状态下解决了最先进的估计问题1。PulseBat数据集记录了这些测试条件,电压响应以及受注入的脉冲电流约束的温度信号,这些脉冲电流可用作关键诊断任务的宝贵数据资源,例如电荷估计,最新估计,最先进的健康估计,PORTODE材料类型识别,开放式电流电流重新构造,热管理,热管理,以及其他。
- 来自东北能源效率伙伴关系(NEEP)寒冷气候空气源热泵列表的数据用于更新性能指标和曲线•这些更新允许可变的速度热泵建模,这些更新更反映了寒冷气候热泵的实际性能和操作条件
目的 本研究旨在通过整合来自多个来源(包括 LitVar 数据库、PubMed 和 GWAS 目录)的数据,创建与营养相关的人类遗传多态性的综合数据集。这一整合资源旨在通过提供可靠的基础来探索与营养相关性状相关的遗传多态性,从而促进营养遗传学研究。 方法 我们开发了一个数据集成流程来组装和分析数据集。该流程从 LitVar 和 PubMed 中检索数据,合并数据以构建统一的数据集,定义综合 MeSH 查询以检索相关的遗传关联,并将结果与 GWAS 数据交叉引用。 结果 生成的数据集汇总了有关遗传多态性和营养相关性状的大量信息。通过 MeSH 查询,我们确定了与营养相关性状相关的关键基因和 SNP。与 GWAS 数据的交叉引用提供了与这种遗传多态性相关的潜在影响或风险等位基因的见解。共现分析揭示了有意义的基因-饮食相互作用,推动了个性化营养和营养基因组学研究。结论本研究提供的数据集整合并组织了与营养相关的遗传多态性信息,有助于详细探索基因-饮食相互作用。该资源推动了个性化营养干预和营养基因组学研究。该数据集可在 https://zenodo.org/records/ 14052302 上公开访问,其适应性结构确保了其在广泛的遗传学研究中的适用性。
摘要。代码气味是软件代码中潜在问题的指标,可以使维护更具挑战性。传统的检测代码气味的方法主要依赖于手工制作的规则和启发式方法,而最近的进步探索了机器学习(ML)和深度学习(DL)技术。在本文中,我们研究了基于迅速的大语言模型(LLM)在代码气味检测中的应用,利用最先进的模型,即经过生成的预训练的预训练的Transformer-4(GPT-4)和大型语言模型Meta AI(LLAMA)。我们对机器学习代码质量(MLCQ)数据集进行了广泛的分析,重点介绍这些LLM在提示识别和分类代码气味时的性能。通过系统地评估每个模型的性能,我们提供了对它们的精确,召回和能够跨越不同类型的代码气味的能力的见解。我们的结果旨在证明LLM的潜力是自动化某些类型的代码气味的有前途的工具,同时表现不佳。
电池技术对于全球电气化工作越来越重要。但是,电池对可能引起可靠性或安全性问题的小型制造变化非常敏感。电池质量控制的一项重要技术是计算机断层扫描(CT)扫描,该扫描被广泛用于各种临床和工业应用中的无损3D检查。从历史上看,CT扫描对大批量制造的实用性受到其低吞吐量以及处理其大型文件大小的困难的限制。在这项工作中,我们提供了一千多个CT扫描的数据集,该数据集的商业可用电池。数据集跨越各种化学物质(锂离子和钠离子)以及各种电池形式(圆柱形,小袋和棱镜)。我们总共评估了七种不同的电池类型。可以通过此数据集观察到制造可变性和电池缺陷的存在。该数据集可能对从事电池技术,计算机视觉或两者兼而有之的科学家和工程师感兴趣。
在安全关键型飞机领域,在着陆进近期间实施用于跑道检测的物体检测方法受到限制。这种限制是由于验证设计和理解物体检测在操作过程中的行为方式的能力所带来的困难。在操作过程中,物体检测需要考虑飞机的位置、环境因素、不同的跑道和飞机姿态。训练这样的物体检测模型需要一个定义上述特征的综合数据集。需要分析特征对检测能力的影响,以确保数据集中图像的正确分布。收集这些场景的图像成本高昂,而且是航空业安全标准的必需要求。合成数据可用于限制创建包含所有特征的数据集所需的成本和时间。通过在模拟环境中生成数据集的形式使用合成数据,这些特征可以直接应用于数据集。这些特征也可以在不同的数据集中单独实现,并相互比较,以分析它们对物体检测能力的影响。利用该方法实现上述功能,可以确定以下结果。为了使物体检测考虑大多数着陆情况和不同的跑道,数据集需要复制真实飞行数据并生成额外的极端着陆情况。数据
分子表示学习(MRL)是机器学习对化学的有力贡献,因为它将分子转换为数值表示,这对于多样化的下游应用(例如财产预测和药物设计)至关重要。MRL在蛋白质和一般生物分子方面取得了巨大的成功,但尚未探索它在糖离和糖材料的生长领域(碳水化合物的研究和设计)中的碳水化合物。这种不足的探索主要归因于全面且策划良好的碳水化合物特异性数据集的可用性有限,并且缺乏机器学习(ML)技术,以解决碳水化合物数据带来的独特问题。解释和注释碳水化合物数据通常比蛋白质数据更复杂,需要大量的领域知识。此外,现有的MRL方法主要针对蛋白质和小生物分子进行了优化,并且对于没有特殊修饰的碳水化合物应用可能不有效。为了应对这一挑战,加速了糖基础和糖原的进展,并丰富了ML社区的数据资源,我们介绍了GlyConmr。GlyConMR包含两个富有费用的数据集,这些数据集具有2,609个碳水化合物结构和211,543个注释的核磁共振(NMR)原子级化学移位,可用于训练ML模型以进行精确原子级预测。我们量身定制了一组碳水化合物特异性的功能,并适应了现有的基于3D的图形神经网络,以解决有效预测NMR变化的问题。为了进行插图,我们在甘康MR上基准了这些经过修改的MRL模型。NMR数据是开发ML技术以促进糖性和糖材料研究的最具吸引力的起点之一,因为NMR是碳水化合物结构研究中的杰出技术,而生物分子结构是功能和特性的预测因素。
Monika Schwarzhappel 是维也纳国际经济研究所 (wiiw) 统计系主任。Artem Kochnev 和 Isilda Mara 是 wiiw 项目期间的经济学家。Magdalena Frei 曾是 wiiw 的研究助理。Alexandra Bykova 是 wiiw 统计系副主任兼经济学家。Hana Ruskova 和 Renate Prasch 曾是 wiiw 的统计学家。Xhesika Banushi 曾在该项目中担任自由职业者。Manuel Neubauer 曾是 wiiw 的数字化专家。David Zenz 是 wiiw 的数据科学家和 R Shiny 应用程序开发人员,负责编写查询工具和网站 (comecon.wiiw.ac.at)。本统计报告是 OeNB 项目“转型前的东欧:数据数字化和 CESEE 计划经济分析”的一部分。本文的研究由奥地利国民银行周年基金资助(项目编号 18666)。感谢奥地利国民银行为本研究提供的支持。本文中的信息和观点均为作者本人观点,并不一定反映维也纳国际经济研究所 (wiiw) 或奥地利国民银行 (OeNB) 的官方意见。
1 Helmholtz AI,德国Helmholtz慕尼黑2肺健康与免疫学院(LHI),德国Helmholtz Munich,德国3号计算机科学系,德国慕尼黑技术大学