我们介绍了当前和未来的预计天气文件的前所未有的数据集,用于在全球10个气候区域分发的15个主要城市建立模拟。数据集包括环境空气温度,相对湿度,大气压,直接和弥漫性太阳辐照度以及小时分辨率下的风速,这是进行建筑模拟所需的必不可少的气候元素。数据集包含Energy Plus天气文件(EPW)格式(EPW)格式的典型和极端天气年份,以及三个时期的逗号分隔价值(CSV)格式的多年预测:历史(2001- 2020年),未来的中期(2041-2060)(2041-2060),以及未来的长期(2081-2100)。数据集是从一个区域气候模型的预测中生成的,这些模型是使用每个城市的多年观察数据对其进行偏差校正的。所使用的方法使数据集成为第一个在极端温度的频率,持续时间和幅度中纳入未来气候中复杂变化的数据集。这些数据集在IEA EBC附件80“建筑物的弹性冷却”中创建,可以用于不同类型的建筑适应和弹性研究,以进行气候变化和热浪。
NESP 海洋和沿海中心提醒,本出版物包含基于科学研究的一般性陈述。读者应注意并需要意识到此类信息可能不完整或无法用于任何特定情况。因此,在未事先寻求专家的专业、科学和技术建议的情况下,不得依赖或采取行动。在法律允许的范围内,NESP 海洋和沿海中心(包括其主办组织、员工、合作伙伴和顾问)对任何人因使用本出版物(部分或全部)及其所含信息或材料而直接或间接产生的任何后果不承担任何责任,包括但不限于所有损失、损害、成本、费用和任何其他赔偿。
从多模式MRI中进行的脑组织分割是许多神经影像分析管道的关键基础。已建立的组织分割方法并未开发出来应对由病理学(例如白质病变或肿瘤)引起的大型解剖变化,并且在这些情况下通常会失败。同时,随着深神经网络(DNN)的出现,脑损伤的分割显着成熟。然而,现有的方法很少允许对正常组织和脑病变的联合分割。当前,注释的数据集通常仅处理一个特定任务,并且依赖任务特定的成像协议,包括任务特定的成像模式集,因此目前妨碍了针对此类联合任务的DNN。在这项工作中,我们提出了一种新的方法,可以从聚合的任务特异性异型模式结构域构建关节组织和病变分割模型。从关节问题的各种公式开始,我们展示了如何通过经验分解和优化预期的风险。我们利用了处理跨数据集的异质成像方式的风险上限。为了应对潜在的域转移,我们基于数据增强,对抗性学习和伪健康的生成进行了整合并测试了三种常规技术。对于每个单独的任务,我们的联合方法与任务特定的和完全监督的模型相比具有比较性能。对两种不同类型的脑损伤进行评估,该框架将进行评估:白质病变和神经胶质瘤。在后一种情况下,缺乏用于定量评估目的的联合基础真相,我们提出并使用一种新型的临床上相关的定性评估方法。
预训练的机器学习(ML)模型有助于创建ML密集型系统,而无需将显着的资源花在培训新模型上。然而,这种模型缺乏透明度可能会导致偏见,公平性,基础数据的可信赖性,甚至可能产生的法律意义。作为案例研究,本文通过拥抱面孔(一个流行的ML模型枢纽)托管的变压器模型,本文经验研究了预训练的变压器模型的透明度。我们研究模型描述(i)指定用于培训预训练的数据集的程度,(ii)讨论他们可能的培训偏见,(iii)声明其许可证,以及使用此类模型的项目是否考虑了这些许可证。结果表明,预先训练的模型对培训数据集,可观偏见和采用许可证仍然有限。此外,我们发现了一些客户项目可能违反许可的案件。我们的发现进一步研究以提高ML模型的透明度,这可能导致人工智能材料法案的定义,产生和采用。
Vision语言基础模型(VLFM)显示出令人印象深刻的概括功能,使其适合域概括(DG)任务,例如合成图像的培训和对真实数据的测试。但是,现有评估主要使用由互联网图像构建的学术基准,类似于用于培训VLFM的数据集。本文评估了基于VLFM的DG算法在两个合成到实体分类数据集,Rareplanes Tiles和飞机上的性能,旨在模仿工业文本。我们的发现表明,虽然VLFMS上的基准优于随机初始化的净作品,但在这些类似工业的数据集中,它们的优势大大降低。这项研究强调了评估模型在不同的代表性数据上的重要性,以了解其现实世界的适用性和局限性。
接触追踪已成为一种强大而有效的措施,以遏制传染性疾病的传播。这是一个强大的工具,但由于接触跟踪需要收集大量个人信息,因此不利的一面是侵犯隐私的风险。因此,需要一个加密原始的原始词,以使用户的个人数据混淆。考虑到所有内容,私人集交叉路口似乎是解决问题的自然选择。几乎所有现有的PSI协议都依赖于基于理论假设的硬性问题。但是,这些问题在量子域中并不安全。因此,对于设计可以抵抗量子攻击并提供长期安全性的PSI至关重要。一个人可以应用量子密码学来开发这种PSI协议。本文使用量子密码学(QC)介绍了PSI的设计,其中安全性取决于基本量子力学的原理。我们的计划实现了长期的安全性,并且由于使用QC而保持量子攻击。与现有的量子PSI协议相反,我们计划的通信和计算成本独立于通用集合的大小。特别是,提出的协议在量子PSI领域实现了最佳的通信和计算成本。此外,与大多数现有的量子PSI协议不同,我们仅需要单个光子量子资源和简单的单粒子投影测量值。
间接用户请求(iurs),例如“这里很冷”而不是“请提高温度?”在人类以任务为导向的对话中很常见,并掌握了听众的世界知识和务实的理由。虽然大型语言模型(LLMS)可以效率地处理这些请求,但由于资源范围而在虚拟助手上部署的较小模型经常在挣扎中挣扎。此外,现有的面向任务的Di-Alogue基准缺乏足够的复杂话语现象的例子,例如直接性。为了解决这个问题,我们提出了一组语言标准以及基于LLM的管道,用于生成现实的IARS,以测试自然语言理解(NLU)和对话状态跟踪(DST)模型,然后再部署在新领域。我们还发布了基于模式指导对话框(SGD)语料库的IURS数据集,作为一个比较测试床,用于评估较小模型在处理指定请求时的实现。
摘要 当 AI 驱动的司法访问 (A2J) 系统中使用的大型语言模型 (LLM) 工具的训练数据集不能反映其社区时,它们就会经历系统性偏见。这种偏见可以说表明,LLM 应该看到其法律基础的有效性在司法管辖权方面受到质疑。由于 ChatGPT 有能力通过美国律师资格考试,这为 LLM 工具提供了希望,即可以在普通人的指导下训练 LLM 工具来执行法律专业人员的工作,从而为服务不足的诉讼当事人带来好处。然而,在审查数据集来源时,在遵守法律主权、法治和结果质量方面出现了重大挑战。虽然隐私和数据安全通常会将数据主权集中在数据保存的地理位置,但 A2J 社区也应该注意对 LLM 训练数据集的司法管辖区外的贡献,这些贡献质疑普遍接受的法律主权规范,并因此扭曲其法律应用,使其超出受影响社区的可接受范围。为了更好地代表 LLM 工具所带来的挑战,提出了一种新颖的四分信息主权理论,涵盖了人口、领土、边界承认和监管等问题。因此,本文将研究并质疑 LLM 是 A2J 的推动者的说法。讨论将涉及如何通过短视的数据主权来避免司法管辖权挑战(例如传统的法律主权),从而规避通常表现为偏见的训练数据偏差的风险,然后再考虑司法管辖权定义的训练数据限制如何影响结果质量和重新制定律师在法律程序中的传统角色。最后,我们将根据当代的关注和诉讼,探讨未能充分应对这些深远挑战(影响从社区到宪法的各个层面)的危险。 关键词 1 系统法律基础的验证;法学硕士;大型语言模型;主权;法治;管辖权;偏见;人工智能风险;采用的语用学;自我代理的诉讼当事人;小组讨论;引导式讨论;正在进行中的“人工智能司法途径研讨会”(AI4AJ 2023),2023 年 6 月 19 日,葡萄牙布拉加 chris.draper@meidh.com;nicky.gillibrand@ucdconnect.ie
摘要 — 可再生能源发电水平的提高激发了人们对数据驱动的交流最优功率流 (AC OPF) 方法的兴趣,以管理不确定性;然而,缺乏规范的数据集创建和基准测试,阻碍了对文献中的方法进行有用的比较。为了树立信心,模型必须能够可靠地预测各种运行条件下的解决方案。本文为 Julia 和 Python 开发了 OPF-Learn 包,它使用一种计算效率高的方法创建代表性数据集,涵盖交流 OPF 可行域的广泛范围。负载曲线是从包含交流 OPF 可行集的凸集中均匀采样的。对于找到的每个不可行的点,使用不可行性证书来减少凸集,这些证书是通过使用宽松公式的性质找到的。与文献中看到的传统技术相比,该框架可以生成更能代表整个可行空间的数据集,从而提高机器学习模型的性能。
摘要:心电图分类或心跳分类是心脏病学中极为有价值的工具。基于学习的深度技术,用于分析ECG信号的技术有助于人类专家及时诊断心脏疾病,并有助于挽救宝贵的生命。本研究旨在将ECG记录图像的数据集数字化到时间序列信号,然后在数字化数据集上应用深度学习(DL)技术。提出了将ECG信号分类为不同心脏类别的最新DL技术。多个DL模型,包括卷积神经网络(CNN),长期的短期记忆(LSTM)网络以及使用自动编码器的基于自律的学习(SSL)模型,并在本研究中进行了比较。这些模型是由来自巴基斯坦各种医疗机构的患者的ECG图产生的数据集培训。首先,将ECG图像数字化,将Lead II心跳分段,然后将数字化信号传递给了提出的分类深度学习模型。在本研究中使用的不同DL模型中,提出的CNN模型达到了约92%的最高精度。所提出的模型非常准确,并为实时和直接监视ECG信号提供了快速推断,这些ECG信号是从放置在身体不同部位上的电极(传感器)中捕获的。使用ECG信号的数字化形式而不是图像进行心律失常分类,可以使心脏病学家直接从ECG机器上直接在ECG信号上使用DL模型,以实时和准确地监视ECGS。