鉴于大语言模型(LLMS)的出色表现,出现了一个重要的问题:LLM可以进行类似人类的科学研究并发现新知识,并充当AI科学家吗?科学分解是一个迭代过程,需要有效的知识更新和编码。它涉及理解环境,识别新的假设以及对行动的推理;但是,没有专门为LLM代理的科学发现设计的标准化基准。响应这些限制的局面,我们引入了一个新颖的基准,即自动基准,该基准包括必要的方面,以评估自然科学和社会科学中的科学发现的LLM。我们的基准测试基于因果图剖面的原理。它挑战模型以发现隐藏的结构并做出最佳决策,其中包括生成有效的理由。通过与甲骨文进行交互性结合,这些模型通过战略干预措施迭代地完善了他们对不认识的相互作用,化学和社会传播的理解。我们评估了最新的LLM,包括GPT-4,Gemini,Qwen,Claude和Llama,并且随着问题的复杂性的增加而观察到显着的性能下降,这表明机器和人类智慧之间的重要差距表明,未来LLMS的未来发展需要考虑。
摘要 - 作为电子系统在现代车辆中变得越来越复杂且普遍存在,因此在板载网络上保护至关重要,特别是这些系统中的许多都是至关重要的。研究人员表明,现代车辆容易受到各种攻击的影响,从而使攻击者能够控制并损害安全 - 关键的电子系统。因此,文献中已经提出了几种入侵检测系统(IDS)来检测对车辆的这种网络攻击。本文介绍了一个基于新颖的生成分类器的入侵检测系统(IDS),该系统(IDS)专为汽车网络中的异常检测而设计,特别关注控制器区域网络(CAN)。利用变异贝叶斯,我们提出的ID使用深层可变模型来构造有条件概率的因果图。使用自动编码器体系结构来构建分类器以估算条件概率,这有助于通过贝叶斯推断的最终预测概率。对公共汽车挖掘数据集上针对最新IDS的比较评估突出了我们提出的分类器在提高检测准确性和F1分数方面的出色表现。提出的ID通过用有限的培训数据胜过现有模型来证明其功效,从而为汽车系统提供了增强的安全保证。
找到无人驾驶飞机(UAV)故障的实际原因可以分为两个主要任务:建立因果模型和对其进行实际因果分析(ACA)。虽然文献中有可用的解决方案可以执行ACA,但构建全面的因果模型仍然是一个开放的问题。通常由域专家手动执行的昂贵且耗时的构建过程,阻碍了基于因果关系的诊断解决方案的广泛应用。本研究提出了一种基于自然语言处理的方法,用于自动化无人机的因果模型。从在线资源中收集文本数据后,在句子中确定了因果关键字。接下来,基于代币之间的预定依赖性规则从句子中提取原因 - 效应短语。最后,提取的原因对成对合并以形成因果图,然后我们将其用于ACA。为了演示我们的框架的适用性,我们刮擦了一个开源无人机控制器软件Ardupilot的在线文本资源。我们使用真实飞行日志的评估表明,生成的图可以成功地用于查找不良事件的实际原因。此外,我们的混合因果 - 效应提取模块的性能要比纯学习的工具(即CIRA)的精确度比纯学习的工具(即CIRA),而在我们的Ardupilet用例中,召回率为25%。
由于评估标准多重且相互交织,而且未经证实的新技术本身具有不确定性,因此很难评估 NASA 的先进技术项目。传统的多标准决策模型往往忽略了评估过程中的相互依赖性和不确定性。我们提出了一种模糊加权影响非线性量规系统 (WINGS) 来评估肯尼迪航天中心 (KSC) 的先进技术项目。WINGS 方法使用表意因果图来揭示复杂问题中相互交织的标准及其因果关系。模糊集理论是一种有效的方法,它使用模糊逻辑来模拟定义不明确的问题中的不确定性。本研究提出的模糊 WINGS 方法通过识别依赖关系 (影响) 的方向及其强度以及评估标准的强度来揭示评估标准之间的相互依赖关系。模糊判断用于应对未经测试的新技术中的不确定性。传统的 WINGS 方法不考虑解空间中的参考点。为此,我们引入了理想解和最低点解的概念,这是 WINGS 的新概念,根据备选方案与理想解(或最低点解)之间的欧几里得距离对备选方案进行排序。最后,我们提出了一个案例研究,根据六个相互交织的标准和 38 个子标准对 KSC 的十个先进技术项目进行评估,以证明本研究提出的新模糊 WINGS 方法的适用性。
摘要 - 本文提出了一种新的在线功能选择方法,并意识到群体公平。它的症结在于优化所选特征子集中产生模型的准确性和公平性之间的权衡。我们设置的技术挑战是双重的:1)流媒体功能输入,因此,如果其信息已被其之前到达的其他类似功能涵盖的信息可能会过时或重新进行预测,而2)2)非缔合功能相关性,从而使这些偏见可能从这些看似可理解的,未经保护的功能中泄漏出来。为了克服这一点,我们提出了通过因果公平(SFCF)的流式特征选择,该特征选择分别构建了两个因果图,分别为预测标签和受保护特征,努力建模流媒体特征,标签和受保护信息之间的复杂相关结构。因此,可以通过去除这些特征与受保护的特征相关但与标签无关的因果关系来从预测建模中消除偏差。我们认为,当大量删除的功能(未受保护但可用于重建偏见信息)损害学习准确性时,最初的预测功能后来可以被接受。我们在流式传输特征研究中广泛使用的五个数据集上的SFCF基准,结果证明了其在六个竞争对手模型上的性能优越性,就特征选择的效率和稀疏性而言,以及由此产生的预测模型的均衡优势。
在工业环境中从传感器中收集的实时数据的增加量加速了机器学习在决策中的应用。增强学习(RL)是找到实现给定目标的最佳政策的强大工具。但是,RL的典型应用是风险的,并且在动作可能会产生不可逆转并需要解释性和公平性的环境中不足。虽然RL的新趋势可能会根据专家知识提供指导,但它们通常不考虑不确定性或在学习过程中包括先验知识。我们提出了基于贝叶斯网络(RLBN)的因果增强学习替代方案,以应对这一挑战。RLBN同时对政策进行建模,并利用国家和行动空间的联合分布,从而降低了未知情况下的不确定性。我们根据奖励功能和效果和测量的可能性,为网络参数和结构提出了一种培训算法。我们使用普通微分方程(ODE)对Cartpole基准和工业结垢进行了实验表明,RLBN比竞争对手可以解释,安全,灵活和更强大。我们的贡献包括一种新颖的方法,该方法将专家知识纳入决策引擎。它使用带有预定义结构的贝叶斯网络作为因果图和一种混合学习策略,这些策略都考虑了可能性和奖励。这将避免失去贝叶斯网络的优点。
• 因果发现 (CD) — 分析和构建描述数据中固有因果关系的模型 • 因果公平性 — 结果导致的决策中没有偏见 • 因果力 — 影响时间序列趋势的因素的累积方向性效应 • 因果图 — 可视化变量或事件之间的因果关系 • 因果 ML — 因果关系与机器学习的结合或赋予 • 因果 RL — 因果关系与强化学习的结合或赋予 • 计算语言学 — 训练机器理解问题和语言 • 混杂因素 — 因果关系中导致虚假相关的影响变量 • 反事实分析 — 对因果模型的干预,用于“假设”情景 • 相关性 — 对统计关系的依赖,无论是否有因果关系 • 深度学习 (DL) — AI 和机器学习的子集,用于复杂的决策 • 集成建模 — 将多个分析模型的结果组合成一个模型 • 实验数据 — 控制的能力或干预模型中的变量作为实验,以查看产生的结果是否涉及因果关系 • 可解释人工智能 (XAI) - 允许人类理解人工智能结果的过程 • 特征集 - 由主题专家为因果人工智能使用而生成的知识数据集 • 生成人工智能 (GAI) - 能够根据提示生成文本、图像和视频的人工智能 • 图形知识数据库 - 变量关系的图形表示 • 知识价值链 - 捕获、存储和重用知识的过程 • 机器学习 (ML) - 使用数据和算法让机器像人类一样学习 • 观察数据 - 观察某些变量以确定相关性的能力 • 强化学习 - 训练自动代理做出实时决策的人工智能 • 变量 - 因果人工智能测量的对象、事件、时间序列或数据项
为了实现这一目标,必须增加空间规划过程中环境评估工具的变革潜力。这是BioPolue项目中任务2.3的重点,该项目旨在“了解海洋和EIA中使用的空间规划和基础设施开发中的因果机制,以探索如何改进这些机制,以增强其在为生物多样性产生变革性行动中的作用中的作用”(生物生物生物项目描述)。任务2.3涉及注释和分析环境影响评估(EIA)和战略环境评估(SEA)报告中的因果关系,从而导致了与空间计划和管理工具相关的因果关系和生物多样性缓解层次结构的因果图工具。建立在这个基础上,系统思维方法提供了一种强大的方法,可以绘制和分析潜在空间变化涉及的因果关系,如因果环图(CLD)所示。这种方法不仅可以补充,而且通过确定互连和反馈产生的最关键要素,过程和动态来显着提高环境评估的有效性。这些因素在空间计划过程中的决策和使用中的使用至关重要。不仅了解直接影响,还了解空间规划的反馈机制,重点和工具可以解决自我生成过程,从而支持计划目标。因此,它增加了在空间规划过程中环境评估工具的变革潜力。此外,系统分析揭示了系统结构和产生的动态过程,这些过程是由正(增强)和负(平衡)反馈回路的相互作用产生的(Sterman,2000)。这两种机制对于理解在计划,计划和项目的影响下的要素之间的因果关系和非线性动态至关重要。它还促进了可行杠杆点的识别,这是系统中可能受到影响以获得更好结果的关键点。确定这些要点可能会导致有关避免,最小化或弥补潜在影响以及增强生物多样性标准的措施机会的知情建议(Meadows,1997)。因此,通过将这些改进的海洋和EIA工具整合到空间规划过程中,可以大大提高增强生物多样性和实现可持续发展目标的变革性潜力。这种对因果效应的理解的实际影响取决于实际的计划过程和应用程序的上下文。
摘要 科学界普遍认为,自然资源在暴力冲突中发挥着重要作用。资源的稀缺性和丰富性都会导致暴力冲突,这取决于当时的社会经济和政治条件。因此,自然资源的关键性可能比稀缺性或丰富性更能描述与暴力冲突的联系。然而,研究难以揭示导致自然资源冲突的确切社会环境机制。因此,自然资源管理干预措施在预防冲突和建设和平方面效果有限。本论文的总体目标是促进对暴力自然资源冲突潜在机制的理解,以有效预防冲突。本论文重点关注 1989 年以来国家内部的暴力自然资源冲突,因为随着冷战的结束,武装冲突的性质越来越多地转向国内冲突。我提出以下问题:(1)什么是关键的自然资源?(2)考虑到复杂的社会经济和政治背景,自然资源和暴力冲突在数量上是否相关?(3)将自然资源与暴力冲突联系起来的核心社会环境因果途径是什么? (4) 有哪些机会可以防止因资源使用而引发的暴力冲突?采用了多种方法,包括系统文献综述、文本数据的开放编码、使用逻辑回归和机器学习技术的预测模型、因果网络映射以及因果图的网络分析。第一篇论文通过定义自然资源冲突并描述分析它们的三个分析视角(通过资源特征、冲突周期和地理尺度)从理论上阐述了这一论点。本论文的第二篇论文表明,现有的对关键自然资源的描述过分强调其经济重要性,而忽视了生态系统支持和自然资源的社会文化功能;与可再生能源相比,不可再生资源的比例过高。因此,它提出了一种新的、整体的自然资源关键性定义,该定义基于人类需求的层次结构,而不仅仅是经济价值。第三和第四篇论文证实了自然资源变量在数值预测冲突方面的重要性,尽管它们的影响通常受到中间社会经济变量的影响。更具体地说,水和食物等可再生能源是冲突的重要预测因素,而非可再生能源的重要性则不如先前的研究表明的那样。在所有确定的社会环境相互作用中,粮食生产与其经济和人口背景之间的相互作用最为密切。第五篇论文确定了自然资源冲突的因果路径上的关键结构点,这些结构点可能有助于有效预防冲突。为了将冲突的恶性循环扭转为和平的良性循环,我的分析发现,必须改善国家和自然资源管理机构,平衡资源的供应和需求,限制人口流动,并确保足够的生计。我的分析进一步发现,资源开发及其产生的收入以及环境保护和遏制环境恶化可以稳定和平局势。