构建有用的人工智能 (AI) 系统的一个挑战是,人们需要了解它们的工作原理,以便获得适当的信任和依赖。这已成为一个备受关注的话题,表现为对可解释人工智能 (XAI) 的研究激增。许多研究假设了一种模型,其中人工智能会自动生成解释并将其呈现给用户,用户对解释的理解会带来更好的性能。对解释推理的心理学研究表明,这是一个有限的模型。XAI 系统的设计必须充分参考认知模型和教学模型,基于人们试图向其他人解释复杂系统时会发生什么以及人们试图推理出复杂系统如何工作时会发生什么的经验证据。在本文中,我们将讨论 CS Peirce 的溯因推理概念如何以及为什么是 XAI 的最佳模型。皮尔士关于溯因推理是一种探索性活动的观点可以被认为是由于其与现代应用认知心理学家所开发的专家推理模型相一致而得到支持的。
我们介绍了第一代推理模型,即DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero,一种通过大规模增强学习(RL)训练的模型,没有超级微调(SFT)作为初步的步骤,表现出显着的推理能力。通过RL,DeepSeek-R1-Zero自然出现,具有许多强大而有趣的推理行为。但是,它遇到了挑战,例如不良的可读性和语言混合。为了解决这些问题并进一步提高了推理性能,我们引入了DeepSeek-R1,该问题在RL之前结合了多阶段培训和冷启动数据。DeepSeek-R1在推理任务上实现与OpenAI-O1-1217相当的性能。为了支持研究社区,我们开放源DeepSeek-R1-Zero,DeepSeek-R1和六种密集的型号(1.5b,7b,8b,8b,14b,32b,32b,70b),根据Qwen和Llama蒸馏出了DeepSeek-R1。
方法:这是一项人工智能的前瞻性推理测试,针对 2011 年至 2019 年期间澳大利亚悉尼一家医院的癫痫患者的近 14,590 小时成人脑电图数据。推理集包括不同类型和频率癫痫发作的患者,年龄和脑电图记录时间跨度很大。人工智能 (AI) 是一个卷积长短期记忆网络,基于美国数据集进行训练。澳大利亚的数据集大约是美国训练数据集的 16 倍,发作间隔期(癫痫发作之间)很长,比训练集更加逼真,使我们的假阳性结果高度可靠。我们在人工智能辅助模式下,由人类专家裁判和由专家神经病学专家和脑电图专家组成的结果审查小组验证了我们的推理模型,共进行了 66 次,以证明在时间缩短一个数量级的情况下实现了相同的性能。
人类非常善于学习他们所处的环境。它们形成了灵活的周围环境空间表征,可以在空间觅食和导航过程中轻松利用这些表征。为了捕捉这些能力,我们提出了一个目标导向行为的深度主动推理模型,以及随之而来的信念更新。主动推理依赖于优化贝叶斯信念以最大化模型证据或边际可能性。贝叶斯信念是可观察结果原因的概率分布。这些原因包括代理的行为,这使得人们能够将规划视为推理。我们使用地理藏宝任务的模拟来阐明信念更新(支持空间觅食)以及相关的行为和神经生理反应。在地理藏宝任务中,目标是使用空间坐标在环境中找到隐藏的物体。在这里,合成代理通过推理和学习(例如,了解给定潜在状态的结果可能性)了解环境以到达目标位置,然后在本地觅食以发现为下一个位置提供线索的隐藏物体。
内容焦点 - 学生将学到什么?(内容技能集)使用索赔,证据和推理模型,学生将比较和对比有机与常规生产的食物,以发现每种农场生产风格的差异和相似之处。学生将确定植物生产的农场实践和为消费者收获的安全产品。0101.33识别并辩论与农业行业中与生物技术使用相关的问题。0101.37讨论食品标签对消费者的重要性。0101.45比较和对比各种食品标签。0111.48进行感官分析实验,以实现食物和食物添加剂和增强剂的气味,味道和质地0111.51进行食品产品采样和消费者评估活动。0111.58展示了有机食品的知识0111.64确定有机食品材料和资源的特征 - 您需要在课程前组装和准备什么?材料:1个有机苹果和1种相同品种的常规苹果或苹果切片机切菜板口味测试用品:
表。1方法的比较方法研究贡献EWA [3]计算很简单且实用,但是它不考虑时间序列的相关性,从而导致预测准确性较低。cnn [18]不需要复杂的推理模型;但是,它不适用于小样本预测,可能会遇到过度拟合的问题。GFM [31]数据集不需要遵循严格的分布序列,但是对于具有较大随机波动的样本序列可能会发生较差的拟合,从而导致较大的预测误差。Markov [44]从概率的角度分析较差的问题是有益的,但可能很难适应大型样本数据集。svm [52]它可以处理具有非线性和高维度的小样本数据集,但是内核函数的选择可能会影响预测结果。arima [64]通过在历史数据之间寻求自相关,可以通过假设它遵循历史趋势来预测未来。但是,这需要序列是固定的。cfa该方法非常适用,并且在处理小样本随机时间序列数据方面具有高预测精度。总而言之,预测方法的选择直接影响准确性
当前用于对象识别和分类的方法主要依赖于单帧图像中的静态信息。但是,对于战斗空中视频(通常是低分辨率视频),几乎无法获得用于对象分类和识别的所有静态索引。为了应对这一挑战,我们提出了一种创新的3D和动态语义场景分析的方法,该方法利用监视视频数据主要是从无人机平台捕获的,以对静态对象进行分类(例如建筑物)和移动对象(例如车辆)自动。在我们提出的自动对象检测和分类框架中,除了3D静态对象的视觉特征(例如建筑物或车辆的形状,线取向,颜色和纹理)以及城市环境的3D静态结构,我们还探索了动态视频功能,其中包括随时间推移的车辆运动图案。所有这些静态和动态特征都将被视为构造时空特征向量,然后将新生成的向量发送到实时和自动建筑物和车辆分类的概率动态影响图(DID)推理模型。此外,我们还提出了有关自动建筑物检测,3D地形建模和可视化的新颖3D算法,以支持准确的对象分类/分类。1。简介
我们推进了一种新型的认知处理的活跃推理模型,该模型是对层次作用库的获取及其用于观察,理解和模仿的使用。我们在四个模拟中说明了一个网球学习者的模型,该网球学习者观察一名教师进行网球射击,形成观察到的动作的层次结构表示并模仿它们。我们的模拟表明,代理的眼动活动实现了一种主动信息抽样策略,该策略允许推断观察到的运动的运动学方面,该运动位于动作层次结构的最低水平。反过来,这种低级运动学推理支持有关观察到的行动更深层方面的更高层次推论:近端目标和意图。最后,推断的动作表示可以引导模仿响应,但会干扰执行不同的动作。我们的模拟表明,层次的主动推论提供了一项统计的动作观察,理解,学习和模仿的说明,并有助于解释视觉运动认知的神经生物学基础,包括在背侧和腹部和腹流和镜像机制中采取多种操作理解的途径。©2023作者。由Elsevier B.V.这是CC根据许可证(http:// creativecommons .org /licenses /by /by /4 .0 /)的开放访问文章。
人类的大脑可以通过动态变化的环境不断地获取和学习新技能和知识,而不会忘记以前学习的信息。这样的能力可以选择性地将一些重要且最近看到的信息转移到大脑的持续知识区域。受到这种直觉的启发,我们提出了一种基于内存的新方法,用于持续学习中的图像重建和重构,由临时和不断发展的记忆组成,并具有两种不同的存储策略,涉及临时和永久记忆。临时内存旨在保留最新信息,而不断发展的内存可以动态增加其功能,以保留永久的知识信息。这是通过提出的内存扩展机械性来实现的,该机构有选择地将这些数据样本从临时存储器转移到根据信息新颖性标准在进化存储器中罚款的新群集。这种机制促进了进化记忆中群集之间的知识多样性,从而通过使用紧凑的mem-ory容量来捕获更多多样化的信息。此外,我们提出了一种两步优化策略,用于训练变分自动编码器(VAE)以实现生成和表示学习任务,该策略使用两个优化路径分别更新了生成器和推理模型。这种方法导致了一代和重建性能之间的取舍。源代码和补充材料(SM)可在https://github.com/dtuzi123/demc上找到。我们从经验和理论上表明,所提出的方法可以学习有意义的潜在表示,同时从不同领域产生各种图像。
在一个上下文中似乎很明显的话,如果该上下文发生变化,则可以具有完全不同的含义。11尽管已经广泛研究了与上下文相关的推论,但一个基本问题仍然存在:12大脑如何同时推断感觉输入的含义和基本的13个上下文本身,尤其是当上下文在变化时?在这里,我们研究了灵活的感知分解14个 - 能够迅速适应而无需反复试验的上下文转移的能力。我们在动态环境中引入了15个新颖的变更检测任务,需要跟踪潜在状态和16个上下文。我们发现,小鼠表现出对潜在上下文的第一审判行为适应,而不是推理而不是奖励反馈。通过在可观察到的马尔可夫决策过程中得出贝叶斯最佳政策,我们表明,快速适应从内部信念状态的顺序19个更新中出现。此外,我们还表明,通过20枚强化学习训练的人工神经网络实现了近距离的性能,从而在其复发性动态中实现了类似贝叶斯推理的21种机制。这些网络开发了灵活的内部代表 - 22个tations,可以实时调整推理模型。我们的发现建立了灵活的23感知推断,作为认知灵活性的核心原理,为在不确定环境中的适应性行为提供了计算和24个机械性见解。25