销售点(POS)是一种计算机化的硬件和软件系统,可用于完成销售交易。在处理总计之前,在常规POS设置中,收银员手动扫描单个产品条形码。此手动程序很费力,通常会导致长期排队和等待时间,尤其是在高峰时段,最终影响了客户体验和保留。这项工作旨在通过计算机视觉方法自动化产品扫描程序,从而加快了销售流程。在马来西亚零售店中发现的常见产品的自定义数据集上训练了一个有效的Yolov4对象检测模型。最初获取了550张图像,并将80:20分为培训和验证组;进一步的增强培训组的大小增加了1,320张图像。以0.0013的学习率进行了10,000个时期的训练。在训练期间,该模型获得了99.19%的地图,平均IOU的87.42%,平均损失为0.40。随后,该模型被部署在运行事务通知程序的低功率单板计算机上。为了评估其性能,使用该系统处理了10种具有随机产品组合的购物车实例。系统通过其视频供稿自动识别和量化了所有产品,并实时生成逐项账单。以0.9置信度阈值固定,系统在所有对象类中产生98%的平均精度。在短短14秒内处理了从产品检测到将逐项账单交付给系统管理员的交易。此POS系统具有与无人商店集成的潜力,可提供无缝的购物体验。
预测误差理论对妄想症的解释已经取得了成功。然而,它对不同内容的妄想症的解释却一直不足。被害妄想症和偏执狂是常见的毫无根据的信念,即他人对我们怀有恶意。其他妄想症包括相信自己的思想或行为受到外部控制,或相信世界上的事件具有特定的个人意义。我们比较了两种不同的认知任务中的学习情况,即概率逆转学习和卡明阻断,它们分别与偏执和非偏执的妄想类信念有关。我们发现,单独的临床高风险状态不会导致概率逆转学习任务中的不同行为结果,但个体的偏执程度与过度的转换行为有关。在卡明阻断任务中,偏执者对被阻断的线索学习不当。然而,他们对控制线索的学习也有所减少,这表明他们存在更普遍的学习障碍。非偏执妄想类信念信念(但不是偏执狂)与被阻断线索的异常学习有关,但与控制线索的学习有关,这表明与线索组合相关的学习存在特定障碍。我们分别将任务特定的计算模型与行为数据相匹配,以探索潜在参数在个体之间如何在任务之间变化以及它们如何解释症状特定的影响。我们发现偏执狂与概率逆转学习任务和阻断任务中的低学习率有关。非偏执妄想类信念信念与控制同时呈现线索时线索更新的相似程度和方向的参数有关。这些结果表明,偏执狂和其他妄想类信念涉及学习和信念更新的可分离缺陷,鉴于偏执狂的跨诊断状态,这可能在预测精神病方面具有不同的效用。
摘要 — 有效的患者监测对于及时干预和改善医疗结果至关重要。传统的监测系统通常难以处理生命体征波动的复杂动态环境,从而导致延迟识别危急情况。为了应对这一挑战,我们提出了一种使用多智能体深度强化学习 (DRL) 的新型 AI 驱动患者监测框架。我们的方法部署了多个学习代理,每个代理都专用于监测特定的生理特征,例如心率、呼吸和体温。这些代理与通用医疗监测环境交互,学习患者的行为模式,并根据估计的紧急程度做出明智的决策以提醒相应的医疗应急小组 (MET)。在本研究中,我们使用来自两个数据集的真实生理和运动数据来评估所提出的多智能体 DRL 框架的性能:PPG-DaLiA 和 WESAD。我们将结果与几个基线模型进行了比较,包括 Q-Learning、PPO、Actor-Critic、Double DQN 和 DDPG,以及 WISEML 和 CA-MAQL 等监测框架。我们的实验表明,所提出的 DRL 方法优于所有其他基线模型,可以更准确地监测患者的生命体征。此外,我们进行超参数优化,以微调每个代理的学习过程。通过优化超参数,我们提高了学习率和折扣因子,从而提高了代理在监测患者健康状况方面的整体表现。与传统方法相比,我们的 AI 驱动的患者监测系统具有多种优势,包括能够处理复杂和不确定的环境、适应不同的患者状况以及在没有外部监督的情况下做出实时决策。然而,我们发现了与数据规模和未来生命体征预测相关的局限性,为未来的研究方向铺平了道路。
工具性学习涉及皮质纹状体回路和多巴胺能系统。该系统通常在强化学习 (RL) 框架中通过逐步积累状态和动作的奖励值来建模。然而,人类学习也涉及参与高级认知功能的前额叶皮质机制。这些系统的相互作用仍然不太清楚,人类行为模型经常忽略工作记忆 (WM),因此错误地将行为差异分配给 RL 系统。在这里,我们设计了一个任务,突出了这两个过程的深刻纠缠,即使在简单的学习问题中也是如此。通过系统地改变学习问题的大小和刺激重复之间的延迟,我们分别提取了负载和延迟对学习的 WM 特定影响。我们提出了一种新的计算模型,该模型解释了在受试者行为中观察到的 RL 和 WM 过程的动态整合。将容量有限的 WM 纳入模型使我们能够捕获在纯 RL 框架中无法捕获的行为差异,即使我们(难以置信地)允许每个集合大小的 RL 系统分开。 WM 成分还允许对单个 RL 过程进行更合理的估计。最后,我们报告了两种基因多态性对前额叶和基底神经节功能具有相对特异性的影响。编码儿茶酚-O-甲基转移酶的 COMT 基因选择性地影响了 WM 容量的模型估计,而编码 G 蛋白偶联受体 6 的 GPR6 基因则影响了 RL 学习率。因此,这项研究使我们能够指定高级和低级认知功能对工具学习的不同影响,超出了简单 RL 模型提供的可能性。
摘要 本研究旨在调查拿督佩玛苏里中学教师对教学实践中使用人工智能工具的看法。根据全球教育领域的变化趋势,人工智能 (AI) 的使用日益广泛。目的:旨在增强学习和教学过程,提高效率。人工智能在教育中的运用也创造了提高教育质量、使学习更具适应性以及让年轻一代为应对未来挑战做好准备的机会。在马来西亚,许多教师在设计引人入胜的学习体验方面仍然面临挑战。此外,不支持差异化学习方法的无效教学策略会导致学生的学习率提高。目的:本研究旨在调查拿督佩玛苏里中学教师对使用人工智能的好处、可用性、社会影响力和接受人工智能的准备程度的看法。方法:本研究采用描述性定量方法,通过调查问卷收集数据。问卷分发给了拿督 Permaisuri 中学的 90 名教师,根据 Krejcie 和 Morgan 表,仅选取 73 名受访者作为本研究的样本。然后使用社会科学统计软件包 (SPSS) 15 版分析数据。结果:研究结果表明,对使用效益、可用性、社会影响力和接受准备度的看法高度一致。社会影响力和接受准备度之间的相关强度最高,r=0.66,p<0.05,而可用性为 r=0.49,p<0.05,感知有用性为 r=0.58,p<0.05。结论:但总体而言,它表明了中等程度的关系。多元线性回归 beta 系数值显示,b(0.58)对拿督 Permaisuri 中学教师在教学中接受人工智能的准备度水平的贡献最大,即社会影响力。结论:总体而言,本研究的结果表明,上级的鼓励和社会的影响对于鼓励教师在教学中充分采用人工智能至关重要。
基于奖励的学习和决策是了解注意力缺陷多动障碍(ADHD)的症状的主要候选人。但是,只有有限的证据可用于多动症中所见变化的神经计算基础。这涉及动态变化的环境中的灵活行为适应,这对于患有多动症的人来说是具有挑战性的。先前的一项研究表明,青少年多动症的选择转换升高,伴随着内侧前额叶皮层中的学习信号。在这里,我们使用概率逆转学习实验(fMRI)研究了与年龄和性别匹配的对照(n = 17)相比,我们研究了ADHD(n = 17)的年轻人(n = 17)。任务需要持续学习,以指导灵活的行为适应变化的奖励意外事件。为了解开行为数据的神经计算基础,我们使用了加固学习(RL)模型,该模型为fMRI数据的分析提供了信息。ADHD患者的表现比对照组较差,尤其是在逆转之前的试验中,即奖励调解稳定时。这种模式是由“嘈杂”选择切换产生的,无论先前的反馈如何。RL建模显示,ADHD患者的负反馈降低了增强敏感性和增强的学习率。在神经水平上,这反映在ADHD中左后顶叶皮层中选择概率的降低表示。由于样本量相对较小,这些神经计算发现仍然是初步的。建模显示了对未选择选项的学习的边缘降低,这与学习信号的边缘减少相似,该学习信号纳入了左侧腹侧纹状体中的未选择选项。在一起,我们表明,多动症中的灵活行为受损是由于选择过度切换(“超灵活性”),这取决于学习环境,这可能是有害的或有益的。在计算上,这是由于对加强的敏感性而引起的,我们检测到了注意力控制网络中的神经相关性,特别是在顶叶皮层中。
主算法(算法 1)首先从我们需要解决的目标 6 实例(算法 2)创建一个子实例任务池,并可能从其他未解决的实例中创建子实例以进一步提高性能(选项 MIX)。通常,任务池包含 100,000 个任务或子实例。8 在每次迭代中,采样器/老虎机从池中挑选一批任务子实例并将其传递给 9 RL 代理。一批通常有 500 个任务或子实例(算法 3)。10 基于蒙特卡洛树搜索(算法 4)的 RL 代理,借助神经网络(CNN 或 11 GNN)进行增强,尝试解决这些实例。对于批次中的每个实例,MCTS 都会在给定的资源预算下寻找一个解决方案,对于生成的每个成功解决方案,MCTS 还会为策略/价值深度网络(训练器)生成一系列新的训练数据,以进一步更新其网络参数。每个实例的 MCTS 成功/失败状态都会发送回采样器/老虎机以调整其权重。每次成功的尝试不仅会生成一个有效的解决方案,还会为训练器改进策略/价值数据,以训练代理的深度网络。训练器会保留一个大小为 100000 的池子,用于存储 MCTS 生成的最新训练数据,并训练网络。每个训练批次都会均匀随机抽样。所有实验均在配备 2x18 19 核 Xeon Skylake 6154 CPU 和 5 个 Nvidia Tesla V100 16GB GPU 的机器上完成,所有训练组件均使用学习率为 0 的 Adam。 002作为默认优化器。MCTS模拟次数R设置为1600,Exp3每次迭代采样的batch size M设置为500。
ERCOT 电网建模当资本支出或 CAPEX 等于或低于每兆瓦 (MW) 300 万美元且固定运营费用或 OPEX(固定)低于每兆瓦年 105,000 美元时,可建设 SMR 核电容量。此外,当 CAPEX 为每兆瓦 200 万美元时,可在所有 OPEX 情景(每兆瓦年 150,000 至 75,000 美元)下建设核电容量。目前,联邦税收抵免可以降低新核电站的资本或运营成本。建模结果表明,休斯顿和达拉斯是负荷中心,由于其工业需求和不断增长的人口,很可能获得最多的 SMR 容量。(通过在高峰时段将风能和太阳能输送到德克萨斯州,SMR 部署可以避免满足不断增长的电力需求。)估计的经济影响我们使用在德克萨斯州建造和部署的一系列 300MW 机组的估计值模拟了三种经济影响情景。考虑到目前还没有 SMR 投入运行,我们承认核能专家对未来几十年内预计部署的 SMR 装置的估计范围很广。此外,我们假设 SMR 将增加州和国家的能源发电结构,而不是取代或取代现有的传统电力发电。在我们在本报告中模拟的三种情景(低、中和高投资)中,中情景假设仅在德克萨斯州就建造和部署了 37 个 300MW 装置,到 2055 年,在德克萨斯州建造并在美国各地部署的装置将达到 771 个,代表德克萨斯州和美国的 SMR 发电量为 242 千兆瓦 (GW)。这种情景(建造和部署的装置数量为中等,使用中等资本支出和运营支出估计以及中等学习率)将产生重大的经济影响。平均而言,在未来 26 年内可能会出现:
超分辨率(SR)生成对抗网络(GAN)有望在大型模拟(LES)中湍流闭合,因为它们能够准确地从低分辨率领域重建高分辨率数据。当前的模型培训和推理策略对于大规模的,分布式计算而不足以成熟,这是由于计算需求以及对SR-GAN的训练通常不稳定的,这限制了改进的模型结构,培训策略和损失功能定义的探索。将SR-GAN集成到LES求解器中进行推理耦合模拟也是评估其后验精度,稳定性和成本的必要条件。我们研究了SR-GAN训练和推理耦合LES的并行化策略,重点是计算性能和重建精度。我们研究了混合CPU – GPU节点体系结构的分布式数据并行培训策略,以及低/高分辨率子盒大小,全局批处理大小和歧视器准确性的相关影响。准确的预测需要相对于Kolmogorov长度尺度足够大的训练子箱。应注意训练批量规模,学习率,培训子箱数量和歧视者的学习能力的耦合效果。我们引入了一个数据并行SR-GAN培训和推理库,以进行异质体系结构,该架构可以在运行时在LES求解器和SR-GAN推理之间进行交换。我们研究了这种布置的预测准确性和计算性能,特别关注精确的SR重建所需的重叠(Halo)大小。同样,有效推理耦合LES的后验并行缩放受SR子域的大小,GPU利用率和重建精度的限制。基于这些发现,我们建立了指南和最佳实践,以优化SR-GAN湍流模型训练和推理耦合LES计算的资源利用率和并行加速,同时保持预测精度。
指标,例如网络大小,培训时间和生成数据的质量。此外,还研究了潜在的数学,并与gan和vaes的理论基础有关。2。相关的生成模型近年来一直是机器学习领域的重要研究的主题,具有生成的对抗网络(GAN)和变异自动编码器(VAE)是两种最广泛使用的技术。几项研究比较了gan和vaes在不同的数据集和应用程序上的性能,其中一些报道了gan的结果更好(Karras等,2019),而其他人则报告了VAE的更好结果(Bowman等,2019)。该领域最有影响力的论文包括Goodfellow等人。的(2014年)引入了GAN框架,以及Kingma and Welling(2014)的VAE框架的引入,这些框架已在随后的作品中广泛引用。Salimans等。的(2016)论文提出了稳定gan训练的技术,例如为发电机和歧视者使用不同的学习率,而Chen等人。(2016)提出了对GAN框架的修改,该修改允许学习可解释的表示形式。Mescheder等。的(2017)论文提出了一个结合了VAE和gans强度的混合模型,以及Arjovsky等。的(2017)论文提出了对GAN框架的修改,该框架将Wasserstein距离用作目标函数,从而进行了更稳定的训练。Kumar等。 3。 每个Kumar等。3。每个的(2019年)论文提出了对GAN框架的修改,该框架在歧视者中引入了瓶颈,从而提高了性能,而Shen等人则进行了改善。的(2020)论文提出了一种在gan的潜在空间中发现可解释方向的方法,从而可以控制生成的图像的特定属性。方法论3.1数据集我们从MNIST数据集中应用了60,000张培训照片和10,000个手写数字的测试图像。