摘要。实时战略任务的有效评估需要自适应机制来应对动态和不可预测的环境。本研究提出了一种改进评估函数以实时响应战场态势变化的方法,利用实时战略游戏中基于在线强化学习的动态权重调整机制。该方法在传统静态评估函数的基础上,利用在线强化学习中的梯度下降来动态更新权重,并结合权重衰减技术确保稳定性。此外,还集成了 AdamW 优化器,实时调整在线强化学习的学习率和衰减率,进一步减少对人工参数调整的依赖。循环竞赛实验表明,该方法显著提升了 Lanchester 作战模型评估函数、Simple 评估函数和 Simple Sqrt 评估函数在 IDABCD、IDRTMinimax、Portfolio AI 等规划算法中的应用效果。该方法显著提高了得分,并且随着地图尺寸的增加,这种增强变得更加明显。此外,对于所有评估函数和规划算法,该方法引起的评估函数计算时间的增加都保持在 6% 以下。所提出的动态自适应评估函数为实时战略任务评估提供了一种有前途的方法。
摘要:本研究研究了描绘变速箱,森林,农田和山脉的航空图像的分类。要完成分类工作,使用卷积神经网络(CNN)体系结构从输入照片中提取功能。然后,使用SoftMax对图像进行分类。要测试模型,我们使用90批量的ADAM优化器和0.001的学习率将其运行了十个时期。培训和评估都是使用数据集进行的,该数据集将Google卫星图像与MLRNET数据集融合在一起的图片。综合数据集包含10,400张图像。我们的研究表明,转移学习模型和MobilenetV2,对于景观分类非常有效。这些模型是实际使用的好选择,因为它们在精度和效率之间很好地结合在一起。我们的方法在内置的CNN模型上以87%的总体准确度获得了结果。此外,我们通过利用验证的VGG16和MobilenEtV2模型作为传输学习的起点,达到更高的精度。具体来说,VGG16的精度为90%,测试损失为0.298,而MobileNetV2的精度优于两个模型,其精度为96%,测试损失为0.119;结果表明,使用Mobilenetv2进行转移学习的有效性来对传输塔,森林,农田和山脉进行分类。关键字:航空图像,图像分类,卷积神经网络(CNN),转移学习
网络扬声器用于公共场所的公共广播,有时也用于播放背景音乐。要播放音乐,需要专门为在公共环境中使用而制作的特殊商业音乐许可证。但是,为了按照现行法规做到这一点,客户必须支付许可费并了解版权许可的相关知识。在本文中,我们探讨了使用机器学习方法生成替代的、无需许可的背景音乐的可能性。我们调查了该领域的现有模型和数据集,并对音乐家进行了访谈,以确定可用作评估指标的音乐质量特征。我们选择调整和比较 Transformer 模型 GPT-3 和长短期记忆 (LSTM) 模型 Performance_RNN。使用 COSIATEC 算法对音乐进行评估以查找递归模式,并使用基于 Tymoszcko 的调性理论的自定义指标。进行了实验以调查学习率、训练数据特征和生成参数的影响。 GPT-3 和 Performance RNN 在生成音乐的长期结构方面都表现良好,但训练时间和准确度因所选数据集而异。为了补充本论文的研究结果,研究人类对音乐的感知与本报告中获得的分数之间的相关性将会很有趣。进一步研究训练数据特征(例如流派和旋律内容)的影响也很有趣。
安全对齐的大型语言模型 (LLM) 容易受到有害的微调攻击 (Qi 等人,2023)——微调数据集中混入一些有害数据可能会破坏 LLM 的安全对齐。现有的缓解策略包括对齐阶段解决方案 (Huang、Hu 和 Liu,2024;Rosati 等人,2024a) 和微调阶段解决方案 (Huang 等人,2024;Mukhoti 等人,2023)。然而,我们的评估表明,当选择某些特定的训练超参数时,这两类防御都会失败——微调阶段的较大学习率或大量训练周期很容易使防御失效,但这对于保证微调性能是必要的。为此,我们提出了 Antidote,这是一种后微调阶段解决方案,它与微调阶段的训练超参数无关。 Antidote 的理念是,通过删除有害参数,可以从有害行为中恢复有害模型,而不管这些有害参数在微调阶段是如何形成的。基于这一理念,我们在有害微调之后引入了一次性剪枝阶段,以删除导致有害内容生成的有害权重。尽管 Antidote 非常简单,但实证结果表明,它可以在保持下游任务准确性的同时降低有害分数。我们的项目页面位于 https://huangtiansheng.github.io/Antidote_gh_page/
本文全面分析了分布的高性能计算方法,以加速深度学习培训。我们探讨了分布式计算体系结构的演变,包括数据并行性,模型并行性和管道并行性及其混合实现。该研究深入研究了对大规模训练至关重要的优化技术,例如分布式优化算法,梯度压缩和自适应学习率方法。我们研究了沟通效率高的算法,包括戒指所有减少变体和分散培训方法,这些方法应对分布式系统的可伸缩性挑战。研究研究了硬件加速度和专业系统,重点是GPU群集,自定义AI加速器,高性能互连以及针对深度学习工作负载的优化的分布式存储系统。最后,我们讨论了该领域的挑战和未来方向,包括可伸缩性效率折衷,容错性,大规模培训中的能源效率以及新兴趋势等新兴趋势,例如联合学习和神经形态计算。我们的发现突出了高级算法,专业硬件和优化的系统设计之间的协同作用,以突破大规模深度学习的边界,为未来的人工智能突破铺平了道路。关键字:分布式计算,深度学习加速,高性能系统,通信 -
abtractive和任务关键数据驱动的应用程序,例如虚拟或增强现实,触觉,工业自动化和自主性移动性,在第六代网络中对超前且低延迟通信(6G)网络的超前且低延迟通信(URLLC)构成了前所未有的挑战。机器intel-ligence接近深度学习,加强学习和联合学习(FL),以提供新的范式,以确保在大数据培训的流中确保6G URLLC。但是,机器学习能力的经典局限性使得达到严格的6G URLLC要求使其具有挑战性。在本文中,我们通过利用量子资源的优势,例如叠加,插入和量子并行性来研究6G URLLC变异量子计算和量子机学习(QML)的潜力。基本的想法是将量子机智能与6G网络集成在一起,以确保严格的6G URLLC要求。作为一个例子,我们演示了NP-HARD URLLC任务的量子近似优化算法卸载优化概率。在无线网络中还采用了QML的变异量子计算,以提高机器智能的学习率并确保对关键任务应用程序的学习最佳性。考虑了量子辅助的FL,考虑了FL的安全性和隐私问题以及FL中的计算资源开销,盲目和远程时尚中的分布式量子计算进一步研究。
mung豆种子在农业生产和食品加工中非常重要,但是由于它们的多样性和相似的外观,传统的分类方法都具有挑战性,以解决这一问题,这项研究提出了一种基于学习的方法。在这项研究中,基于深度学习模型MobilenetV2,提出了DMS块,并通过引入ECA块和Mish激活函数,即提出了高度优势网络模型,即HPMobileNet,提出,该模型被提出,该模型是在eLBIND中探索的,可用于分类和精确的图像识别。在这项研究中,收集了八种不同的绿豆种子,并通过阈值分割和图像增强技术获得了总共34,890张图像。hpmobilenet被用作主要网络模型,并通过在大规模的绿豆种子图像数据集上进行训练和精细调整,实现了有效的特征提取分类和识别能力。实验结果表明,HPMobileNet在Mung Bean Seed Grain Grain分类任务中表现出色,其准确性从87.40%提高到测试集的94.01%,并且与其他经典网络模型相比,结果表明,HPMobileNet可以达到最佳结果。此外,本研究还分析了学习率动态调整策略对模型的影响,并探讨了将来进一步优化和应用的潜力。因此,这项研究为开发绿豆种子分类和智能农业技术提供了有用的参考和经验基础。
离线增强学习(RL)试图使用离线数据学习最佳策略,由于其在在线数据收集不可行或昂贵的关键应用程序中的潜力,因此引起了极大的兴趣。这项工作探讨了联合学习对离线RL的好处,旨在协作利用多个代理商的离线数据集。专注于有限的情节表格马尔可夫决策过程(MDPS),我们设计了FedLCB-Q,这是针对联合离线RL量身定制的流行无模型Q学习算法的变体。FedLCB-Q更新了具有新颖的学习率时间表的代理商的本地Q-功能,并使用重要性平均和精心设计的悲观惩罚项将其在中央服务器上汇总。Our sample complexity analysis reveals that, with appropriately chosen parameters and synchronization schedules, FedLCB-Q achieves linear speedup in terms of the number of agents without requiring high-quality datasets at individual agents, as long as the local datasets collectively cover the state-action space visited by the optimal policy, highlighting the power of collaboration in the federated setting.实际上,样本复杂性几乎与单代理对应物的复杂性匹配,好像所有数据都存储在中心位置,直到地平线长度的多项式因子。此外,fedlcb-Q是通信有效的,其中通信弹的数量仅相对于地平线长度与对数因素有关。
犯罪现场调查通常发生在复杂的环境中,在复杂的环境中,可能会隐藏,遮挡或分散在混乱的背景中。传统的对象检测方法经常面临此类挑战,导致错过或不准确地识别关键的法医元素。本研究提出了一个自适应深度学习框架,旨在在复杂的犯罪现场中精确的对象检测。通过利用高级卷积神经网络(CNN),基于区域的CNN(R-CNN)和注意机制,提出的模型动态适应了不同的犯罪现场条件,无论大小,方向或遮挡,都可以有效地识别对象。框架集成了多尺度特征提取,上下文感知学习和自适应学习率,以提高准确性和鲁棒性。将Yolov8和掩码R-CNN合并用于实时检测和实例分段,该系统可确保对象定位和分类的高精度。对各种犯罪现场数据集进行了广泛的测试,证明了该模型的出色表现,平均平均精度(MAP)为92.5%,同时显着降低了误报和负面因素。这种适应性方法不仅简化了法医研究,而且还可以最大程度地减少人为错误,为执法机构提供了可靠,有效的工具。未来的研究将着重于将系统的功能扩展到3D犯罪现场重建和跨域法医分析。
目的:本研究旨在探讨针对新冠肺炎CT影像特点设计开发的人工智能系统在新冠肺炎筛查与评估中的作用。方法:研究团队采用改进的U型神经网络,通过多层卷积迭代,对CT影像中的肺部及肺炎病灶进行分割。然后选取合适的159例病例建立并训练模型,使用Dice损失函数与Adam优化器进行网络训练,初始学习率为0.001。最后选取39例病例(29例阳性,10例阴性)进行对比测试。实验组:主治医生a和副主任医生a在人工智能系统的帮助下阅读CT影像对新冠肺炎进行诊断。对照组:主治医生b和副主任医生b仅凭经验进行诊断,未借助人工智能系统。记录每位医生诊断所用时间及诊断结果。统计学分析采用配对t检验、单因素方差分析、卡方检验、受试者工作特征曲线、logistic回归分析。结果:不同组别的诊断时间差异有统计学意义(P<0.05)。对于诊断结果最优组,单因素和多因素分析均提示各变量间无显著相关性,可能是AI系统的辅助、流行病学史等因素发挥了重要作用。结论:我们研发的AI系统因应新冠肺炎而诞生,具有一定的临床实用性,值得推广。关键词:CT、新冠肺炎、智能分析、AI、助力作用