强化关键词检索结果

克隆造血的表观遗传调节因子在免疫治疗期间控制 CD8 T 细胞干性 | 科学

Epigenetic regulators of clonal hematopoiesis control CD8 T cell stemness during immunotherapy | Science

已知 T 细胞衰竭的表观遗传强化是限制免疫治疗期间 T 细胞反应的主要障碍。然而,在长时间抗原暴露期间限制抗肿瘤免疫的核心表观遗传调节剂尚不清楚。我们……

IEEE 神经网络和学习系统学报,第 35 卷,第 10 期,2024 年 10 月

IEEE Transactions on Neural Networks and Learning Systems, Volume 35, Number 10, October 2024

1) 确定适合机器学习模型的知识产权保护机制:水印、指纹识别、模型访问和攻击的系统化作者:Isabell Lederer、Rudolf Mayer、Andreas Rauber页数:13082 - 131002) 面向可解释的情感计算:综述作者:Karina Cortiñas-Lorenzo、Gerard Lacey页数:13101 - 131213) 从多个角度回顾凸聚类:模型、优化、统计属性、应用和连接作者:Qiying Feng、C. L. Philip Chen、Licheng Liu页数:13122 - 131424) 高光谱图像去噪:从模型驱动、数据驱动到模型数据驱动作者:Qian

关于直接偏好优化引起的隐式奖励模型的有限泛化能力

On the Limited Generalization Capability of the Implicit Reward Model Induced by Direct Preference Optimization

从人类反馈中进行强化学习 (RLHF) 是一种将语言模型与人类偏好保持一致的有效方法。RLHF 的核心是学习用于对人类偏好进行评分的奖励函数。学习奖励模型的两种主要方法是 1) 训练显式奖励模型(如 RLHF)和 2) 使用通过直接偏好优化 (DPO) 等方法从偏好数据中学习的隐式奖励。先前的研究表明,DPO 的隐性奖励模型可以近似训练有素的奖励模型,但尚不清楚 DPO 在多大程度上可以推广到分布……

按投资领域划分的买卖趋势(2024年9月)~信托银行净买入量较大~

投資部門別売買動向(24年9月)~信託銀行が大幅買い越し~

9月上半月,由于美国经济指标的公布,日经指数显示经济前景的不确定性增加。日元因美国降息预期而持续升值也令人厌恶,日经平均指数连续7个交易日下跌,从2日的38,700日元跌至11日的35,619日元。下半年,FOMC于18日晚决定降息0.50%,但随着美国经济软着陆预期增强,日元持续贬值,日经平均指数升至37,155日元19日。临近月底,日经平均指数27日上涨至39,829日元,预计27日自民党总裁选举前宣布货币宽松政策的高市先生将获得上位。手。然而,由于第二轮选举,对强化金融所得税表现出积极态度的石破先生当选为总裁,日经平均指数30日下跌,当月收于37,919日元。随着日经平均指数继续以这种方

正式发布:DSCS 已启动!

It's official: DSCS is launched!

正式宣布:DSCS 已启动!alfred.a.avor…2024 年 10 月 1 日星期二 - 13:51国防安全合作服务 (DSCS) 于 2024 年 10 月 1 日启动,这强化了 DSCA 的愿景,即成为我们国防和外交政策利益相关者的安全合作专业知识来源。在当前的全球环境下,人们对安全合作计划有着巨大的渴望。如果没有经过精心培养、经过专业培训和全力支持的员工队伍,这种水平的绩效是不会实现的。 DSCS 将响应这一号召,使我们的安全合作官员队伍现代化,以协助我们在全球的盟友和合作伙伴。FY24 NDAA 授权成立国防安全合作局,以“确保位于海外任务区的美国安全合作组织拥有必要的人员,并

IEEE 人工智能学报,第 5 卷,第 9 期,2024 年 9 月

IEEE Transactions on Artificial Intelligence, Volume 5, Issue 9, September 2024

1) 社论:从可解释的人工智能 (xAI) 到可理解的人工智能 (uAI)作者:Hussein Abbass、Keeley Crockett、Jonathan Garibaldi、Alexander Gegov、Uzay Kaymak、Joao Miguel C. Sousa页数:4310 - 43142) 通过部分图卷积网络进行不完全图学习作者:Ziyan Zhang、Bo Jiang、Jin Tang、Jinhui Tang、Bin Luo页数:4315 - 43213) 用于社会公益的对抗性机器学习:将对手重新定义为盟友作者:Shawqi Al-Maliki、Adnan Qayyum、H

注意:NotebookLM 将 Minecraft AI 经济学帖子转换为播客

Listen Up: NotebookLM Converts Minecraft AI Economics Post to Podcast

我已要求 NotebookLM 在我的博客文章“Minecraft 中的 AI 代理:Vernon Smith 风格的强化版实验经济学”上创建一个播客。我认为它相当不错——请在这里收听:如果您想了解更多关于我在 AI 和数据方面的工作,请查看 PAICE 的网站——AI […]

以色列打算从美国购买重型拖车 - DSCA

Израиль намерен закупить в США тяжелые прицепы – DSCA

美国国务院已批准根据对外军售 (FMS) 计划向以色列供应强化坦克拖车和相关设备。该订单的总成本可能为 1.646 亿美元

动手模仿学习:从行为克隆到多模态模仿学习

Hands-On Imitation Learning: From Behavior Cloning to Multi-Modal Imitation Learning

最突出的模仿学习方法概述,并在网格环境中进行测试照片由 Possessed Photography 在 Unsplash 上拍摄强化学习是机器学习的一个分支,它涉及通过标量信号(奖励)的引导进行学习;与监督学习相反,监督学习需要目标变量的完整标签。一个直观的例子来解释强化学习,可以用一所有两个班级的学校来解释,这两个班级有两种类型的测试。第一节课解决了测试并获得了完全正确的答案(监督学习:SL)。第二节课解决了测试并只获得了每个问题的成绩(强化学习:RL)。在第一种情况下,学生似乎更容易学习正确的答案并记住它们。在第二节课中,任务更难,因为他们只能通过反复试验来学习。然而,它们的学习更加稳健,

BAE Systems 从 DARPA 获得 400 万美元用于战术自主计划

BAE Systems awarded $4 million from DARPA for tactical autonomy program

人工智能强化 (AIR) 计划推进自主空战国防高级研究计划局 (DARPA) 已授予 BAE Systems 的 FAST Labs™ 研究和……

认知行为疗法导致大脑回路发生变化

Cognitive Behavioral Therapy Results in Changes to Brain Circuitry

斯坦福大学 认知行为疗法是治疗抑郁症最常见的方法之一,可以教授应对日常烦恼的技能,强化健康行为并抵消负面...

宏观简报:2024 年 9 月 5 日

Macro Briefing: 5 September 2024

美国劳工部报告称,7 月份美国职位空缺降至 2021 年 1 月以来的最低水平。下滑凸显了人们对劳动力市场近期放缓将继续的担忧。该报告还强化了美联储将在下周政策会议(9 月 18 日)上降息的观点。“劳动力市场没有 […]

IEEE 认知和发展系统汇刊,第 16 卷,第 4 期,2024 年 8 月

IEEE Transactions on Cognitive and Developmental Systems, Volume 16, Issue 4, August 2024

1) 基于多模态生理信号的用户感知多层级认知工作量估计作者:Pierluigi Vito Amadori、Yiannis Demiris页数:1212 - 12222) TR-TransGAN:用于纵向 MRI 数据集扩展的时间递归 Transformer 生成对抗网络作者:Chen-Chen Fan、Hongjun Yang、Liang Peng、Xiao-Hu Zhou、Shiqi Liu、Sheng Chen、Zeng-Guang Hou页数:1223 - 12323) 基于多标准 TD3 的深度强化学习用于分散式多机器人路径规划作者:Heqing Yin、Chang Wang、Chao

为什么你不应该用体育课来惩罚学生

Why You Shouldn’t Use Physical Education As Punishment

强化锻炼等于惩罚的观念会助长对体育活动的负面情绪。文章 为什么你不应该用体育作为惩罚首先出现在 TeachThought 上。

不断发展的系统。第 15 卷,第 5 期,2024 年 10 月

Evolving Systems. Volume 15, Issue 5, October 2024

1) 边界感知残差网络在带钢产品缺陷检测中的应用作者:胡成才,马睿……龚金南页数:1649 - 16632) 基于 YOLOX 的自然环境下茶芽检测改进模型作者:李秀桐,刘瑞欣……谢本良页数:1665 - 16793) 多目标环境下基于偏好的多智能体强化学习经验共享方案作者:左宣,张璞……刘准嘎页数:1681 - 16994) 利用阿基米德优化算法赋能非洲秃鹫优化器,实现全局优化和特征选择的最高效率作者:Reham R. Mostafa,Fatma A. Hashim……Ahmed M. Khedr页数:1701 - 17315) 一种新的特征可进化学习方法流作者:Yanfei Chen、Sa

基于像素的分层策略对任务泛化的好处

On the Benefits of Pixel-Based Hierarchical Policies for Task Generalization

强化学习从业者通常避免使用分层策略,尤其是在基于图像的观察空间中。通常,与平面策略相比,单任务性能的改进并不能证明实施层次结构所带来的额外复杂性是合理的。但是,通过引入多个决策层,分层策略可以组成较低级别的策略,以更有效地在任务之间进行概括,从而突出了多任务评估的必要性。我们通过像素模拟多任务机器人控制实验来分析层次结构的好处……

IEEE 神经网络和学习系统汇刊,第 35 卷,第 8 期,2024 年 8 月

IEEE Transactions on Neural Networks and Learning Systems, Volume 35, Issue 8, August 2024

1) 自主视觉感知的开放式在线学习作者:Haibin Yu, Yang Cong, Gan Sun, Dongdong Hou, Yuyang Liu, Jiahua Dong页数:10178 - 101982) 连续时间强化学习控制:理论结果回顾、性能洞察和新设计需求作者:Brent A. Wallace, Jennie Si页数:10199 - 102193) 可解释人工智能归纳逻辑编程技术评论作者:Zheng Zhang, Levent Yilmaz, Bo Liu页数:10220 - 102364) 离线强化学习调查:分类、评论和开放问题作者:Rafael Figueiredo Pru

视频星期五:影子机器人新手的秘密

Video Friday: The Secrets of Shadow Robot’s New Hand

视频星期五是每周精选的精彩机器人视频,由 IEEE Spectrum robotics 的朋友收集。我们还发布未来几个月即将举行的机器人活动的每周日历。请将您的活动发送给我们以供收录。ICRA@40:2024 年 9 月 23 日至 26 日,荷兰鹿特丹SIROS 2024:2024 年 10 月 14 日至 18 日,阿联酋阿布扎比ICSR 2024:2024 年 10 月 23 日至 26 日,丹麦奥登塞Cybathlon 2024:2024 年 10 月 25 日至 27 日,苏黎世享受今天的视频!去年 5 月在东京举行的 ICRA 2024 上,我们与 Shadow Robot 的总监