近年来,研究人员探索了基于强化学习的对象检测方法。但是,现有方法总是几乎没有令人满意的性能。主要原因是当前基于增强学习的方法生成一系列不准确区域而没有合理的奖励函数,并将最终步骤中的非最佳选择视为缺乏有效的区域选择和重新构成策略的检测结果。为了解决上述问题,我们提出了一种新的基于增强的基于基于的对象检测框架,即增强框架,通过将增强剂学习剂与基于卷积神经网络的特征空间整合在一起,具有区域选择的能力并进行了重新确定。在钢筋中,我们重新开发了一个奖励功能,该奖励功能使代理可以有效地训练并提供更准确的区域建议。为了进一步优化它们,我们设计了基于卷积神经网络的区域选择网(RS-NET)和边界框重新填充网络(BBR-NET)。尤其是前者由两个子网络组成:联合网络(IOU-NET)和完整性网络(CPL-NET)共同选择了最佳区域建议。后者旨在将选定的结果重新定义为最终结果。在两个标准数据集Pascal VOC 2007和VOC 2012上的广泛实验结果表明,增强剂能够改善该地区的选择,并学习更好的代理动作表示增强性学习,从而导致最先进的表现。2021 Elsevier B.V.保留所有权利。
刘氏研究小组的研究兴趣涵盖各种材料的设计、制造、表征和模拟,包括具有异质表面和界面的膜、薄膜、涂层和多孔电极,以及用于储能和转换的装置,如燃料电池、电池、电解器和超级电容器。我们的主要重点是了解这些材料的结构、成分和形态如何影响它们的电气、化学、催化和电化学性质,特别是沿表面、跨界面和通过复杂多孔结构的电荷和质量转移。我们小组致力于开发创新策略和材料,旨在提高化学和能源转化过程的效率和成本效益。我们的研究涵盖合成和制造技术、原位/操作表征方法和多尺度建模方法。我们的总体目标是系统地设计具有独特功能的材料和结构,以提高储能和转换效率。
2018●山东大学奖,山东大学,2018年,杰出的硕士学生,●学术明星奖,山东大学管理学院,2018年,2018年,桑登大学一等奖,山东大学一等奖,2018年参考文献蒂法尼·凯勒·汉斯布鲁(Tiffany Keller Hansbrough)(论文)纽约宾厄姆顿,纽约13902-6000电话:(607)777-6357 tkeller@binghamton.edu chou-yu(Joey)Tsai(论文委员会成员)领导力和组织科学学院副教授,管理博士学位教授博士协调员,领导力和组织科学副总监贝纳德·梅纳德·伯纳德(Bernard M.&Ruth M. 13902-6000电话:(607)777-3385 ctsai@binghamton.edu Shelley D. Dionne(论文委员会成员)纽约州立大学宾厄姆顿大学管理学院领导力与组织科学教授,纽约宾厄姆顿大学,纽约州宾夕法尼亚大学,13902-60002-6000
- 机器人[link]和AR [link]辅助医疗程序| C ++,Python,C#,Matlab,Ros,Unity,VTK O完成了机器人TMS的原型,并将其用于初步的内部临床试验和神经科学研究。o开发了用于TMS目标计划和医疗图像查看的神经运动系统。 o开发了具有用于KUKA LBR7 IIWA控制[repo]的功能模块的集成[请求演示]硬件[repo],手眼校准[2,8],工具校准[2],动力学建模[7],用户界面,用户界面和网络[repo,repo,repo]。 o开发的AR系统[2,9]提供了碰撞检测线索,并能够进行人体工程学的计划和执行。 o撰写了学术出版物[2,5,7-9,13,14]和专利申请,并在会议上介绍。 o将这些技术和系统应用于其他侵入性程序,例如股骨成形术,脊柱融合和颅面手术。o开发了用于TMS目标计划和医疗图像查看的神经运动系统。o开发了具有用于KUKA LBR7 IIWA控制[repo]的功能模块的集成[请求演示]硬件[repo],手眼校准[2,8],工具校准[2],动力学建模[7],用户界面,用户界面和网络[repo,repo,repo]。o开发的AR系统[2,9]提供了碰撞检测线索,并能够进行人体工程学的计划和执行。o撰写了学术出版物[2,5,7-9,13,14]和专利申请,并在会议上介绍。o将这些技术和系统应用于其他侵入性程序,例如股骨成形术,脊柱融合和颅面手术。
G RADUATE -L EVEL C OURSES Analysis : Real Analysis, Functional Analysis (basics) Probability : Probability and Stochastic Processes Optimization : Convex Optimization, Nonlinear Programming Machine Learning : Deep Reinforcement Learning, Deep Learning, Machine Learning for Robotics Control & Game Theory : Game-Theoretic Modeling of Multi-Agent Systems, Model Predictive Control Robotics : Human-Robot Interaction, Machine Perception, Planning & Decision Making, Robot Dy- NAMICS与控制,机器人软件实践软件:带有C ++
六月研究助理。2020年 - 2024年8月•大型语言模型(LLMS)内的长期杂项机器人学习的发展状态空间建模,LLMS在维护州跟踪的同时执行计划和推理。•体现的AI:提出的diff -Control,一种将控制网络从图像生成到机器人动作的范围的动作扩散策略。[C7]•使用注意机制和可区分的过滤创建了一个多模式学习框架(𝛼 -MDF),该滤波器在潜在空间中进行多种模式的状态估计。[C5]•开发了可区分的集合Kalman过滤器(DENKF)框架,其中包含用于机器人学习的算法先验,即从观察值中学习系统dy -namics,以及从高维空间中的学习表示形式。[C4]•用智能手表部署了无处不在的机器人控制任务的智能滤波框架,即,电视,无人机驾驶。[C6]
口头演讲,关于学习有效抽象的计划在Corl 2024受邀演讲,伯克利人工智能研究实验室,UC Berkeley 2023邀请演讲,Stanford Vision and Learn Lab,Stanford Vision and Learn Lab,Stanford University 2022邀请,邀请Talk,Robograds学生会议,Georgia trive 202222222年2022年,密歇根大学2022年邀请演讲,进度实验室,邀请演讲,神经机器人学习研讨会2021年口头演讲,ICRA 2021口语演示的语义代表研讨会,AAAI 2020年2020年口头演示,ISRR 2019
[4] R. Po*,Y. Wang*,V。Golyanik*,K。Aberman,J。T. Barron,A。H. Bermano,E。R. Chan,E。R. Chan,T。Dekel,T。Dekel,A。Holynski,A。Kanazawa,A。Kanazawa,C。K. K. K. K. K. Liu,L。Liu,L。Liu,L。“视觉计算扩散模型的艺术状态”。in:欧洲图表最先进的报告(星星)。2024。
奖项 数据科学新星,加州大学圣地亚哥分校、芝加哥大学和斯坦福大学 2024 电子工程与计算机科学新星,麻省理工学院 2024 MICCAI NIH 奖,马拉喀什 2024 MICCAI 旅行奖,利马 2020 IPMI 奖学金,香港 2019 校长奖学金,上海大学(最高荣誉,前 10 名) 2018 国家奖学金,中国教育部(前 1%) 2018 优秀毕业生,中国教育部 2018 宝钢国家奖学金,上海(前 4 名) 2017 美国数学建模竞赛 (MCM) 决赛获胜者(团队负责人,前 0.4%,36/8843) 2017 上海市数学竞赛(数学专业)三等奖 2016 上海大学特等奖学金(前 3%) 2015-2017 上海大学优秀学生奖2015-2017 上海大学公益慈善奖 2015-2016