大型型号通常适用于满足模型所有者和用户的各种要求。但是,维护多个专门版本的模型效率低下。 在响应中,我们提出了AIM,这是一种新型的模型调制范式,使单个模型能够表现出各种行为能够满足特定的最终需求。 AIM启用两个关键调制模式:实用程序和焦点调制。 前者为模型所有者提供了对输出质量的模型控制,以提供不同的实用程序级别,后者为用户提供了精确的控制,以移动模型的集中输入功能。 AIM介绍了以培训数据不合时宜的方式和无重新训练方式运行的逻辑再分配策略。 我们建立了正式的基础,以确保AIM的监管能力,以通过关节概率分布来订购的统计特性。 我们的评估证实了AIM对AI模型调制的实用性和多功能性,任务涵盖了IMEGE分类,语义细分和文本生成,以及包括Resnet,Segformer和Llama在内的普遍体系结构。但是,维护多个专门版本的模型效率低下。在响应中,我们提出了AIM,这是一种新型的模型调制范式,使单个模型能够表现出各种行为能够满足特定的最终需求。AIM启用两个关键调制模式:实用程序和焦点调制。前者为模型所有者提供了对输出质量的模型控制,以提供不同的实用程序级别,后者为用户提供了精确的控制,以移动模型的集中输入功能。AIM介绍了以培训数据不合时宜的方式和无重新训练方式运行的逻辑再分配策略。我们建立了正式的基础,以确保AIM的监管能力,以通过关节概率分布来订购的统计特性。我们的评估证实了AIM对AI模型调制的实用性和多功能性,任务涵盖了IMEGE分类,语义细分和文本生成,以及包括Resnet,Segformer和Llama在内的普遍体系结构。
1)Zhu,Zihan等。“ Nice-Slam:神经隐式可扩展编码的猛击。”IEEE/CVF计算机视觉和模式识别会议的会议记录。2022。尼斯 - 萨克1)
Yaning Li, Yu Zhang, Yumeng Yang, Tang Zihan, Zhenxian Hu, Chengxi Xie, Ziao Pan, Chengye Chen, Tuoda Qi, Zhixian Zhu, Qian He, Shumin Li, Yuan Yin, Ji Han, Peter Childs, Gaetano Cascini, Meng Li, China Crossing the East Asian cultural bridge: Comparison between Chinese and Japanese aesthetic education
3。脱离Bellman的完整性:通过基于模型的返回条件的监督学习[链接] Zhaoyi Zhou,Chuning Zhu,Runlong Zhou,Qiwen Cui,Abhishek Gupta,Simon S. Du ICLR 2024 2024年海报我们研究了Al Al Al Al的长度和弱点。4。强化方差学习中的尖锐方差界限:在随机和确定性环境中两全其美[link] Runlong Zhou,Zihan Zhang,Simon S. Du ICML 2023海报我们提供了一个系统的研究研究,对基于模型和模型的强化学习的方差依赖性遗憾界限,用于制作模型和模型的增强范围。 提出的基于模型的算法既适用于随机和确定性MDP。 5。 潜在马尔可夫决策过程的依赖于方差的和无水平的加固学习[链接] Runlong Zhou,Ruosong Wang,Simon S. Du ICML 2023海报我们为潜在MDPS提供了算法框架(可见上下文),从而实现了第一台无线的最小值遗憾。 我们通过使用对称技术为LMDP提供了一种新颖的LMDP遗憾下限来补充这项研究。 6。 了解在线组合优化的政策优化中的课程学习[链接] Runlong Zhou,Zelin HE,Yuandong Tian,Yi Wu,Yi Wu,Simon S. DU TMLR我们制定了典范的在线组合优化问题,作为潜在的MDP,并为LMDPS的自然政策梯度提供了融合。 我们通过相对条件数的角度显示了课程学习的有效性。 7。强化方差学习中的尖锐方差界限:在随机和确定性环境中两全其美[link] Runlong Zhou,Zihan Zhang,Simon S. Du ICML 2023海报我们提供了一个系统的研究研究,对基于模型和模型的强化学习的方差依赖性遗憾界限,用于制作模型和模型的增强范围。提出的基于模型的算法既适用于随机和确定性MDP。5。依赖于方差的和无水平的加固学习[链接] Runlong Zhou,Ruosong Wang,Simon S. Du ICML 2023海报我们为潜在MDPS提供了算法框架(可见上下文),从而实现了第一台无线的最小值遗憾。我们通过使用对称技术为LMDP提供了一种新颖的LMDP遗憾下限来补充这项研究。6。了解在线组合优化的政策优化中的课程学习[链接] Runlong Zhou,Zelin HE,Yuandong Tian,Yi Wu,Yi Wu,Simon S. DU TMLR我们制定了典范的在线组合优化问题,作为潜在的MDP,并为LMDPS的自然政策梯度提供了融合。我们通过相对条件数的角度显示了课程学习的有效性。7。Stochastic Shortest Path: Minimax, Parameter-Free and Towards Horizon-Free Regret [Link] Jean Tarbouriech*, Runlong Zhou* , Simon S. Du, Matteo Pirotta, Michal Valko, Alessandro Lazaric NeurIPS 2021 Spotlight, 3 % acceptance rate We propose an algorithm (EB-SSP) for SSP problems, which is the first to achieve minimax optimal regret while无参数。
刘志平(2023/02-2023/05,现为南京大学博士生)、陈逸飞(2023/01-2023/04,剑桥大学研究生)、张蕾(2021/12-2023/04,现为香港科技大学广州分校博士生)、刘霞(2021/08-2023/04,中科院博士生)、张浩凯(2021/10-2023/04,清华大学博士生)、朱成宏(2021/12-2023/04,现为香港科技大学广州分校博士生)、荆明睿(2022/05-2023/04,现为香港科技大学广州分校博士生)、余湛(2021/11-2023/05,现为新加坡国立大学博士生)、宋志新(2020/04-2021/07,现于佐治亚理工学院攻读博士学位)、赵选强(202008-202208,现于香港大学攻读博士学位)、赵本池(2020/10-2022/03,现于大阪大学攻读博士学位)、陈然柳(2020/08-2021/08,现于哥本哈根大学攻读博士学位)、蒋佳庆(2020/07-2021/04,现于加州理工学院攻读博士学位)、曹晨峰(2020/07-2020/10,现于香港科技大学攻读博士学位)、余思卓(2021/01-2021/10,现于巴黎-萨克雷大学攻读博士学位)、夏子涵(2021/04-2022/03,现于南加州大学学生)、王庆河(2020/09-2021/09,现于加州大学洛杉矶分校学生)、王子河(2020/07-2021/07,现百度软件工程师)、莫印(2021/09-2021/12,百度→香港科技大学广州)、李罗珍(2022/08-2022/11,现荷兰代尔夫特理工大学研究生)、朱成凯(2021/08-2023/04,现香港科技大学广州)博士生)、耿刘(2021/08-2023/04,现为香港中文大学(深圳)博士生)、姚宏顺(2021/08-2023/04,研究生)、王振铎(2022/07-2022/09)、施凯彦(2021/04-2021/07)、叶瑞林(2021/09-) 2022/01), 黄嘉欣(2021/09-2022/01)、王家辉(2021/06-2021/08)、宋艺轩(2021/06-2021/08)、李茂然(2021/02-2021/07)、刘迎建(2021/01-2021/07)、严子贤(2020/09-2021/09)、席韩哲(2021/05-2021/09)、陈一方(2020/03-2020/06)、孟泽林(2020/04-2021/07)。
Yifei Luo, Mohammad Reza Abidian, Jong-Hyun Ahn, Deji Akinwande, Anne M. Andrews, Markus Antonietti, Zhenan Bao, Magnus Berggren, Christopher A. Berkey, Christopher John Bettinger, Jun Chen, Peng Chen, Wenlong Cheng, Xu Cheng, Seon-Jin Choi, Alex Chortos, Canan Dagdeviren, Reinhold H. Dauskardt, Chong-an Di, Michael D. Dickey, Xiangfeng Duan, Antonio Facchetti, Zhiyong Fan, Yin Fang, Jianyou Feng, Xue Feng, Huajian Gao, Wei Gao, Xiwen Gong, Chuan Fei Guo, Xiaojun Guo, Martin C. Hartel, Zihan He, John S. Ho, Youfan Hu, Qiyao Huang, Yu Huang, Fengwei Huo, Muhammad M. Hussain, Ali Javey, Unyong Jeong, Chen Jiang, Xingyu Jiang, Jiheong Kang, Daniil Karnaushenko, Ali Khademhosseini, Dae-Hyeong Kim, Il-Doo Kim, Dmitry Kireev, Lingxuan Kong, Chengkuo Lee, Nae-Eung Lee, Pooi See Lee, Tae-Woo Lee, Fengyu Li, Jinxing Li, Cuiyuan Liang, Chwee Teck Lim, Yuanjing Lin, Darren J. Lipomi, Jia Liu, Kai Liu, Nan Liu, Ren Liu, Yuxin Liu, Yuxuan Liu, Zhiyuan Liu, Zhuangjian Liu, Xian Jun Loh, Nanshu Lu, Zhisheng Lv, Shlomo Magdassi, George G. Malliaras, Naoji Matsuhisa, Arokia Nathan, Simiao Niu, Jieming Pan, Changhyun Pang, Qibing Pei, Huisheng Peng, Dianpeng Qi, Huaying Ren, John A. Rogers, Aaron Rowe, Oliver G. Schmidt, Tsuyoshi Sekitani, Dae-Gyo Seo, Guozhen Shen, Xing Sheng, Qiongfeng Shi, Takao Someya, Yanlin Song, Eleni Stavrinidou, Meng Su, Xuemei Sun, Kuniharu Takei, Xiao-Ming Tao, Benjamin C. K. Tee, Aaron Voon-Yew Thean, Tran Quang Trung, Changjin Wan, Huiliang Wang, Joseph Wang, Ming Wang, Sihong Wang, Ting Wang, Zhong Lin Wang, Paul S. Weiss, Hanqi Wen, Sheng Xu, Tailin Xu, Hongping Yan, Xuzhou Yan, Hui Yang, Le Yang, Shuaijian Yang, Lan Yin, Cunjiang Yu, Guihua Yu, Jing Yu, Shu-Hong Yu, Xinge Yu, Evgeny Zamburg, Haixia Zhang, Xiangyu Zhang, Xiaosheng Zhang, Xueji Zhang, Yihui Zhang, Yu Zhang, Siyuan Zhao, Xuanhe Zhao, Yuanjin Zheng, Yu-Qing Zheng, Zijian Zheng, Tao Zhou, Bowen Zhu, Ming Zhu, Rong Zhu, Yangzhi Zhu, Yong Zhu, Guijin Zou, and Xiaodong Chen *
Yifei Luo, Mohammad Reza Abidian, Jong-Hyun Ahn, Deji Akinwande, Anne M. Andrews, Markus Antonietti, Zhenan Bao, Magnus Berggren, Christopher A. Berkey, Christopher John Bettinger, Jun Chen, Peng Chen, Wenlong Cheng, Xu Cheng, Seon-Jin Choi, Alex Chortos, Canan Dagdeviren, Reinhold H. Dauskardt, Chong-an Di, Michael D. Dickey, Xiangfeng Duan, Antonio Facchetti, Zhiyong Fan, Yin Fang, Jianyou Feng, Xue Feng, Huajian Gao, Wei Gao, Xiwen Gong, Chuan Fei Guo, Xiaojun Guo, Martin C. Hartel, Zihan He, John S. Ho, Youfan Hu, Qiyao Huang, Yu Huang, Fengwei Huo, Muhammad M. Hussain, Ali Javey, Unyong Jeong, Chen Jiang, Xingyu Jiang, Jiheong Kang, Daniil Karnaushenko, Ali Khademhosseini, Dae-Hyeong Kim, Il-Doo Kim, Dmitry Kireev, Lingxuan Kong, Chengkuo Lee, Nae-Eung Lee, Pooi See Lee, Tae-Woo Lee, Fengyu Li, Jinxing Li, Cuiyuan Liang, Chwee Teck Lim, Yuanjing Lin, Darren J. Lipomi, Jia Liu, Kai Liu, Nan Liu, Ren Liu, Yuxin Liu, Yuxuan Liu, Zhiyuan Liu, Zhuangjian Liu, Xian Jun Loh, Nanshu Lu, Zhisheng Lv, Shlomo Magdassi, George G. Malliaras, Naoji Matsuhisa, Arokia Nathan, Simiao Niu, Jieming Pan, Changhyun Pang, Qibing Pei, Huisheng Peng, Dianpeng Qi, Huaying Ren, John A. Rogers, Aaron Rowe, Oliver G. Schmidt, Tsuyoshi Sekitani, Dae-Gyo Seo, Guozhen Shen, Xing Sheng, Qiongfeng Shi, Takao Someya, Yanlin Song, Eleni Stavrinidou, Meng Su, Xuemei Sun, Kuniharu Takei, Xiao-Ming Tao, Benjamin C. K. Tee, Aaron Voon-Yew Thean, Tran Quang Trung, Changjin Wan, Huiliang Wang, Joseph Wang, Ming Wang, Sihong Wang, Ting Wang, Zhong Lin Wang, Paul S. Weiss, Hanqi Wen, Sheng Xu, Tailin Xu, Hongping Yan, Xuzhou Yan, Hui Yang, Le Yang, Shuaijian Yang, Lan Yin, Cunjiang Yu, Guihua Yu, Jing Yu, Shu-Hong Yu, Xinge Yu, Evgeny Zamburg, Haixia Zhang, Xiangyu Zhang, Xiaosheng Zhang, Xueji Zhang, Yihui Zhang, Yu Zhang, Siyuan Zhao, Xuanhe Zhao, Yuanjin Zheng, Yu-Qing Zheng, Zijian Zheng, Tao Zhou, Bowen Zhu, Ming Zhu, Rong Zhu, Yangzhi Zhu, Yong Zhu, Guijin Zou, and Xiaodong Chen *