·提议的随机差异量化(SDQ)[ICML 2022],一种有效的和有效的混合精确定量量化技术优于·提出了有效的变异感知视觉变压器(VIT)量化框架[TMLR]。这是分析和定位VIT量化变化的第一项工作。我们对VIT的变化的解决方案导致在不同的VIT模型(DEIT,SWIN,SRET)跨Imagenet-1k数据集上的最新精度。·通过核心选择[TMLR]提出一个新的角度,以提高量化感知训练的效果。我们的方法可以在ImageNet-1k数据集上获得4位RESNET-18的68.39%,仅10%子集。
使用方差正规化K. Evtimova,Y。Lecun用多层解码器进行稀疏编码。TMLR 2022。ista是一种用于提取数据稀疏表示形式的经典算法。我们将ISTA扩展到与深度神经网络一起使用,应用方差正则化以避免崩溃。用我们的方法提取的稀疏图像表示形式提高了一声学习性能。
Mina Lee, Megha Srivastava , Amelia Hardy, John Thickstun, Esin Durmus, Ashwin Paranjape, Ines Gerard-Ursin, Xiang Lisa Li, Faisal Ladhak, Frieda Rong, Rose E. Wang, Minae Kwon, Joon Sung Park, Hancheng Cao, Tony Lee, Rishi Bommasani, Michael Bernstein,珀西·梁。“评估人类语言模型的互动”机器学习研究(TMLR)的交易,2023。
审查]计算机视觉和模式识别(CVPR)国际计算机视觉会议(ICCV)神经信息处理系统(NEURIPS)国际学习表征会议(ICLR)国际机器学习国际机器学习会议(ICML)国际声音,语音和信号处理(ICASSP)交易(ICASSP)交易(ICASSP)交易(ICASSP)在模式分析和机器Intelligence(TPAMI)研究(TPAMI)研究(TPAMI)研究(TPAMI)(TPAMI)(TPAMI)(TPAMI)(TPAMI)(TPAMI)(TPAMI)日记(JMLRR)(JMLRRRR)(JMLRRRR)(JMLRRRR)(JMLRRRRRR)大数据的交易
程序委员会 程序主席:CogSci 2024 高级程序委员会成员:ACL 滚动评审(2023 年至今)、NeurIPS(2024 年至今)、ICML(2025 年至今)、CCN(2025 年至今)、CCN 技术程序委员会 (2022–2024) 程序委员会成员:ML:NeurIPS 2016-2023(2018 年前 30% 的审稿人);ICML 2019-2023(2022 年前 10% 的审稿人);AAAI 2020-2021、CoLLAs 2022、ICLR 2022-2024(2023 年重点审稿人);NLP:ACL 2019-2021;NAACL 2019-2021;EMNLP 2020-2021; CoNLL 2020-2021;AACL-IJCNLP 2020;EACL 2021 期刊审稿人:TMLR、《自然人类行为》、《自然通讯》;《通讯生物学》;TICS、《ACM 通讯》、《计算神经科学前沿》
Service: Committee Member / Reviewer: - Advances in Neural Information Processing Systems (NeurIPS): 2024, 2023, 2022, 2021, 2020 - The Association for the Advancement of Artificial Intelligence (AAAI): 2025, 2023, 2022 - International Conference on Machine Learning (ICML): 2024, 2023, 2022, 2021, 2020 - Conference on Learning Theory (COLT): 2024, 2023 - Annual ACM Symposium on Theory of Computing (STOC): 2023 - International Conference on Learning Representations (ICLR): 2025, 2024 - Innovations in Theoretical Computer Science (ITCS): 2024 - International Joint Conference on Artificial Intelligence (IJCAI): 2024, 2023, 2022, 2021 - ACM International Conference on Knowledge Discovery and Data Mining (KDD): 2021 - International Conference on Artificial Intelligence and Statistics (AISTATS): 2025, 2024, 2023 - Conference on Algorithmic Learning Theory (ALT): 2021 - Conference on Economics and Computation (EC): 2023 - INFORMS Workshop on Data Science (WDS): 2023 - INFORMS Journal on Computing - Management Science - Transactions on Machine Learning Research (TMLR) - IEEE Transactions on Pattern Analysis and Machine智能(TPAMI)
1。J. Ma,H。Pei,L。Lausen和G. Karypis, 2。 J. Jabbour,V。V。V. Berghe,J。Runevic,M。Stewart,J。C。Krishnan,V。V。V. V. Huang,I。Faust,Faust,Faust,Faust,Faust, V. J. Reddi,A2Perf:现实世界2025, 3。 St. Cheng,J。Yik,R。Ghosal,I。 J. Reddi,“采石场:计算特征代理的崇拜日期”,IEEE计算机Letters Architect,2025。ARX:2501,01892,杂志。 4。 J. MA,A。 5。 J. My,A。Letcher,F.Schäfer,Y。 2021。Arxiv:2111,08565,完整纸。J. Ma,H。Pei,L。Lausen和G. Karypis,2。J. Jabbour,V。V。V. Berghe,J。Runevic,M。Stewart,J。C。Krishnan,V。V。V. V. Huang,I。Faust,Faust,Faust,Faust,Faust, V. J. Reddi,A2Perf:现实世界2025,3。St. Cheng,J。Yik,R。Ghosal,I。 J. Reddi,“采石场:计算特征代理的崇拜日期”,IEEE计算机Letters Architect,2025。ARX:2501,01892,杂志。4。J. MA,A。 5。 J. My,A。Letcher,F.Schäfer,Y。 2021。Arxiv:2111,08565,完整纸。J. MA,A。5。J. My,A。Letcher,F.Schäfer,Y。 2021。Arxiv:2111,08565,完整纸。J. My,A。Letcher,F.Schäfer,Y。 2021。Arxiv:2111,08565,完整纸。
3。脱离Bellman的完整性:通过基于模型的返回条件的监督学习[链接] Zhaoyi Zhou,Chuning Zhu,Runlong Zhou,Qiwen Cui,Abhishek Gupta,Simon S. Du ICLR 2024 2024年海报我们研究了Al Al Al Al的长度和弱点。4。强化方差学习中的尖锐方差界限:在随机和确定性环境中两全其美[link] Runlong Zhou,Zihan Zhang,Simon S. Du ICML 2023海报我们提供了一个系统的研究研究,对基于模型和模型的强化学习的方差依赖性遗憾界限,用于制作模型和模型的增强范围。 提出的基于模型的算法既适用于随机和确定性MDP。 5。 潜在马尔可夫决策过程的依赖于方差的和无水平的加固学习[链接] Runlong Zhou,Ruosong Wang,Simon S. Du ICML 2023海报我们为潜在MDPS提供了算法框架(可见上下文),从而实现了第一台无线的最小值遗憾。 我们通过使用对称技术为LMDP提供了一种新颖的LMDP遗憾下限来补充这项研究。 6。 了解在线组合优化的政策优化中的课程学习[链接] Runlong Zhou,Zelin HE,Yuandong Tian,Yi Wu,Yi Wu,Simon S. DU TMLR我们制定了典范的在线组合优化问题,作为潜在的MDP,并为LMDPS的自然政策梯度提供了融合。 我们通过相对条件数的角度显示了课程学习的有效性。 7。强化方差学习中的尖锐方差界限:在随机和确定性环境中两全其美[link] Runlong Zhou,Zihan Zhang,Simon S. Du ICML 2023海报我们提供了一个系统的研究研究,对基于模型和模型的强化学习的方差依赖性遗憾界限,用于制作模型和模型的增强范围。提出的基于模型的算法既适用于随机和确定性MDP。5。依赖于方差的和无水平的加固学习[链接] Runlong Zhou,Ruosong Wang,Simon S. Du ICML 2023海报我们为潜在MDPS提供了算法框架(可见上下文),从而实现了第一台无线的最小值遗憾。我们通过使用对称技术为LMDP提供了一种新颖的LMDP遗憾下限来补充这项研究。6。了解在线组合优化的政策优化中的课程学习[链接] Runlong Zhou,Zelin HE,Yuandong Tian,Yi Wu,Yi Wu,Simon S. DU TMLR我们制定了典范的在线组合优化问题,作为潜在的MDP,并为LMDPS的自然政策梯度提供了融合。我们通过相对条件数的角度显示了课程学习的有效性。7。Stochastic Shortest Path: Minimax, Parameter-Free and Towards Horizon-Free Regret [Link] Jean Tarbouriech*, Runlong Zhou* , Simon S. Du, Matteo Pirotta, Michal Valko, Alessandro Lazaric NeurIPS 2021 Spotlight, 3 % acceptance rate We propose an algorithm (EB-SSP) for SSP problems, which is the first to achieve minimax optimal regret while无参数。
活动研究生申请导师,AI 2024年酷儿 - 研究生申请援助计划审阅者,AI 2024 Queer,AI 2024 – Communications主席,加固学习会议(RLC)2024 2024研讨会组织者,增强奖励 @ rlc 2024 2024 2024 2024 2024 2024年2024年未来的教师计划参与者,Eberly Center @ cmu 2022- @ cmu 2022- @ cmu 2022- @ CMU 2022- CMU SCS Dean的咨询委员会2021 –▷本科研究参与工作组2021 –▷为研究生提供互动研讨会,以指导研究项目的本科生的最佳实践。进行了IRB批准的研究,以测量训练效果。在Eberly教学峰会上选出的结果。[Workshop Slides and Results Poster] Graduate Application Support Program , CMU Robotics Institute, Mentor 2021–2022 Graduate Application Support Program , CMU Robotics Institute, Organizer 2021 Undergraduate AI Mentoring Program , CMU 2021 Journal Reviewer : IEEE Transactions on Robotics (IEEE T-RO), IEEE Transactions on Information Theory (IEEE T-IT), International Journal of Robotics Research (IJRR), Transactions on ML Research (TMLR) Conference Reviewer : NeurIPS 2021-2023, ICRA 2022/2024, ICML 2023/2024, ICLR 2024, IROS 2024 Workshop Reviewer : Strategic ML @ NeurIPS 2021, Real World Reinforcement Learning @ NeurIPS 2022, Interactive Learning with Implicit Human Feedback @ ICML 2023年,学习,动态和控制 @ icml 2023,机器人学习研讨会 @ Neurips 2023