在这份简短的报告中,我们介绍了我们的团队实施的强化学习(RL)[1]来应对在IROS 2024 1举行的第二次AI奥运会竞赛的模拟阶段。The algorithm we employed, Monte- Carlo Probabilistic Inference for Learning COntrol (MC- PILCO) [2], is a Model-Based (MB) RL algorithm that proved remarkably data-efficient in several low-dimensional benchmarks, such as a cart-pole, a ball & plate, and a Furuta pendulum, both in simulation and real setups.mc-pilco也是赢得本次比赛第一版的算法[3]。mc-pilco是MB策略梯度算法的一部分。它通过与系统进行交互来利用收集的数据来得出系统动力学模型并通过模拟系统来优化策略,而不是直接在系统数据上优化策略。应用于物理系统时,这种方法可以比无模型(MF)解决方案高表现和数据效率高。本文的组织如下:第二部分介绍了竞争的目标和设置。第三部分介绍了MC-PILCO算法。 第四节报告了已经执行的实验,最后V节结束了论文。第三部分介绍了MC-PILCO算法。第四节报告了已经执行的实验,最后V节结束了论文。第四节报告了已经执行的实验,最后V节结束了论文。
其他贡献来自NiccolòHurst和Carlo Starace。Marina Dos Santos和Eleni Tsoukala提供了基本的支持。
研究人员:Liyousew Borga(UL)、Anna Kornadt(UL)、Juan Carlos Caro Seguel(UL)、Niccolò Gentile(UL)、Anthony Lepinteur(UL)、Annika Lutz(UL)、Giorgia Menta(UL)、Gemma Riera Mallol(UL)、Sonia Schifano(UL)、Alemayehu Taye(UL)、Vincent Vergnat(UL)、Remi Fernall(UL)、Y(巴塞罗那经济分析研究所 (CSIC))、Xavier Ramos Morilla(巴塞罗那自治大学)。
•邀请的会议:贝叶斯因果关系针对健康相关的应用和政策干预。Francesca Dominici,Antonio Linero,Fabrizia Fealli,Cory Zigler(讨论者)。组织者:Marina Vannucci。•邀请的会话:数据集成。Paul Rognon,Roberta de Vito,NiccolóAnceschi,Giovanni Parmigiani(讨论者)。组织者:大卫·罗塞尔(David Rossell)。•邀请的会话:贝叶斯概率数值方法的最新进展。Chris Oates,Jon Cockayne,Masha Naslidnyk。组织者:Francois-Xavier Briol•邀请的会话:样本量确定的贝叶斯实验设计。Kevin Wilson,Stefania Gubbiotti,Haiyan Zheng。 组织者:费德里科·卡斯泰雷蒂(Federico Castelletti)。 •贡献会议:计量经济学的进步。 TBD,Helga Wagner,Aubrey Poon,Dawid Bernaciak。 •邀请的会话:贝叶斯聚类的最新进展用于复杂数据。 Alex Dombowsky,Gertraud Malsiner-Walli,Cecilia Balocchi,Raffaele Argiento(讨论者)。 组织者:Sally Paganin和Garritt页面。 MultiTrack 2(7月2日,星期二5pm)Kevin Wilson,Stefania Gubbiotti,Haiyan Zheng。组织者:费德里科·卡斯泰雷蒂(Federico Castelletti)。•贡献会议:计量经济学的进步。TBD,Helga Wagner,Aubrey Poon,Dawid Bernaciak。•邀请的会话:贝叶斯聚类的最新进展用于复杂数据。Alex Dombowsky,Gertraud Malsiner-Walli,Cecilia Balocchi,Raffaele Argiento(讨论者)。组织者:Sally Paganin和Garritt页面。MultiTrack 2(7月2日,星期二5pm)
[A3] 国际脑实验室、Kush Banga、Julius Benson、Jai Bhagat、Dan Biderman、Daniel Birman、Niccol`o Bonacchi、Sebastian A Bruijns、Robert A Campbell、Matteo Carandini、Ga ̈elle A Chapuis、Anne K Churchland、M Felicia Davatolhagh、Dong、Faulk、德国、德国、德国 Julia M Huntenburg、Cole Hurwitz、Anup Khanal、Christopher Krasniak、Guido T Meijer、Nathaniel J Miska、Zeinab Mohammadi、Jean-Paul Noel、Liam Paninski、Alejandro Pan- Vazquez、Noam Roth、Michael Schartner、Karolina Socha、Nicholas A Stein、Karl Marais、Marsa Welles、Anne Welles Steven J West、Matthew R Whiteway、Olivier Winter 和 Ilana B Witten。小鼠体内电生理测量的可重复性。修订正在审查中,bioRxiv,2023 年。
国际脑实验室 *,布兰登·本森1,朱利叶斯·本森2,丹尼尔·比尔曼3,尼科尔·波纳奇4,马特·卡兰迪尼5,乔纳·卡塔里诺4,盖尔·盖尔·盖尔·乔伊斯6,安妮·K教堂7,杨教堂7,杨丹8,peter dayan 9,peter dayan 9,ej tatian 9,ej tatian,ej tatian,ej tatian of Eric Fables,Michele 10 Brie 4 6,Laura Freitas-Silva 4,Berk Gerçek6,Kenneth D Harris 5,Michael Hausser 5,Sonja B Hofer 12,Fei Hu 8,F´elix Hubert 6,Julia Hubert 6,Julia Hunten,79 Christopher Krasniak 10,Christopher Kraspher Kraspher Kraspher Krandon 11 13,Thomas D MRSIC-FLOGEL 13,Jean-Paul Noel 2,Kai Nylund 3,Alejandro 11,C.V。Rille Rossant 5,Noam Roth 3,Rylan Schaeffer 1,Michael Schartner 4,Michael Schartner 4,Yanliang Shi 11 16,奥利维尔(Olivier)和r ilana b witten 11
《经济ICS》,波士顿大学),Saliem Fakir(ACF),Ashish Fernandes(Cli Mate Risk Horizons),Kevin P. Gallagher(GDP中心),Phillip M. Hannam(Energy&Exchnertives Global实践,世界银行),林赛·希伯德(Lindsey Hibberd(The Carbon Trust),Tim Hirschel-Burns(GDP Cent Ter),Valarie Laxton(世界资源研究所(WRI),Environmen tal,资源和空间的能源学院经济学,基尔大学),Tyeler Matsuo(RMI),NicolòManych(GDP中心),George Mowles-Van der Gaag(碳信任),Tsitsi Musasike(GDP中心)(GDP中心),Imomen Outlaw(New Callimate Institute),Ying Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian中心,丽贝卡·雷(Rebecca Ray)(GDP中心),布伦丹·罗斯(ECF),艾玛·斯莱特(Emma Slater)(RMI),魏山(RMI)(发展研究所),格雷什·萨里姆(Gresh Shrimal基本服务改革(IESR)),艾米莉·泰勒(Emily Tyler)(开普敦大学非洲气候与发展研究所)《经济ICS》,波士顿大学),Saliem Fakir(ACF),Ashish Fernandes(Cli Mate Risk Horizons),Kevin P. Gallagher(GDP中心),Phillip M. Hannam(Energy&Exchnertives Global实践,世界银行),林赛·希伯德(Lindsey Hibberd(The Carbon Trust),Tim Hirschel-Burns(GDP Cent Ter),Valarie Laxton(世界资源研究所(WRI),Environmen tal,资源和空间的能源学院经济学,基尔大学),Tyeler Matsuo(RMI),NicolòManych(GDP中心),George Mowles-Van der Gaag(碳信任),Tsitsi Musasike(GDP中心)(GDP中心),Imomen Outlaw(New Callimate Institute),Ying Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian中心,丽贝卡·雷(Rebecca Ray)(GDP中心),布伦丹·罗斯(ECF),艾玛·斯莱特(Emma Slater)(RMI),魏山(RMI)(发展研究所),格雷什·萨里姆(Gresh Shrimal基本服务改革(IESR)),艾米莉·泰勒(Emily Tyler)(开普敦大学非洲气候与发展研究所)《经济ICS》,波士顿大学),Saliem Fakir(ACF),Ashish Fernandes(Cli Mate Risk Horizons),Kevin P. Gallagher(GDP中心),Phillip M. Hannam(Energy&Exchnertives Global实践,世界银行),林赛·希伯德(Lindsey Hibberd(The Carbon Trust),Tim Hirschel-Burns(GDP Cent Ter),Valarie Laxton(世界资源研究所(WRI),Environmen tal,资源和空间的能源学院经济学,基尔大学),Tyeler Matsuo(RMI),NicolòManych(GDP中心),George Mowles-Van der Gaag(碳信任),Tsitsi Musasike(GDP中心)(GDP中心),Imomen Outlaw(New Callimate Institute),Ying Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian Qian中心,丽贝卡·雷(Rebecca Ray)(GDP中心),布伦丹·罗斯(ECF),艾玛·斯莱特(Emma Slater)(RMI),魏山(RMI)(发展研究所),格雷什·萨里姆(Gresh Shrimal基本服务改革(IESR)),艾米莉·泰勒(Emily Tyler)(开普敦大学非洲气候与发展研究所)
查尔斯·休伯特(Charles Hubert)1,国际大实验室,丹尼尔·伯曼(Daniel Birman),安妮·K·苏克兰(Anne K Surchland)8,杨丹9,埃里克·埃吉·侯赛斯(Eric Ej Husser)7,Sounds B Miska 12,Thomas D Men-Flogel 12,Jean-Paul圣诞节4,Kai Nylund 5,Kai Nylund 5,Pan-Vazquez的Alegenro; Paninski 16,乔纳森枕头10; Yanliang Shi 11,Noam Roth 5,Michael Shitner 1 Carolina Z Socha 7,Steven Jon West 12,Anthony Zador 10,Anthony Zador 14,Peter Dayan 13,Alexander
Authors: Julio S. Solís Arce, Shana S. Warren, Niccolò F. Meriggi, Alexandra Scacco, Nina McMurry, Maarten Voors, Georgiy Syunyaev, Amyn Abdul Malik, Samya Aboutajdine, Opeyemi Adeojo, Deborah Anigo, Alex Armand, Saher Asad, Martin Atyra, Britannia Aug, Manchester, Ashbourg yesiga, Antonella Bancalari, Martina Björkman Nyqvist, Ekaterina Borisova, Constantin Manuel Bosancianu, Magarita Rosa Cabra García, Ali Cheema, Elliott Collins, Filippo Cuccaro, Ahsan Zia Farooqi, Tatheer Fatima, Mattia Fracchia, Mery Len Gallo, Andrea Guaria, Alia Sofia, Hami , Sellu Kallon, Anthony Kamwesigye, Arjun Kharel, Sarah Kreps, Madison Levine, Rebecca Littman, Mohammad Malik, Gisele Manirabaruta, Jean Léodomir Habarimana Mfura, Fatoma Momoh, Alberto Mucauque, Imamo Mussa, Jean Aime Nsabimana, Isaac Ochira, Mariana Ochira, Julia Oudrami go, Touba Bakary Pare, Melina R. Platas, Laura Polanco, Javaeria Ashraf Qureshi, Mariam Raheem, Vasudha Ramakrishna, Ismail Rendrá, Taimur Shah, Sarene Eyla Shaked, Jacob N. Shapiro, Jakob Svensson, Ahsan Tariq, Achille Miwana Tchibo, Hamid Trigno, Bhardi, Trive not, Pedro C. Vicente, Laurin B. Weissinger, Basit Zafar, Baobao Zhang, Dean Karlan, Michael Callen, Matthieu Teachout, Macartan Humphreys, Ahmed Mushfiq Mobarak & Saad B. Omer. Laura Burke、Luciana Debenedetti、Julia Liborio、Jeffrey Mosenkis 和 Emilie Yam 对本文做出了贡献。
Oskaras Alšauskas(运输)、Lucila Arboleya Sarazola(投资和金融)、Yasmine Arsalane(经济前景、电力负责人)、Blandine Barreau(复苏计划)、Simon Bennett(氢能、能源技术联合负责人)、Charlène Bisch(数据管理)、Justina Bodláková(就业)、Olivia Chen(就业)、Yunyou Chen(电力)、Daniel Crow(行为、空气污染负责人)、Davide D'Ambrosio(数据科学、电力负责人)、Amrita Dasgupta(关键矿物)、Tanguy De Bienassis(投资和金融)、Tomás de Oliveira Bredariol(煤炭、甲烷负责人)、Michael Drtil(电力和电网)、Darlain Edeme(非洲)、Musa Erdogan(化石燃料补贴、数据管理)、Eric Fabozzi(电力和电网)、Víctor García Tapia(数据科学、建筑)、Pablo González(投资和金融)、Timothy Goodson(建筑负责人)、Emma Gordon(投资和金融)、Jérôme Hilaire(石油和天然气供应建模负责人)、Paul Hugues(工业负责人)、Jacob Hyppolite II(能源获取)、Bruno Idini(交通)、George Kamiya(能源技术、数字化)、Hyeji Kim(交通)、Tae‐Yoon Kim(能源安全和关键矿产负责人)、Martin Kueppers(工业)、Tobias Lechtenbohmer(工业)、Laura Maiolo(石油和天然气供应)、Orla McAlinden(行为)、Yannick Monschauer(可负担性)、Toru Muta(化石燃料补贴负责人)、Paweł Olejarnik(供应建模)、Diana Perez Sanchez(工业)、Apostolos Petropoulos(交通负责人)、Mariachiara Polisena(电力)、Ryszard Pospiech(煤炭供应负责人)建模、数据管理)、Arthur Rogé(建筑)、Max Schoenfisch(电力)、Rebecca Schulz(石油和天然气供应)、Leonie Staas(建筑、行为)、Gianluca Tonolo(能源获取负责人)、Wonjik Yang(数据可视化)和 Peter Zeniewski(天然气负责人)。其他贡献者包括 Niccolò Hurst 和 Carlo Starace。Marina Dos Santos 和 Eleni Tsoukala 提供了重要支持。