firstbacksecondback
321 Results
Poster
|
Thu 1:45 |
Jumanji: a Diverse Suite of Scalable Reinforcement Learning Environments in JAX Clément Bonnet · Daniel Luo · Donal Byrne · Shikha Surana · Sasha Abramowitz · Paul Duckworth · Vincent Coyette · Laurence Midgley · Elshadai Tegegn · Tristan Kalloniatis · Omayma Mahjoub · Matthew Macfarlane · Andries Smit · Nathan Grinsztajn · Raphael Boige · Cemlyn Waters · Mohamed Ali Mimouni · Ulrich Mbou Sob · Ruan de Kock · Siddarth Singh · Daniel Furelos-Blanco · Victor Le · Arnu Pretorius · Alexandre Laterre |
|
Poster
|
Thu 1:45 |
Identifying Policy Gradient Subspaces Jan Schneider · Pierre Schumacher · Simon Guist · Le Chen · Daniel Haeufle · Bernhard Schoelkopf · Dieter Büchler |
|
Workshop
|
WorkArena: How Capable are Web Agents at Solving Common Knowledge Work Tasks? Alexandre Drouin · Maxime Gasse · Massimo Caccia · Issam Laradji · Manuel Del Verme · Tom Marty · David Vazquez · Nicolas Chapados · Alexandre Lacoste |
||
Workshop
|
AgentBoard: An Analytical Evaluation Board of Multi-turn LLM Agents Chang Ma · Junlei Zhang · Zhihao Zhu · Cheng Yang · Yujiu Yang · Yaohui Jin · Zhenzhong Lan · Lingpeng Kong · Junxian He |
||
Workshop
|
ReST meets ReAct: Self-Improvement for Multi-Step Reasoning LLM Agent Renat Aksitov · Sobhan Miryoosefi · Zonglin Li · Daliang Li · Sheila Babayan · Kavya Kopparapu · Zachary Fisher · Ruiqi Guo · Sushant Prakash · Pranesh Srinivasan · Manzil Zaheer · Felix Yu · Sanjiv Kumar |
||
Workshop
|
Lumos: Learning Agents with Unified Data, Modular Design, and Open-Source LLMs Da Yin · Faeze Brahman · Abhilasha Ravichander · Khyathi Chandu · Kai-Wei Chang · Yejin Choi · Bill Yuchen Lin |
||
Poster
|
Tue 7:30 |
AgentBench: Evaluating LLMs as Agents Xiao Liu · Hao Yu · Hanchen Zhang · Yifan Xu · Xuanyu Lei · Hanyu Lai · Yu Gu · Hangliang Ding · Kaiwen Men · Kejuan Yang · Shudan Zhang · Xiang Deng · Aohan Zeng · Zhengxiao Du · Chenhui Zhang · Sheng Shen · Tianjun Zhang · Yu Su · Huan Sun · Minlie Huang · Yuxiao Dong · Jie Tang |
|
Poster
|
Wed 1:45 |
Lemur: Harmonizing Natural Language and Code for Language Agents Yiheng Xu · Hongjin SU · Chen Xing · Boyu Mi · Qian Liu · Weijia Shi · Binyuan Hui · FAN ZHOU · Yitao Liu · Tianbao Xie · Zhoujun Cheng · Siheng Zhao · Lingpeng Kong · Bailin Wang · Caiming Xiong · Tao Yu |
|
Poster
|
Wed 1:45 |
Towards Foundational Models for Molecular Learning on Large-Scale Multi-Task Datasets Dominique Beaini · Shenyang(Andy) Huang · Joao Cunha · Zhiyi Li · Gabriela Moisescu-Pareja · Oleksandr Dymov · Samuel Maddrell-Mander · Callum McLean · Frederik Wenkel · Luis Müller · Jama Hussein Mohamud · Ali Parviz · Michael Craig · Michał Koziarski · Jiarui Lu · Zhaocheng Zhu · Cristian Gabellini · Kerstin Klaser · Josef Dean · Cas Wognum · Maciej Sypetkowski · Guillaume Rabusseau · Reihaneh Rabbany · Jian Tang · Christopher Morris · Mirco Ravanellu · Guy Wolf · Prudencio Tossou · Hadrien Mary · Therence Bois · Andrew Fitzgibbon · Blazej Banaszewski · Chad Martin · Dominic Masters |