Skip to yearly menu bar Skip to main content


Poster

OPRIDE: Efficient Offline Preference-based Reinforcement Learning via In-Dataset Exploration

Yiqin Yang · Hao Hu · Yihuan Mao · Jin Zhang · Chengjie Wu · Yuhua Jiang · Xu Yang · Runpeng Xie · Yi Fan · Bo Liu · Yang Gao · Bo XU · Chongjie Zhang

Abstract

Log in and register to view live content