科研成果

Meta-Reward-Net: Implicitly Differentiable Reward Learning for Preference-based Reinforcement Learning

A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning

A Unified Diversity Measure for Multiagent Reinforcement Learning

Constrained Update Projection Approach to Safe Policy Optimization

Towards Human-Level Bimanual Dexterous Manipulation with Reinforcement Learning

MATE: Benchmarking Multi-Agent Reinforcement Learning in Distributed Target Coverage Control