影响力指数

15.26/100

超过 46.4%

全站排名 #34,478

发表论文4 篇

平均评分4.4

年均产出4.0 篇/年

Yuzi Yan

PhD student@Tsinghua University·中国·OpenReview

研究方向

Large Language Model · Multi-agent Reinforcement Learning

3D-Properties: Identifying Challenges in DPO and Charting a Path Forward

ICLR 2025Poster

Reward-Robust RLHF in LLMs

ICLR 2025Rejected

Uncertainty-aware Reward Model: Teaching Reward Models to Know What is Unknown

ICLR 2025Withdrawn

Boosting Deductive Reasoning with Step Signals In RLHF

ICLR 2025Rejected

合作者 (12)