影响力指数

36.56/100

前 17.2%

全站排名 #11,097

发表论文4 篇

平均评分6.0

年均产出1.3 篇/年

Jincheng Mei

Research Scientist@Google DeepMind·英国·OpenReview

Revisiting Mixture Policies in Entropy-Regularized Actor-Critic

ICLR 2026Rejected

REINFORCE Converges to Optimal Policies with Any Learning Rate

NeurIPS 2025Poster

Value-Incentivized Preference Optimization: A Unified Approach to Online and Offline RLHF

ICLR 2025Poster

合作者 (18)

Dale Schuurmans

博士导师3 篇

Csaba Szepesvari