影响力指数

26.22/100

前 29.3%

全站排名 #18,855

发表论文2 篇

平均评分5.6

年均产出1.0 篇/年

Qining Zhang

PhD student@University of Michigan - Ann Arbor·美国·OpenReview

研究方向

Stochastic Bandits · Reinforcement Learning Theory

Provable Policy Optimization for Reinforcement Learning from Trajectory Preferences with an Unknown Link Function

ICLR 2026Rejected

Zeroth-Order Policy Gradient for Reinforcement Learning from Human Feedback without Reward Inference

ICLR 2025Poster

合作者 (1)

博士导师2 篇