影响力指数

23.82/100

前 33.3%

全站排名 #21,465

发表论文1 篇

平均评分6.8

年均产出1.0 篇/年

Johannes Ackermann

PhD student@The University of Tokyo·日本·OpenReview

研究方向

Reinforcement Learning

Off-Policy Corrected Reward Modeling for Reinforcement Learning from Human Feedback

COLM 2025Poster

合作者 (2)

Masashi Sugiyama

博士导师1 篇