影响力指数
57.84/100
前 5.4%
全站排名 #3,459
发表论文7
平均评分5.9
年均产出2.3 篇/年
AI 学术分析

Kwang-Sung Jun

Associate Professor@Pohang University of Science and Technology·韩国·OpenReview
研究方向

alignment · reinforcement learning from human feedback (RLHF) · test-time scaling · offline bandits · off-policy evaluation · selection · learning · online learning · multi-armed bandit