影响力指数
论文质量、代表作、近期表现、广度与样本量置信度综合计算
57.84/100
前 5.4%
全站排名 #3,459
发表论文7 篇
平均评分
年均产出2.3 篇/年
AI 学术分析
Kwang-Sung Jun
研究方向
alignment · reinforcement learning from human feedback (RLHF) · test-time scaling · offline bandits · off-policy evaluation · selection · learning · online learning · multi-armed bandit