影响力指数

4.04/100

超过 12.4%

全站排名 #56,412

发表论文3 篇

平均评分5.6

年均产出1.5 篇/年

Yang Zhou

MS student@Zhejiang University·中国·OpenReview

研究方向

reinforcement learning · LLM agent · GUI agent

Breaking the Exploration Bottleneck: Rubric-Scaffolded Reinforcement Learning for General LLM Reasoning

ICLR 2026Rejected

VeriWeb: Verifiable Long-Chain Web Benchmark for Agentic Information-Seeking

ICLR 2026Rejected

SeRL: Self-play Reinforcement Learning for Large Language Models with Limited Data

NeurIPS 2025Poster

合作者 (20)

Kongcheng Zhang