影响力指数

66.41/100

前 3.3%

全站排名 #2,123

发表论文9 篇

平均评分6.0

年均产出3.0 篇/年

Tong Yang

PhD student@Carnegie Mellon University·OpenReview

Achieving Logarithmic Regret in KL-Regularized Zero-Sum Markov Games

ICLR 2026Rejected

Exploration from a Primal-Dual Lens: Value-Incentivized Actor-Critic Methods for Sample-Efficient Online RL

NeurIPS 2025Poster

Multi-head Transformers Provably Learn Symbolic Multi-step Reasoning via Gradient Descent

NeurIPS 2025Poster

Incentivize without Bonus: Provably Efficient Model-based Online Multi-agent RL for Markov Games

ICML 2025Poster

Value-Incentivized Preference Optimization: A Unified Approach to Online and Offline RLHF

ICLR 2025Poster

合作者 (19)