影响力指数

51.36/100

前 7.9%

全站排名 #5,081

发表论文6 篇

平均评分6.1

年均产出3.0 篇/年

Songjun Tu

PhD student@Institute of Automation Chinese Academy of Sciences·中国·OpenReview

研究方向

Large Language Models · Reinforecement Learning

SRFT: A Single-Stage Method with Supervised and Reinforcement Fine-Tuning for Reasoning

ICLR 2026Poster

Layerwise Learning Rate in the Era of Large Language Models

ICLR 2026Rejected

AlphaDecay: Module-wise Weight Decay for Heavy-Tailed Balancing in LLMs

NeurIPS 2025Poster

Learning When to Think: Shaping Adaptive Reasoning in R1-Style Models via Multi-Stage RL

NeurIPS 2025Poster

Unsupervised Zero-Shot Reinforcement Learning via Dual-Value Forward-Backward Representation

ICLR 2025Poster

Enhancing LLM Reasoning with Iterative DPO: A Comprehensive Empirical Investigation

COLM 2025Poster

合作者 (20)

博士导师4 篇

博士导师3 篇