影响力指数

56.62/100

前 5.9%

全站排名 #3,767

发表论文11 篇

平均评分5.8

年均产出3.7 篇/年

Jiaxuan Gao

PhD student@Tsinghua University·中国·OpenReview

6.0

AREAL: A Large-Scale Asynchronous Reinforcement Learning System for Language Reasoning

NeurIPS 2025Poster

二作

6.8

Reasoning Is Not a Race: When Stopping Early Beats Going Deeper

NeurIPS 2025Poster

二作

6.0

Few-shot In-context Preference Learning using Large Language Models

ICLR 2025Rejected

三作

6.0

How Far Are We from Optimal Reasoning Efficiency?

NeurIPS 2025Poster

一作

6.0

Fine-tuning Diffusion Policies with Backpropagation Through Diffusion Timesteps

NeurIPS 2025Rejected

二作

5.2

On Designing Effective RL Reward at Training Time for LLM Reasoning

合作者 (20)

Jiaxuan Gao

QuestA: Expanding Reasoning Capacity in LLMs via Question Augmentation

Unlocking Long-Horizon Agentic Search with Large-Scale End-to-End RL

Fine-tuning Diffusion Policies with Backpropagation Through Diffusion Timesteps

Extending Test-Time Scaling: A 3D Perspective with Context, Batch, and Turn

AREAL: A Large-Scale Asynchronous Reinforcement Learning System for Language Reasoning

Reasoning Is Not a Race: When Stopping Early Beats Going Deeper

Few-shot In-context Preference Learning using Large Language Models

How Far Are We from Optimal Reasoning Efficiency?

Fine-tuning Diffusion Policies with Backpropagation Through Diffusion Timesteps

On Designing Effective RL Reward at Training Time for LLM Reasoning