影响力指数

61.53/100

前 4.4%

全站排名 #2,848

发表论文13 篇

平均评分5.7

年均产出4.3 篇/年

Xiaojun Quan

Full Professor@Shenzhen Loop Area Institute·中国·OpenReview

研究方向

model fusion · large language models · model compression

SPELL: Self-Play Reinforcement Learning for Evolving Long-Context Language Models

ICLR 2026Poster

FuseRL: Dense Preference Optimization for Heterogeneous Model Fusion

ICLR 2026Withdrawn

Smooth Gradients, Stable Learning: Logits Convexity for Reinforcement Learning

ICLR 2026Withdrawn

Advantage-Guided Distillation for Preference Alignment in Small Language Models

ICLR 2025Spotlight

Probabilistic Token Alignment for Large Language Model Fusion

NeurIPS 2025Poster

Lookahead Routing for Large Language Models

NeurIPS 2025Poster

FuseChat: Knowledge Fusion of Chat Models

ICLR 2025Withdrawn

Probabilistic Token Alignment for Large Language Model Fusion

ICLR 2025Rejected

Weighted-Reward Preference Optimization for Implicit Model Fusion

ICLR 2025Poster

Discriminative Policy Optimization for Token-Level Reward Models

ICML 2025Poster

Let Large Language Models Find the Data to Train Themselves

ICLR 2025Withdrawn

合作者 (20)

Longguang Zhong