影响力指数

62.05/100

前 4.3%

全站排名 #2,758

发表论文8 篇

平均评分6.4

年均产出2.7 篇/年

Wei Xiong

Researcher@OpenAI·美国·OpenReview

研究方向

Machine Learning · Large language model

StepWiser: Stepwise Generative Judges for Wiser Reasoning

ICLR 2026Withdrawn

Logarithmic Regret for Online KL-Regularized Reinforcement Learning

ICML 2025Poster

Building Math Agents with Multi-Turn Iterative Preference Learning

ICLR 2025Poster

Optimizing Chain-of-Thought Reasoners via Gradient Variance Minimization in Rejection Sampling and RL

NeurIPS 2025Poster

LLM Alignment as Retriever Optimization: An Information Retrieval Perspective

ICML 2025Poster

RRM: Robust Reward Model Training Mitigates Reward Hacking

ICLR 2025Poster

DPO Meets PPO: Reinforced Token Optimization for RLHF

ICML 2025Spotlight

合作者 (20)

博士导师5 篇