影响力指数

44.54/100

前 11.3%

全站排名 #7,254

发表论文9 篇

平均评分5.8

年均产出4.5 篇/年

Wei Shen

Principal Researcher@ByteDance Inc.·中国·OpenReview

TreePO: Enhancing Policy Efficacy and Inference Efficiency with Tree Modeling

ICLR 2026Rejected

AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning

ICLR 2026Rejected

HPSERec: A Hierarchical Partitioning and Stepwise Enhancement Framework for Long-tailed Sequential Recommendation

NeurIPS 2025Poster

AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning

NeurIPS 2025Rejected

What Do Latent Action Models Actually Learn?

NeurIPS 2025Poster

Policy Filtration for RLHF to Mitigate Noise in Reward Models

ICML 2025Poster

AdaptiveStep: Automatically Dividing Reasoning Step through Model Confidence

ICML 2025Poster

Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback

NeurIPS 2025Poster

Policy Filtration in RLHF to Fine-Tune LLM for Code Generation

ICLR 2025Rejected

合作者 (20)