Weizhu Chen

~Weizhu_Chen1

22

论文总数

11.0

年均投稿

6.0

平均评分

接收情况16/22

会议分布

ICLR

12

NeurIPS

6

COLM

3

ICML

1

发表论文 (22 篇)

202510 篇

Self-Augmented Preference Optimization: Off-Policy Paradigms for Language Model Alignment

ICLR 2025Rejected

Relative Preference Optimization: Enhancing LLM Alignment through Contrasting Responses across Identical and Diverse Prompts

ICLR 2025Rejected

Samba: Simple Hybrid State Space Models for Efficient Unlimited Context Language Modeling

ICLR 2025Poster

SlimMoE: Structured Compression of Large MoE Models via Expert Slimming and Distillation

COLM 2025Poster

LongRoPE2: Near-Lossless LLM Context Window Scaling

ICML 2025Poster

Segmenting Text and Learning Their Rewards for Improved RLHF in Language Models

ICLR 2025Rejected

SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning

NeurIPS 2025Poster

Scaling Laws of Synthetic Data for Language Model

COLM 2025Poster

Reinforcement Learning for Reasoning in Large Language Models with One Training Example

NeurIPS 2025Poster

Decoder-Hybrid-Decoder Architecture for Efficient Reasoning with Long Generation

NeurIPS 2025Poster

202412 篇

Seeking Neural Nuggets: Knowledge Transfer in Large Language Models from a Parametric Perspective

ICLR 2024Poster

Sparse Backpropagation for MoE Training

ICLR 2024Rejected

Deep Reinforcement Learning from Weak Hierarchical Preference Feedback

ICLR 2024Rejected

HART: Efficient Adaptation via Regularized Autoregressive Parameter Generation

ICLR 2024Rejected

Make Your LLM Fully Utilize the Context

NeurIPS 2024Poster

LoftQ: LoRA-Fine-Tuning-aware Quantization for Large Language Models

Exploring the Mystery of Influential Data for Mathematical Reasoning

COLM 2024Poster

CRITIC: Large Language Models Can Self-Correct with Tool-Interactive Critiquing

ICLR 2024Poster

ToRA: A Tool-Integrated Reasoning Agent for Mathematical Problem Solving

ICLR 2024Poster

WizardArena: Post-training Large Language Models via Simulated Offline Chatbot Arena

NeurIPS 2024Poster

Supervised Knowledge Makes Large Language Models Better In-context Learners

ICLR 2024Poster

Not All Tokens Are What You Need for Pretraining

NeurIPS 2024Oral

合作者 (20)

yelong shen8 篇

Yeyun Gong5 篇

Yujiu Yang4 篇

Zhibin Gou4 篇

Chen Liang4 篇

Jianfeng Gao3 篇

Liyuan Liu3 篇