影响力指数

31.02/100

前 23.3%

全站排名 #15,011

发表论文6 篇

平均评分5.0

年均产出2.0 篇/年

Siliang Zeng

Researcher@ByteDance Inc.·美国·OpenReview

研究方向

Reinforcement Learning · Inverse Reinforcement Learning · Large Language Model

Aligning Frozen LLMs by Reinforcement Learning: An Iterative Reweight-then-Optimize Approach

ICLR 2026Rejected

Reinforcing Multi-Turn Reasoning in LLM Agents via Turn-Level Reward Design

ICLR 2026Rejected

Joint Reward and Policy Learning with Demonstrations and Human Feedback Improves Alignment

ICLR 2025Spotlight

From Demonstrations to Rewards: Alignment Without Explicit Human Preferences

ICLR 2025Rejected

Policy optimization can be memory-efficient: LLM Alignment Through Successive Policy Re-weighting (SPR)

ICLR 2025Rejected

合作者 (20)

博士导师6 篇

Anderson Schneider