Paper
Hub
搜索
Toggle language
Weixun Wang
~Weixun_Wang1
2
论文总数
1.0
年均投稿
4.7
平均评分
接收情况
1
/
2
会议分布
COLM
1
ICLR
1
发表论文 (2 篇)
2025
1 篇
3.0
4
Adaptive dense reward:Understanding the Gap Between Action and Reward Space in Alignment
ICLR 2025
withdrawn
2024
1 篇
6.4
5
The N+ Implementation Details of RLHF with PPO: A Case Study on TL;DR Summarization
COLM 2024
Poster
合作者 (14)
AH
Arian Hosseini
1 篇
KR
Kashif Rasul
1 篇
LT
Lewis Tunstall
1 篇
MN
Michael Noukhovitch
1 篇
SH
Shengyi Huang
1 篇
BZ
Bo Zheng
1 篇
GC
Gengru Chen
1 篇
SX
Shaopan Xiong
1 篇
查看全部 14 位合作者