Paper
Hub
搜索
Toggle language
Zikang Shan
~Zikang_Shan1
1
论文总数
1.0
年均投稿
6.1
平均评分
接收情况
1
/
1
会议分布
ICML
1
发表论文 (1 篇)
2025
1 篇
6.1
4
DPO Meets PPO: Reinforced Token Optimization for RLHF
ICML 2025
Spotlight
合作者 (8)
DH
Di He
1 篇
GF
Guhao Feng
1 篇
HZ
Han Zhong
1 篇
JB
Jiang Bian
1 篇
LZ
Li Zhao
1 篇
LW
Liwei Wang
1 篇
WX
Wei Xiong
1 篇
XC
Xinle Cheng
1 篇