Paper
Hub
搜索
Toggle language
Yang Gao
~Yang_Gao6
3
论文总数
1.5
年均投稿
6.4
平均评分
接收情况
3
/
3
会议分布
COLM
2
ICLR
1
发表论文 (3 篇)
2025
1 篇
6.5
4
RRM: Robust Reward Model Training Mitigates Reward Hacking
ICLR 2025
Poster
2024
2 篇
6.8
4
Impact of Preference Noise on the Alignment Performance of Generative Language Models
COLM 2024
Poster
6.0
4
Best-of-Venom: Attacking RLHF by Injecting Poisoned Preference Data
COLM 2024
Poster
合作者 (20)
DA
Dana Alon
2 篇
DM
Donald Metzler
2 篇
AI
Abe Ittycheriah
1 篇
AM
Anastasia Makarova
1 篇
AK
Aviral Kumar
1 篇
BP
Bilal Piot
1 篇
DS
Daniel Sohn
1 篇
JL
Jeremiah Zhe Liu
1 篇
查看全部 20 位合作者