Paper
Hub
搜索
Toggle language
Juntao Dai
~Juntao_Dai1
3
论文总数
1.5
年均投稿
6.7
平均评分
接收情况
3
/
3
会议分布
NeurIPS
2
ICLR
1
发表论文 (3 篇)
2025
2 篇
6.5
4
Mitigating Reward Over-Optimization in RLHF via Behavior-Supported Regularization
ICLR 2025
Poster
7.3
4
Safe RLHF-V: Safe Reinforcement Learning from Multi-modal Human Feedback
NeurIPS 2025
Poster
2024
1 篇
6.3
4
Aligner: Efficient Alignment by Learning to Correct
NeurIPS 2024
Oral
合作者 (20)
YY
Yaodong Yang
3 篇
BC
Boyuan Chen
2 篇
DH
Donghai Hong
2 篇
JJ
Jiaming Ji
2 篇
BZ
Borong Zhang
1 篇
HL
Hantao Lou
1 篇
TQ
Tianyi Qiu
1 篇
XP
Xuehai Pan
1 篇
查看全部 20 位合作者