Paper
Hub
搜索
Toggle language
Mohammad Saleh
~Mohammad_Saleh1
3
论文总数
1.5
年均投稿
6.4
平均评分
接收情况
3
/
3
会议分布
ICLR
3
发表论文 (3 篇)
2025
2 篇
7.0
4
Building Math Agents with Multi-Turn Iterative Preference Learning
ICLR 2025
Poster
6.5
4
RRM: Robust Reward Model Training Mitigates Reward Hacking
ICLR 2025
Poster
2024
1 篇
5.7
3
Statistical Rejection Sampling Improves Preference Optimization
ICLR 2024
Poster
合作者 (20)
RJ
Rishabh Joshi
3 篇
TL
Tianqi Liu
3 篇
BP
Bilal Piot
2 篇
JS
Jiaming Shen
2 篇
WX
Wei Xiong
2 篇
ZQ
Zhen Qin
2 篇
MK
Misha Khalman
2 篇
AI
Abe Ittycheriah
1 篇
查看全部 20 位合作者