Paper
Hub
搜索
Toggle language
Jiarui Yu
~Jiarui_Yu1
1
论文总数
1.0
年均投稿
7.3
平均评分
接收情况
1
/
1
会议分布
NeurIPS
1
发表论文 (1 篇)
2025
1 篇
7.3
4
ReDit: Reward Dithering for Improved LLM Policy Optimization
NeurIPS 2025
Poster
合作者 (5)
CW
Chenxing Wei
1 篇
FY
Fei Yu
1 篇
HD
Hande Dong
1 篇
YS
Yao Shu
1 篇
YH
Ying Tiffany He
1 篇