Paper
Hub
搜索
Toggle language
Sam Work
~Sam_Work1
1
论文总数
1.0
年均投稿
7.3
平均评分
接收情况
1
/
1
会议分布
NeurIPS
1
发表论文 (1 篇)
2025
1 篇
7.3
4
Tapered Off-Policy REINFORCE - Stable and efficient reinforcement learning for large language models
NeurIPS 2025
Poster
合作者 (9)
AF
Alexandre Fréchette
1 篇
AB
Arnaud Bergeron
1 篇
CP
Carolyne Pelletier
1 篇
ET
Eric Thibodeau-Laufer
1 篇
JL
Jonathan Lebensold
1 篇
JG
Joshua Greaves
1 篇
MB
Marc G Bellemare
1 篇
NR
Nicolas Le Roux
1 篇
查看全部 9 位合作者