Paper
Hub
搜索
Toggle language
Ashutosh Baheti
~Ashutosh_Baheti1
1
论文总数
1.0
年均投稿
6.3
平均评分
接收情况
1
/
1
会议分布
ICLR
1
发表论文 (1 篇)
2024
1 篇
6.3
4
Leftover Lunch: Advantage-based Offline Reinforcement Learning for Language Models
ICLR 2024
Poster
合作者 (5)
FB
Faeze Brahman
1 篇
MS
Maarten Sap
1 篇
MR
Mark Riedl
1 篇
RB
Ronan Le Bras
1 篇
XL
Ximing Lu
1 篇