Ashutosh Baheti

~Ashutosh_Baheti1

1

论文总数

1.0

年均投稿

6.3

平均评分

接收情况1/1

会议分布

ICLR

1

发表论文 (1 篇)

20241 篇

Leftover Lunch: Advantage-based Offline Reinforcement Learning for Language Models

ICLR 2024Poster

合作者 (5)

Faeze Brahman1 篇

Maarten Sap1 篇

Mark Riedl1 篇

Ronan Le Bras1 篇