Paper
Hub
搜索
Toggle language
Ryan McDonald
~Ryan_McDonald2
3
论文总数
1.5
年均投稿
5.5
平均评分
接收情况
1
/
3
会议分布
ICLR
2
COLM
1
发表论文 (3 篇)
2025
1 篇
4.8
4
Sparse Rewards Can Self-Train Dialogue Agents
ICLR 2025
Rejected
2024
2 篇
5.0
4
HeaP: Hierarchical Policies for Web Actions using LLMs
ICLR 2024
Rejected
6.7
3
SteP: Stacked LLM Policies for Web Actions
COLM 2024
Poster
合作者 (6)
PS
Paloma Sodhi
2 篇
SB
S.R.K Branavan
2 篇
YA
Yoav Artzi
1 篇
BL
Barrett Martin Lattimer
1 篇
VG
Varun Prashant Gangal
1 篇
YY
Yi Yang
1 篇