Paper
Hub
搜索
Toggle language
Qining Zhang
~Qining_Zhang2
1
论文总数
1.0
年均投稿
6.8
平均评分
接收情况
1
/
1
会议分布
ICLR
1
发表论文 (1 篇)
2025
1 篇
6.8
4
Zeroth-Order Policy Gradient for Reinforcement Learning from Human Feedback without Reward Inference
ICLR 2025
Poster
合作者 (1)
LY
Lei Ying
1 篇