Paper
Hub
搜索
Toggle language
Derong Xu
~Derong_Xu1
1
论文总数
1.0
年均投稿
6.0
平均评分
接收情况
1
/
1
会议分布
NeurIPS
1
发表论文 (1 篇)
2025
1 篇
6.0
4
Process vs. Outcome Reward: Which is Better for Agentic RAG Reinforcement Learning
NeurIPS 2025
Poster
合作者 (11)
HG
Huifeng Guo
1 篇
KD
Kuicai Dong
1 篇
PJ
Pengyue Jia
1 篇
RT
Ruiming Tang
1 篇
WZ
wenlin zhang
1 篇
XL
Xiangyang Li
1 篇
XZ
Xiangyu Zhao
1 篇
XL
Xiaopeng Li
1 篇
查看全部 11 位合作者