Paper
Hub
搜索
Toggle language
Qing Yang
~Qing_Yang9
1
论文总数
1.0
年均投稿
7.3
平均评分
接收情况
1
/
1
会议分布
NeurIPS
1
发表论文 (1 篇)
2025
1 篇
7.3
4
Reinforcement Learning for Reasoning in Large Language Models with One Training Example
NeurIPS 2025
Poster
合作者 (13)
BP
Baolin Peng
1 篇
HC
Hao Cheng
1 篇
JG
Jianfeng Gao
1 篇
KW
Kuan Wang
1 篇
LR
Liliang Ren
1 篇
LL
Liyuan Liu
1 篇
SW
Shuohang Wang
1 篇
SD
Simon Shaolei Du
1 篇
查看全部 13 位合作者