Paper
Hub
搜索
Toggle language
Yang Zhou
~Yang_Zhou41
1
论文总数
1.0
年均投稿
6.8
平均评分
接收情况
1
/
1
会议分布
NeurIPS
1
发表论文 (1 篇)
2025
1 篇
6.8
4
SeRL: Self-play Reinforcement Learning for Large Language Models with Limited Data
NeurIPS 2025
Poster
合作者 (7)
DT
Dacheng Tao
1 篇
KC
Kaixuan Chen
1 篇
KZ
Kongcheng Zhang
1 篇
MS
Mingli Song
1 篇
SL
Shunyu Liu
1 篇
TZ
Tongya Zheng
1 篇
WF
Wenkai Fang
1 篇