Paper
Hub
搜索
Toggle language
Mingyue Huo
~Mingyue_Huo1
1
论文总数
1.0
年均投稿
6.0
平均评分
接收情况
1
/
1
会议分布
ICLR
1
发表论文 (1 篇)
2025
1 篇
6.0
4
Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning
ICLR 2025
Oral
合作者 (8)
BP
Baolin Peng
1 篇
DY
Dian Yu
1 篇
DY
Dong Yu
1 篇
HM
Haitao Mi
1 篇
LS
Linfeng Song
1 篇
NJ
Nan Jiang
1 篇
YT
Ye Tian
1 篇
YZ
Yuheng Zhang
1 篇