Paper
Hub
搜索
Toggle language
Lihong Li
~Lihong_Li1
2
论文总数
2.0
年均投稿
6.2
平均评分
接收情况
2
/
2
会议分布
COLM
1
NeurIPS
1
发表论文 (2 篇)
2025
2 篇
5.4
5
Self-Rewarding PPO: Aligning Large Language Models with Demonstrations Only
COLM 2025
Poster
7.0
3
Ask a Strong LLM Judge when Your Reward Model is Uncertain
NeurIPS 2025
Poster
合作者 (18)
HJ
Haoming Jiang
2 篇
IH
Ilgee Hong
2 篇
LQ
Liang Qiu
2 篇
QZ
Qingru Zhang
2 篇
TZ
Tuo Zhao
2 篇
ZX
Zhenghao Xu
2 篇
BY
Bing Yin
1 篇
CZ
Chao Zhang
1 篇
查看全部 18 位合作者