影响力指数
论文质量、代表作、近期表现、广度与样本量置信度综合计算
-/100
发表论文2 篇
平均评分
年均产出2.0 篇/年
AI 学术分析
Rémi Munos
研究方向
RLHF · large language models · deep reinforcement learning · bandit theory · reinforcement learning
RLHF · large language models · deep reinforcement learning · bandit theory · reinforcement learning