影响力指数

-/100

发表论文2 篇

平均评分3.8

年均产出2.0 篇/年

Rémi Munos

Researcher@Meta·法国·OpenReview

研究方向

RLHF · large language models · deep reinforcement learning · bandit theory · reinforcement learning

Positional Encoding via Token-Aware Phase Attention

ICLR 2026Rejected

Outcome-based Exploration for LLM Reasoning

ICLR 2026Rejected

合作者 (6)