Matthieu Geist

Principal Researcher@Earth Species Project·法国·OpenReview

研究方向

Reinforcement learning

5.0

Learning Equilibria from Data: Provably Efficient Multi-Agent Imitation Learning

NeurIPS 2025Poster

7.0

ShiQ: Bringing back Bellman to LLMs

NeurIPS 2025Poster

通讯

6.0

Self-Improving Robust Preference Optimization

ICLR 2025Poster

三作

5.0

Understanding Likelihood Over-optimisation in Direct Alignment Algorithms

ICLR 2025Rejected

3.2

Solving robust MDPs as a sequence of static RL problems

合作者 (20)

Matthieu Geist

AVEX: What Matters for Animal Vocalization Encoding

Solving robust MDPs as a sequence of static RL problems

Bootstrapping Expectiles in Robust Reinforcement Learning

FALCON-S: Fixed-wing Aerodynamics and Learning Control Suite

Rrls: Robust reinforcement learning suite

Learning Equilibria from Data: Provably Efficient Multi-Agent Imitation Learning

ShiQ: Bringing back Bellman to LLMs

Self-Improving Robust Preference Optimization

Understanding Likelihood Over-optimisation in Direct Alignment Algorithms

Solving robust MDPs as a sequence of static RL problems