影响力指数

36.97/100

前 16.8%

全站排名 #10,843

发表论文7 篇

平均评分5.4

年均产出3.5 篇/年

Yuexiang Zhai

PhD student@University of California, Berkeley·美国·OpenReview

研究方向

Multimodal Language Models · Reinforcement Learning · Machine Learning

LMRL Gym: Benchmarks for Multi-Turn Reinforcement Learning with Language Models

ICML 2025Poster

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

ICML 2025Poster

LMRL Gym: Benchmarks for Multi-Turn Reinforcement Learning with Language Models

ICLR 2025Rejected

Is Offline Decision Making Possible with Only Few Samples? Reliable Decisions in Data-Starved Bandits via Trust Region Enhancement

ICLR 2025Withdrawn

RLIF: Interactive Imitation Learning as Reinforcement Learning

ICLR 2024Poster

Fine-Tuning Large Vision-Language Models as Decision-Making Agents via Reinforcement Learning

NeurIPS 2024Poster

LMRL Gym: Benchmarks for Multi-Turn Reinforcement Learning with Language Models

ICLR 2024Rejected

合作者 (20)

博士导师6 篇

Charlie Victor Snell

博士导师3 篇