影响力指数

37.47/100

前 16.4%

全站排名 #10,540

发表论文4 篇

平均评分6.1

年均产出1.3 篇/年

Juntao Dai

PhD student@Zhejiang University·中国·OpenReview

研究方向

Reinforcement Learning

Debate with Image: Detecting Deceptive Behaviors in Multimodal Large Language Models

ICLR 2026Rejected

Safe RLHF-V: Safe Reinforcement Learning from Multi-modal Human Feedback

NeurIPS 2025Poster

Mitigating Reward Over-Optimization in RLHF via Behavior-Supported Regularization

ICLR 2025Poster

合作者 (20)