影响力指数

46.64/100

前 10%

全站排名 #6,469

发表论文9 篇

平均评分5.6

年均产出4.5 篇/年

Haoming Jiang

Researcher@OpenAI·美国·OpenReview

研究方向

deep learning · transformer · BERT · NLP · pretraining · adversarial learning · robust · sparse

Think-RM: Enabling Long-Horizon Reasoning in Generative Reward Models

NeurIPS 2025Poster

Ask a Strong LLM Judge when Your Reward Model is Uncertain

NeurIPS 2025Poster

RRO: LLM Agent Optimization Through Rising Reward Trajectories

COLM 2025Poster

Discriminative Finetuning of Generative Large Language Models without Reward Models and Human Preference Data

ICML 2025Poster

Self-Rewarding PPO: Aligning Large Language Models with Demonstrations Only

COLM 2025Poster

Inductive or Deductive? Rethinking the Fundamental Reasoning Abilities of LLMs

ICLR 2025Rejected

Two-Step Offline Preference-Based Reinforcement Learning with Constrained Actions

ICLR 2025Withdrawn

Robust Reinforcement Learning from Corrupted Human Feedback

NeurIPS 2024Poster

Adaptive Preference Scaling for Reinforcement Learning with Human Feedback

NeurIPS 2024Poster

合作者 (20)

博士导师6 篇