影响力指数

72.96/100

前 2.2%

全站排名 #1,398

发表论文15 篇

平均评分5.3

年均产出5.0 篇/年

Zhang-Wei Hong

PhD student@Massachusetts Institute of Technology·美国·OpenReview

研究方向

Reinforcement learning

7.0

A Reward-Free Viewpoint on Multi-Objective Reinforcement Learning

ICLR 2026Poster

6.0

BOAD: Discovering Hierarchical Software Engineering Agents via Bandit Optimization

ICLR 2026Poster

通讯

4.5

ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization

ICLR 2025Poster

二作

5.5

Satori: Reinforcement Learning with Chain-of-Action-Thought Enhances LLM Reasoning via Autoregressive Search

ICML 2025Poster

5.3

ReGen: Generative Robot Simulation via Inverse Design

ICLR 2025Poster

三作

4.8

ImageNet-RIB Benchmark: Large Pre-Training Datasets Don't Guarantee Robustness after Fine-Tuning

合作者 (20)

Zhang-Wei Hong

A Reward-Free Viewpoint on Multi-Objective Reinforcement Learning

BOAD: Discovering Hierarchical Software Engineering Agents via Bandit Optimization

Composition-Grounded Data Synthesis for Visual Reasoning

EvoScale: Evolutionary Test-Time Scaling for Software Engineering

Tailored Primitive Initialization is the Secret Key to Reinforcement Learning

Large Pretraining Datasets Don't Guarantee Robustness after Fine-Tuning

GPTOpt: Towards Efficient LLM-based Black-Box Optimization

RL Tango: Reinforcing Generator and Verifier Together for Language Reasoning

ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization

Satori: Reinforcement Learning with Chain-of-Action-Thought Enhances LLM Reasoning via Autoregressive Search

ReGen: Generative Robot Simulation via Inverse Design

ImageNet-RIB Benchmark: Large Pre-Training Datasets Don't Guarantee Robustness after Fine-Tuning