影响力指数

60.74/100

前 4.7%

全站排名 #3,000

发表论文9 篇

平均评分5.9

年均产出3.0 篇/年

Huazheng Wang

Assistant Professor@Oregon State University·美国·OpenReview

研究方向

information retrieval · reinforcement learning · large language models · multi-armed bandits

Importance Sampling Optimization Improves Online Preference Learning

ICLR 2026Rejected

Design-Based Bandits Under Network Interference: Trade-Off Between Regret and Statistical Inference

NeurIPS 2025Poster

Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems

ICML 2025Spotlight

Provably Efficient Algorithm for Best Scoring Rule Identification in Online Principal-Agent Information Acquisition

ICML 2025Poster

A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement

ICLR 2025Poster

合作者 (20)

博后导师3 篇

PhD Advisee2 篇