影响力指数

98.59/100

前 0.1%

全站排名 #36

发表论文92 篇

平均评分5.5

年均产出30.7 篇/年

Jianye HAO

Full Professor@Tianjin University·中国·OpenReview

研究方向

Reinforcement Learning · Multiagent Systems

ViMo: A Generative Visual GUI World Model for App Agents

ICLR 2026Poster

Squeeze the Soaked Sponge: Efficient Off-policy RFT for Large Language Model

ICLR 2026Poster

From Seeing to Doing: Bridging Reasoning and Decision for Robotic Manipulation

ICLR 2026Poster

Embodied-R1: Reinforced Embodied Reasoning for General Robotic Manipulation

ICLR 2026Poster

One Demo Is All It Takes: Planning Domain Derivation with LLMs from A Single Demonstration

ICLR 2026Poster

$Re^{2}$: Unlocking LLM Reasoning via Reinforcement Learning with Re-solving

ICLR 2026Poster

A Hierarchical Circuit Symbolic Discovery Framework for Efficient Logic Optimization

ICLR 2026Poster

Following the Navigation: Enhancing Small Language Models Contextual Reasoning with LLM Guidance

ICLR 2026Poster

Evolving Graph Structured Programs for Circuit Generation with Large Language Models

ICLR 2026Poster

UniUGG: Unified 3D Understanding and Generation via Geometric-Semantic Encoding

ICLR 2026Poster

Boosting Multi-Domain Reasoning of LLMs via Curvature-Guided Policy Optimization

ICLR 2026Poster

Latent-Guided Reasoning: Empowering Small LLMs with Large-Model Thinking

ICLR 2026Poster

EmbodiedMAE: A Unified 3D Multi-Modal Representation for Robot Manipulation

ICLR 2026Rejected

The Rank and Gradient Lost in Non-stationarity: Sample Weight Decay for Mitigating Plasticity Loss in Reinforcement Learning

ICLR 2026Poster

Preference Optimization via Key-step Error Exploration for Multi-step Reasoning in LLMs

ICLR 2026Desk Rejected

EVLP: Learning Unified Embodied Vision-Language Planner with Reinforced Supervised Fine-Tuning

ICLR 2026Poster

OmniEVA: Embodied Versatile Planner via Task-Adaptive 3D-Grounded and Embodiment-aware Reasoning

ICLR 2026Poster

Scalable In-Context Q-Learning

ICLR 2026Poster

OptiVer: Unleashing the Power of LLMs for Optimization Modeling via Dual-Side Verification

ICLR 2026Rejected

Learning A Linear Delay Surrogate Model for Timing-Driven Chip Global Placement

ICLR 2026Rejected

Don't Guess the Future, Find the Bottleneck: Spectral Subgoals for Offline Goal-Conditioned RL

ICLR 2026Desk Rejected

CAPO: Conflict-Aware Policy Optimization for Large Language Models

ICLR 2026Rejected

K²-Agent: Co-Evolving Know-What and Know-How for Hierarchical Mobile Device Control

ICLR 2026Poster

Hi-Agent: Hierarchical Vision-Language Agents for Mobile Device Control

ICLR 2026Withdrawn

CSO: Refining Robotic Policies via Skill Distribution Alignment and Skill-Grained Optimization

ICLR 2026Rejected

Plan2Evolve: LLM Self-Evolution for Improved Planning Capability via Automated Domain Generation

ICLR 2026Rejected

CellAgent: LLM-Driven Multi-Agent Framework for Natural Language-Based Single-Cell Analysis

ICLR 2026Poster

Why Attention Patterns Exist: A Unifying Temporal Perspective Analysis

ICLR 2026Poster

Omni-Thinker: Scaling Multi-Task RL in LLMs with Hybrid Reward and Task Scheduling

ICLR 2026Rejected

SteadyThought: Mitigating LLM Under-Thinking via Thought-Level Preference Optimization

ICLR 2026Rejected

Evolving LLMs' Self-Refinement Capability via Synergistic Training-Inference Optimization

ICLR 2026Withdrawn

BEYOND SYNTAX: ACTION SEMANTICS LEARNING FOR APP AGENTS

ICLR 2026Withdrawn

Probing Confidence Regions for Early Exits in Chain-of-Thought

ICLR 2026Rejected

Enhancing the Medical Context-Awareness Ability of LLMs via Multifaceted Self-Refinement Learning

ICLR 2026Rejected

Advancing Autonomous VLM Agents via Variational Subgoal-Conditioned Reinforcement Learning

ICLR 2026Withdrawn

LogicTree: Improving Complex Reasoning of LLMs via Instantiated Multi-step Synthetic Logical Data

NeurIPS 2025Spotlight

Conditioning Matters: Training Diffusion Policies is Faster Than You Think

NeurIPS 2025Poster

High-Performance Arithmetic Circuit Optimization via Differentiable Architecture Search

NeurIPS 2025Spotlight

Lightweight Neural App Control

ICLR 2025Spotlight

LaMPlace: Learning to Optimize Cross-Stage Metrics in Macro Placement

SPA-BENCH: A COMPREHENSIVE BENCHMARK FOR SMARTPHONE AGENT EVALUATION

ICLR 2025Spotlight

Succeed or Learn Slowly: Sample Efficient Off-Policy Reinforcement Learning for Mobile App Control

NeurIPS 2025Poster

Differentiable Integer Linear Programming

ICLR 2025Spotlight

MODULI: Unlocking Preference Generalization via Diffusion Models for Offline Multi-Objective Reinforcement Learning

ICML 2025Poster

STAR: Learning Diverse Robot Skill Abstractions through Rotation-Augmented Vector Quantization

ICML 2025Spotlight

COLA: Towards Efficient Multi-Objective Reinforcement Learning with Conflict Objective Regularization in Latent Space

NeurIPS 2025Poster

Dynamic Configuration for Cutting Plane Separators via Reinforcement Learning on Incremental Graph

NeurIPS 2025Poster

Uncertainty-quantified Rollout Policy Adaptation for Unlabelled Cross-domain Video Temporal Grounding

NeurIPS 2025Poster

Accurate KV Cache Eviction via Anchor Direction Projection for Efficient LLM Inference

NeurIPS 2025Poster

DistRL: An Asynchronous Distributed Reinforcement Learning Framework for On-Device Control Agent

ICLR 2025Poster

A Graph Enhanced Symbolic Discovery Framework For Efficient Logic Optimization

ICLR 2025Poster

Computing Circuits Optimization via Model-Based Circuit Genetic Evolution

ICLR 2025Poster

CORE: Collaborative Optimization with Reinforcement Learning and Evolutionary Algorithm for Floorplanning

NeurIPS 2025Poster

LaRes: Evolutionary Reinforcement Learning with LLM-based Adaptive Reward Search

NeurIPS 2025Poster

OptiTree: Hierarchical Thoughts Generation with Tree Search for LLM Optimization Modeling

NeurIPS 2025Poster

AttentionPredictor: Temporal Patterns Matter for KV Cache Compression

NeurIPS 2025Poster

Apollo-MILP: An Alternating Prediction-Correction Neural Solving Framework for Mixed-Integer Linear Programming

ICLR 2025Poster

Accelerating Large Language Model Reasoning via Speculative Search

ICML 2025Poster

HyperTree Planning: Enhancing LLM Reasoning via Hierarchical Thinking

ICML 2025Poster

3D-AffordanceLLM: Harnessing Large Language Models for Open-Vocabulary Affordance Detection in 3D Worlds

ICLR 2025Poster

R*: Efficient Reward Design via Reward Structure Evolution and Parameter Alignment Optimization with Large Language Models

ICML 2025Poster

Reinforced In-Context Black-Box Optimization

ICLR 2025Rejected

Trajectory World Models for Heterogeneous Environments

ICML 2025Poster

Boosting Multi-Domain Fine-Tuning of Large Language Models through Evolving Interactions between Samples

ICML 2025Poster

The Graph's Apprentice: Teaching an LLM Low-Level Knowledge for Circuit Quality Estimation

ICLR 2025Rejected

ET-Plan-Bench: Embodied Task-level Planning Benchmark Towards Spatial-Temporal Cognition with Foundation Models

ICLR 2025Rejected

SeaDAG: Semi-autoregressive Diffusion for Conditional Directed Acyclic Graph Generation

ICLR 2025Withdrawn

Can Symbolic Regression of Boolean Functions Boost Logic Synthesis?

ICLR 2025Withdrawn

Towards LLM4Floorplan: Agents Can Do What Engineers Do in Chip Design

ICLR 2025Withdrawn

Benchmarking End-To-End Performance of AI-Based Chip Placement Algorithms

ICLR 2025Withdrawn

A Theory of Multi-Agent Generative Flow Networks

ICLR 2025Rejected

Actra: Optimized Transformer Architecture for Vision-Language-Action Models in Robot Learning

ICLR 2025Withdrawn

Searching Strengthens Large Language Models in Finding Bugs of Deep Learning Libraries

ICLR 2025Withdrawn

LLM4Solver: Large Language Model for Efficient Algorithm Design of Combinatorial Optimization Solver

ICLR 2025Withdrawn

合作者 (20)

合作者19 篇