影响力指数

84.97/100

前 0.9%

全站排名 #602

发表论文38 篇

平均评分5.2

年均产出12.7 篇/年

Zuxuan Wu

Associate Professor@Fudan University·中国·OpenReview

研究方向

video generation · conditional computation · action recognition · video classification

AgentGym-RL: An Open-Source Framework to Train LLM Agents for Long-Horizon Decision Making via Multi-Turn RL

VTBench: Comprehensive Benchmark Suite Towards Real-World Virtual Try-on Models

ICLR 2026Rejected

PreferThinker: Reasoning-based Personalized Image Preference Assessment

ICLR 2026Poster

RoboOmni: Proactive Robot Manipulation in Omni-modal Context

ICLR 2026Poster

Efficient-LVSM: Faster, Cheaper, and Better Large View Synthesis Model via Decoupled Co-Refinement Attention

ICLR 2026Poster

CameraNoise: Learning Precise Camera Control with Video Diffusion in Noise Space

ICLR 2026Rejected

UniHand: A Unified Model for Diverse Controlled 4D Hand Motion Modeling

ICLR 2026Poster

ViaRL: Adaptive Temporal Grounding via Visual Iterated Amplification Reinforcement Learning

ICLR 2026Rejected

TrajTok: What makes for a good trajectory tokenizer in behavior generation?

ICLR 2026Poster

HiMoE-VLA: Hierarchical Mixture-of-Experts for Generalist Vision–Language–Action Policies

ICLR 2026Rejected

CreatiDesign: A Unified Multi-Conditional Diffusion Transformer for Creative Graphic Design

ICLR 2026Poster

Daily-Omni: Towards Audio-Visual Reasoning with Temporal Alignment across Modalities

ICLR 2026Rejected

Unleashing 2D Rewards for Human Preference Aligned Text-to-3D Generation via Preference Score Distillation

ICLR 2026Rejected

CaTok: Taming Mean Flows for One-Dimensional Causal Image Tokenization

ICLR 2026Withdrawn

FlashPlanner: Accelerating Diffusion-based Planner for Autonomous Driving via Globally Consistent Velocity Field and Redundancy Reduction

ICLR 2026Withdrawn

PointARSim: Point-cloud–enhanced Generative Auto-Regressive Simulation for Closed-loop End-to-end Autonomous Driving Evaluation

ICLR 2026Rejected

ReGen4AD: Retrieval Based Online Video Generation for Reactive Autonomous Driving Simulation

ICLR 2026Withdrawn

CoSMo-RL: Towards Trustworthy LMRMs via Joint Safety and Stability

ICLR 2026Rejected

ZTRS: Zero-Imitation End-to-end Autonomous Driving with Trajectory Scoring

ICLR 2026Withdrawn

Compositional Text-to-Image Generation Via Region-aware Bimodal Direct Preference Optimization

ICLR 2026Withdrawn

FreezeVLA: Action-Freezing Attacks against Vision-Language-Action Models

ICLR 2026Withdrawn

OmniGen-AR: AutoRegressive Any-to-Image Generation

NeurIPS 2025Poster

Adaptive Retention & Correction: Test-Time Training for Continual Learning

ICLR 2025Poster

Seg2Any: Open-set Segmentation-Mask-to-Image Generation with Precise Shape and Semantic Control

NeurIPS 2025Poster

ForgerySleuth: Empowering Multimodal Large Language Models for Image Manipulation Detection

NeurIPS 2025Poster

UniGen: Enhanced Training & Test-Time Strategies for Unified Multimodal Understanding and Generation

NeurIPS 2025Poster

AgentGym: Evaluating and Evolving Large Language Model-based Agents across Diverse Envronments

ICLR 2025Rejected

INST-IT: Boosting Instance Understanding via Explicit Visual Prompt Instruction Tuning

NeurIPS 2025Poster

BlockDance: Reuse Structurally Similar Spatio-Temporal Features to Accelerate Diffusion Transformers

ICLR 2025Withdrawn

Hydra-MDP++: Advancing End-to-End Driving via Hydra-Distillation with Expert-Guided Decision Analysis

ICLR 2025Withdrawn

TinyMem: Condensing Multimodal Memory for Long-form Video Action Detection

ICLR 2025Withdrawn

GeoGS3D: Single-view 3D Reconstruction via Geometric-aware Diffusion Model and Gaussian Splatting

ICLR 2025Withdrawn

合作者 (20)