影响力指数

94.31/100

前 0.3%

全站排名 #198

发表论文47 篇

平均评分5.1

年均产出15.7 篇/年

Yu-Gang Jiang

Full Professor@Fudan University·中国·OpenReview

研究方向

Video Analytics · Multimodal Analysis

AgentGym-RL: An Open-Source Framework to Train LLM Agents for Long-Horizon Decision Making via Multi-Turn RL

WithAnyone: Toward Controllable and ID Consistent Image Generation

ICLR 2026Poster

Visual Multi-Agent System: Mitigating Hallucination Snowballing via Visual Flow

ICLR 2026Poster

RoboOmni: Proactive Robot Manipulation in Omni-modal Context

ICLR 2026Poster

RedTopic: Toward Topic-Diverse Red Teaming of Large Language Models

ICLR 2026Rejected

Efficient-LVSM: Faster, Cheaper, and Better Large View Synthesis Model via Decoupled Co-Refinement Attention

ICLR 2026Poster

TrajTok: What makes for a good trajectory tokenizer in behavior generation?

ICLR 2026Poster

EgoNight: Towards Egocentric Vision Understanding at Night with a Challenging Benchmark

ICLR 2026Poster

CreatiDesign: A Unified Multi-Conditional Diffusion Transformer for Creative Graphic Design

ICLR 2026Poster

HiMoE-VLA: Hierarchical Mixture-of-Experts for Generalist Vision–Language–Action Policies

ICLR 2026Rejected

Unleashing 2D Rewards for Human Preference Aligned Text-to-3D Generation via Preference Score Distillation

ICLR 2026Rejected

TriVLA: A Triple-System-Based Unified Vision-Language-Action Model with Episodic World Modeling for General Robot Control

ICLR 2026Withdrawn

WorldPM: Understanding Scaling Patterns in Human Preference Modeling

ICLR 2026Rejected

CaTok: Taming Mean Flows for One-Dimensional Causal Image Tokenization

ICLR 2026Withdrawn

FlashPlanner: Accelerating Diffusion-based Planner for Autonomous Driving via Globally Consistent Velocity Field and Redundancy Reduction

ICLR 2026Withdrawn

Unraveling Hallucination in Large Reasoning Models: A Topological Perspective

ICLR 2026Rejected

AgenticPA: Toward Automated and Large-Scale Prompt Attacks on LLMs

ICLR 2026Withdrawn

PointARSim: Point-cloud–enhanced Generative Auto-Regressive Simulation for Closed-loop End-to-end Autonomous Driving Evaluation

ICLR 2026Rejected

ReGen4AD: Retrieval Based Online Video Generation for Reactive Autonomous Driving Simulation

ICLR 2026Withdrawn

Mitigating Gaslighting by Relocating Text-induced Visual Attention Bias

ICLR 2026Withdrawn

CoSMo-RL: Towards Trustworthy LMRMs via Joint Safety and Stability

ICLR 2026Rejected

FreezeVLA: Action-Freezing Attacks against Vision-Language-Action Models

ICLR 2026Withdrawn

Model Utility Law: Evaluating LLMs beyond Performance via Mechanistically Interpretable Metric

ICLR 2026Rejected

OmniSVG: A Unified Scalable Vector Graphics Generation Model

NeurIPS 2025Poster

SAMA: Towards Multi-Turn Referential Grounded Video Chat with Large Language Models

NeurIPS 2025Poster

OmniGen-AR: AutoRegressive Any-to-Image Generation

NeurIPS 2025Poster

Adaptive Retention & Correction: Test-Time Training for Continual Learning

ICLR 2025Poster

TP-MDDN: Task-Preferenced Multi-Demand-Driven Navigation with Autonomous Decision-Making

NeurIPS 2025Poster

HumanoidGen: Data Generation for Bimanual Dexterous Manipulation via LLM Reasoning

NeurIPS 2025Poster

ForgerySleuth: Empowering Multimodal Large Language Models for Image Manipulation Detection

NeurIPS 2025Poster

Domain-RAG: Retrieval-Guided Compositional Image Generation for Cross-Domain Few-Shot Object Detection

NeurIPS 2025Poster

AgentGym: Evaluating and Evolving Large Language Model-based Agents across Diverse Envronments

ICLR 2025Rejected

BlueSuffix: Reinforced Blue Teaming for Vision-Language Models Against Jailbreak Attacks

ICLR 2025Poster

INST-IT: Boosting Instance Understanding via Explicit Visual Prompt Instruction Tuning

NeurIPS 2025Poster

BlockDance: Reuse Structurally Similar Spatio-Temporal Features to Accelerate Diffusion Transformers

ICLR 2025Withdrawn

Object Fusion via Diffusion Time-step for Customized Image Editing with Single Example

ICLR 2025Withdrawn

Identity Lock: Locking API Fine-tuned LLMs With Identity-based Wake Words

ICLR 2025Withdrawn

IDEATOR: Jailbreaking VLMs Using VLMs

ICLR 2025Withdrawn

Towards a Theoretical Understanding of Memorization in Diffusion Models

ICLR 2025Withdrawn

GeoGS3D: Single-view 3D Reconstruction via Geometric-aware Diffusion Model and Gaussian Splatting

ICLR 2025Withdrawn

合作者 (20)