影响力指数

96.68/100

前 0.2%

全站排名 #108

发表论文71 篇

平均评分5.3

年均产出23.7 篇/年

Ping Luo

Associate Professor@The University of Hong Kong·中国香港·OpenReview

研究方向

Computer Vision · Deep Learning · deep learning

Fast-dLLM: Training-free Acceleration of Diffusion LLM by Enabling KV Cache and Parallel Decoding

ICLR 2026Poster

AutoBio: A Simulation and Benchmark for Robotic Automation in Digital Biology Laboratory

ICLR 2026Poster

SANA-Video: Efficient Video Generation with Block Linear Diffusion Transformer

Fast-dLLM v2: Efficient Block-Diffusion LLM

ICLR 2026Poster

RoboTwin 2.0: A Scalable Data Generator and Benchmark with Strong Domain Randomization for Robust Bimanual Robotic Manipulation

ICLR 2026Rejected

CLAP: Unsupervised 3D Representation Learning for Fusion 3D Perception via Curvature Sampling and Prototype Learning

ICLR 2026Poster

Scaling Law for Quantization-Aware Training

ICLR 2026Rejected

Discrete Diffusion VLA: Bringing Discrete Diffusion to Action Decoding in Vision-Language-Action Policies

ICLR 2026Rejected

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

ICLR 2026Poster

From Denoising to Refining: A Corrective Framework for Vision-Language Diffusion Model

ICLR 2026Rejected

Dynamic Mixture of Progressive Parameter-Efficient Expert Library for Lifelong Robot Learning

ICLR 2026Rejected

LINA: Exploring Linear Autoregressive Image Generative Models with Continuous Tokens

ICLR 2026Rejected

Aligning Latent Spaces with Flow Priors

ICLR 2026Rejected

MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision

ICLR 2026Withdrawn

DriveE2E: Closed-Loop Benchmark for End-to-End Autonomous Driving through Real-to-Simulation

ICLR 2026Rejected

MM-Eureka: Exploring the Frontiers of Multimodal Reasoning with Rule-based Reinforcement Learning

ICLR 2026Withdrawn

Agent2World: A Unified LLM-based Multi-Agent Framework for Symbolic World-Model Generation

ICLR 2026Rejected

Truly Assessing Fluid Intelligence of Large Language Models through Dynamic Reasoning Evaluation

ICLR 2026Rejected

SWIRL: A Staged Workflow for Interleaved Reinforcement Learning in Mobile GUI Control

ICLR 2026Rejected

PhyX: Does Your Model Have the "Wits" for Physical Reasoning?

ICLR 2026Withdrawn

Object-AVEdit: An Object-level Audio-Visual Editing Model

ICLR 2026Rejected

INT v.s. FP: A Comprehensive Study of Fine-Grained Low-bit Quantization Formats

ICLR 2026Withdrawn

TREND: Unsupervised 3D Representation Learning via Temporal Forecasting for LiDAR Perception

NeurIPS 2025Spotlight

OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation

NeurIPS 2025Poster

Dynamic Multimodal Evaluation with Flexible Complexity by Vision-Language Bootstrapping

BOOD: Boundary-based Out-Of-Distribution Data Generation

ICML 2025Poster

OWMM-Agent: Open World Mobile Manipulation With Multi-modal Agentic Data Synthesis

NeurIPS 2025Poster

FUDOKI: Discrete Flow-based Unified Understanding and Generation via Kinetic-Optimal Velocities

NeurIPS 2025Spotlight

Towards World Simulator: Crafting Physical Commonsense-Based Benchmark for Video Generation

ICML 2025Poster

IDA-VLM: Towards Movie Understanding via ID-Aware Large Vision-Language Model

ICLR 2025Poster

WorldWeaver: Generating Long-Horizon Video Worlds via Rich Perception

NeurIPS 2025Poster

SAMRefiner: Taming Segment Anything Model for Universal Mask Refinement

ICLR 2025Poster

LLaMA Decoder As Vision Transformer

ICLR 2025Rejected

MMIU: Multimodal Multi-image Understanding for Evaluating Large Vision-Language Models

ICLR 2025Poster

BOOD: Boundary-based Out-Of-Distribution Data Generation

ICLR 2025Rejected

CompGS: Unleashing 2D Compositionality for Compositional Text-to-3D via Dynamically Optimizing 3D Gaussians

ICLR 2025Withdrawn

Towards World Simulator: Crafting Physical Commonsense-Based Benchmark for Video Generation

ICLR 2025Rejected

An Empirical Study of Multiple Masking in Masked Autoencoder

ICLR 2025Withdrawn

Diffree: Text-Guided Shape Free Object Inpainting with Diffusion Model

ICLR 2025Rejected

HRVMamba: High-Resolution Visual State Space Model for Dense Prediction

ICLR 2025Withdrawn

Task-Oriented Diffusion Inversion for High-Fidelity Text-based Editing

ICLR 2025Withdrawn

DriveE2E: Benchmarking Closed-Loop End-to-End Autonomous Driving Based-on Real-World Traffic Scenarios

ICLR 2025Withdrawn

MatchMask: Mask-Centric Generative Data Augmentation for Label-Scarce Semantic Segmentation

ICLR 2025Withdrawn

PrefixQuant: Static Quantization Beats Dynamic through Prefixed Outliers in LLMs

ICLR 2025Rejected

EfficientQAT: Efficient Quantization-Aware Training for Large Language Models

ICLR 2025Rejected

合作者 (20)