影响力指数

80.27/100

前 1.4%

全站排名 #874

发表论文22 篇

平均评分5.9

年均产出7.3 篇/年

Zejun MA

Principal Researcher@TikTok·新加坡·OpenReview

研究方向

deep learning · speech recognition · natural language processing · reinforcement learning

7.0

SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrated Reasoning

ICLR 2026Poster

4.0

video-SALMONN S: Streaming Audio-Visual LLMs Beyond Length Limits via Memory

ICLR 2026Rejected

4.0

video-SALMONN 2: Caption-Enhanced Audio-Visual Large Language Models

ICLR 2026Rejected

4.0

SWE-Perf: Can Language Models Optimize Code Performance on Real-World Repositories?

ICLR 2026Rejected

通讯

3.5

First return, entropy-eliciting explore

ICLR 2026Rejected

通讯

8.2

Robust SuperAlignment: Weak-to-Strong Robustness Generalization for Vision-Language Models

NeurIPS 2025Spotlight

7.3

LLaVA-Interleave: Tackling Multi-image, Video, and 3D in Large Multimodal Models

ICLR 2025Spotlight

7.3

Afterburner: Reinforcement Learning Facilitates Self-Improving Code Efficiency Optimization

NeurIPS 2025Poster

7.3

SimpleRL-Zoo: Investigating and Taming Zero Reinforcement Learning for Open Base Models in the Wild

COLM 2025Poster

7.1

VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

NeurIPS 2025Poster

6.8

Enhancing Multimodal LLM for Detailed and Accurate Video Captioning using Multi-Round Preference Optimization

合作者 (20)

Zejun MA

SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrated Reasoning

video-SALMONN S: Streaming Audio-Visual LLMs Beyond Length Limits via Memory

video-SALMONN 2: Caption-Enhanced Audio-Visual Large Language Models

SWE-Perf: Can Language Models Optimize Code Performance on Real-World Repositories?

First return, entropy-eliciting explore

Robust SuperAlignment: Weak-to-Strong Robustness Generalization for Vision-Language Models

LLaVA-Interleave: Tackling Multi-image, Video, and 3D in Large Multimodal Models

Afterburner: Reinforcement Learning Facilitates Self-Improving Code Efficiency Optimization

SimpleRL-Zoo: Investigating and Taming Zero Reinforcement Learning for Open Base Models in the Wild

VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

ZeCO: Zero-Communication Overhead Sequence Parallelism for Linear Attention

General-Reasoner: Advancing LLM Reasoning Across All Domains

Improving LLM Video Understanding with 16 Frames Per Second

video-SALMONN-o1: Reasoning-enhanced Audio-visual Large Language Model

Video Instruction Tuning with Synthetic Data

Enhancing Multimodal LLM for Detailed and Accurate Video Captioning using Multi-Round Preference Optimization