影响力指数

51.35/100

前 7.9%

全站排名 #5,088

发表论文7 篇

平均评分6.2

年均产出3.5 篇/年

Jonathan Ragan-Kelley

Associate Professor@MIT·美国·OpenReview

研究方向

performance engineering · compilers · programming languages · domain-specific languages · GPUs · computer graphics

Learning to Keep a Promise: Scaling Language Model Decoding Parallelism with Learned Asynchronous Decoding

ICML 2025Poster

Ladder-Residual: Parallelism-Aware Architecture for Accelerating Large Model Inference with Communication Overlapping

ICML 2025Poster

Ladder Residual: Redefining Tensor Parallelism in Transformers for Accelerated Inference

ICLR 2025Rejected

Hydra: Sequentially-Dependent Draft Heads for Medusa Decoding

COLM 2024Poster

Reducing Transformer Key-Value Cache Size with Cross-Layer Attention

NeurIPS 2024Poster

The Cost of Scaling Down Large Language Models: Reducing Model Size Affects Memory before In-context Learning

ICLR 2024Poster

How to Guess a Gradient

ICLR 2024Withdrawn

合作者 (20)

William Brandon

PhD Advisee4 篇

Ben Athiwaratkun

Shuaiwen Leon Song