影响力指数
论文质量、代表作、近期表现、广度与样本量置信度综合计算
-/100
发表论文3 篇
平均评分
年均产出3.0 篇/年
AI 学术分析
Haoyun Deng
研究方向
large language models · inference optimization · efficient serving · speculative decoding · prefill–decoding disaggregation · prefix cache · kv cache · quantization · pruning · model compression · low-bit inference · scheduling · memory optimization · distributed inference systems · inference frameworks · Triton · TensorRT-LLM · vLLM · serving infrastructure