$\boldsymbol{\mu}\mathbf{P^2}$: Effective Sharpness Aware Minimization Requires Layerwise Perturbation Scaling | PaperHub

学术助手数据洞察排行榜搜索

© 2026 PaperHub·数据来源: OpenReview

仅供学术研究参考，版权归原作者所有