影响力指数

63.23/100

前 3.9%

全站排名 #2,530

发表论文10 篇

平均评分5.8

年均产出3.3 篇/年

Tiansheng Huang

PhD student@Georgia Institute of Technology·美国·OpenReview

研究方向

ML safety · Federated learning

TeZO: Empowering the Low-Rankness on the Temporal Dimension in the Zeroth-Order Optimization for Fine-tuning LLMs

ICLR 2026Rejected

Booster: Tackling Harmful Fine-tuning for Large Language Models via Attenuating Harmful Perturbation

Panacea: Mitigating Harmful Fine-tuning for Large Language Models via Post-fine-tuning Perturbation

NeurIPS 2025Poster

Antidote: Post-fine-tuning Safety Alignment for Large Language Models against Harmful Fine-tuning Attack

ICML 2025Poster

Probe before You Talk: Towards Black-box Defense against Backdoor Unalignment for Large Language Models

ICLR 2025Poster

PokéLLMon: A Grounding and Reasoning Benchmark for Large Language Models in Pokémon Battles

ICLR 2025Withdrawn

合作者 (20)

博士导师7 篇

Selim Furkan Tekin

Gautam Bhattacharya