影响力指数

68.12/100

前 2.9%

全站排名 #1,897

发表论文14 篇

平均评分5.4

年均产出4.7 篇/年

Siyuan Liang

Researcher@Nanyang Technological University·新加坡·OpenReview

研究方向

adversarial attack · deep learning

4.0

Beacon: Thwarting Backdoor Attacks in Cross-Domain Federated Fine-Tuning via Gradient Behavior Decoupling

ICLR 2026Withdrawn

通讯

3.3

RobustIT: Adapter-Centric and Attack-Agnostic Anti-Backdoor Instruction Tuning

ICLR 2026Withdrawn

二作

3.0

Auditing Test Data Contamination with Error Rate Control for Reliable LLM Evaluation

ICLR 2026Withdrawn

三作

7.8

Detoxifying Large Language Models via Autoregressive Reward Guided Representation Editing

NeurIPS 2025Poster

三作

6.8

NoVo: Norm Voting off Hallucinations with Attention Heads in Large Language Models

ICLR 2025Poster

二作

4.3

CleanerCLIP: Fine-grained Counterfactual Semantic Augmentation for Backdoor Defense in Contrastive Learning

ICLR 2025Withdrawn

二作

3.5

No Access, No Safety: Free Lunch Adversarial Attacks on Black-box NLP Models

合作者 (20)

Siyuan Liang

Beacon: Thwarting Backdoor Attacks in Cross-Domain Federated Fine-Tuning via Gradient Behavior Decoupling

RobustIT: Adapter-Centric and Attack-Agnostic Anti-Backdoor Instruction Tuning

Auditing Test Data Contamination with Error Rate Control for Reliable LLM Evaluation

Detoxifying Large Language Models via Autoregressive Reward Guided Representation Editing

T2V-OptJail: Discrete Prompt Optimization for Text-to-Video Jailbreak Attacks

Lie Detector: Unified Backdoor Detection via Cross-Examination Framework

ICLShield: Exploring and Mitigating In-Context Learning Backdoor Attacks

NoVo: Norm Voting off Hallucinations with Attention Heads in Large Language Models

CleanerCLIP: Fine-grained Counterfactual Semantic Augmentation for Backdoor Defense in Contrastive Learning

No Access, No Safety: Free Lunch Adversarial Attacks on Black-box NLP Models