影响力指数

48.39/100

前 9.4%

全站排名 #6,022

发表论文6 篇

平均评分5.9

年均产出2.0 篇/年

Tinghao Xie

PhD student@Princeton University·美国·OpenReview

研究方向

Trustworthy Machine Learning · Artificial Intelligence Security · Adversarial Machine Learning

Red-Teaming NSFW Image Classifiers as Text-to-Image Safeguards

ICLR 2026Withdrawn

SORRY-Bench: Systematically Evaluating Large Language Model Safety Refusal

ICLR 2025Poster

On Evaluating the Durability of Safeguards for Open-Weight LLMs

ICLR 2025Poster

Fantastic Copyrighted Beasts and How (Not) to Generate Them

ICLR 2025Poster

合作者 (20)

博士导师5 篇

Peter Henderson