Paper
Hub
搜索
Toggle language
Boyi Wei
~Boyi_Wei2
2
论文总数
2.0
年均投稿
6.6
平均评分
接收情况
2
/
2
会议分布
ICLR
2
发表论文 (2 篇)
2025
2 篇
6.5
4
On Evaluating the Durability of Safeguards for Open-Weight LLMs
ICLR 2025
Poster
6.8
4
SORRY-Bench: Systematically Evaluating Large Language Model Safety Refusal
ICLR 2025
Poster
合作者 (18)
LH
Luxi He
2 篇
PH
Peter Henderson
2 篇
PM
Prateek Mittal
2 篇
TX
Tinghao Xie
2 篇
XQ
Xiangyu Qi
2 篇
YH
Yangsibo Huang
2 篇
MJ
Matthew Jagielski
1 篇
MN
Milad Nasr
1 篇
查看全部 18 位合作者