Paper
Hub
搜索
Toggle language
Derek Duenas
~Derek_Duenas1
2
论文总数
1.0
年均投稿
6.6
平均评分
接收情况
2
/
2
会议分布
NeurIPS
1
ICLR
1
发表论文 (2 篇)
2025
1 篇
6.8
4
AgentHarm: A Benchmark for Measuring Harmfulness of LLM Agents
ICLR 2025
Poster
2024
1 篇
6.4
5
Improving Alignment and Robustness with Circuit Breakers
NeurIPS 2024
Poster
合作者 (12)
AZ
Andy Zou
2 篇
DH
Dan Hendrycks
2 篇
JK
J Zico Kolter
2 篇
JW
Justin Wang
2 篇
MA
Maksym Andriushchenko
2 篇
MF
Matt Fredrikson
2 篇
ML
Maxwell Lin
2 篇
AS
Alexandra Souly
1 篇
查看全部 12 位合作者