Paper
Hub
搜索
Toggle language
Alexandra Souly
~Alexandra_Souly1
2
论文总数
2.0
年均投稿
6.8
平均评分
接收情况
2
/
2
会议分布
ICLR
1
NeurIPS
1
发表论文 (2 篇)
2025
2 篇
6.8
4
AgentHarm: A Benchmark for Measuring Harmfulness of LLM Agents
ICLR 2025
Poster
6.8
4
Fundamental Limitations in Pointwise Defences of LLM Finetuning APIs
NeurIPS 2025
Poster
合作者 (15)
XD
Xander Davies
2 篇
YG
Yarin Gal
2 篇
AZ
Andy Zou
1 篇
DH
Dan Hendrycks
1 篇
DD
Derek Duenas
1 篇
JK
J Zico Kolter
1 篇
JW
Justin Wang
1 篇
MA
Maksym Andriushchenko
1 篇
查看全部 15 位合作者