Paper
Hub
搜索
Toggle language
Xander Davies
~Xander_Davies1
3
论文总数
1.5
年均投稿
6.8
平均评分
接收情况
2
/
3
会议分布
ICLR
2
NeurIPS
1
发表论文 (3 篇)
2025
2 篇
6.8
4
Fundamental Limitations in Pointwise Defences of LLM Finetuning APIs
NeurIPS 2025
Poster
6.8
4
AgentHarm: A Benchmark for Measuring Harmfulness of LLM Agents
ICLR 2025
Poster
2024
1 篇
-
Delayed Generalization: Bridging Double Descent and Grokking
ICLR 2024
withdrawn
合作者 (18)
AS
Alexandra Souly
2 篇
YG
Yarin Gal
2 篇
AZ
Andy Zou
1 篇
DH
Dan Hendrycks
1 篇
DD
Derek Duenas
1 篇
JK
J Zico Kolter
1 篇
JW
Justin Wang
1 篇
MA
Maksym Andriushchenko
1 篇
查看全部 18 位合作者