Paper
Hub
搜索
Toggle language
Nina Rimsky
~Nina_Rimsky1
2
论文总数
2.0
年均投稿
6.5
平均评分
接收情况
2
/
2
会议分布
NeurIPS
2
发表论文 (2 篇)
2024
2 篇
6.4
5
Many-shot Jailbreaking
NeurIPS 2024
Poster
6.5
4
Refusal in Language Models Is Mediated by a Single Direction
NeurIPS 2024
Poster
合作者 (20)
AT
Alex Tamkin
1 篇
AR
Ansh Radhakrishnan
1 篇
CD
Carson Denison
1 篇
CA
Cem Anil
1 篇
DF
Daniel J Ford
1 篇
DD
David Duvenaud
1 篇
DG
Deep Ganguli
1 篇
ED
Esin DURMUS
1 篇
查看全部 20 位合作者