Paper
Hub
搜索
Toggle language
Juan J Vazquez
~Juan_J_Vazquez1
2
论文总数
2.0
年均投稿
4.1
平均评分
接收情况
0
/
2
会议分布
ICLR
2
发表论文 (2 篇)
2025
2 篇
3.2
6
Evaluating Oversight Robustness with Incentivized Reward Hacking
ICLR 2025
withdrawn
5.0
4
Steering Language Models with Activation Engineering
ICLR 2025
Rejected
合作者 (9)
AT
Alexander Matt Turner
1 篇
DU
David Udell
1 篇
GL
Gavin Leech
1 篇
LT
Lisa Thiergart
1 篇
MM
Monte MacDiarmid
1 篇
UM
Ulisse Mini
1 篇
JM
Julian Michael
1 篇
MF
McKenna Fitzgerald
1 篇
查看全部 9 位合作者