Paper
Hub
搜索
Toggle language
Narutatsu Ri
~Narutatsu_Ri1
2
论文总数
1.0
年均投稿
5.3
平均评分
接收情况
1
/
2
会议分布
ICML
1
ICLR
1
发表论文 (2 篇)
2025
1 篇
4.9
4
Speak Easy: Eliciting Harmful Jailbreaks from LLMs with Simple Interactions
ICML 2025
Poster
2024
1 篇
5.7
3
Do Models Explain Themselves? Counterfactual Simulatability of Natural Language Explanations
ICLR 2024
Rejected
合作者 (10)
MG
Marzyeh Ghassemi
1 篇
YC
Yik Siu Chan
1 篇
YX
Yuxin Xiao
1 篇
CZ
Chen Zhao
1 篇
HH
He He
1 篇
JS
Jacob Steinhardt
1 篇
KM
Kathleen McKeown
1 篇
RZ
Ruiqi Zhong
1 篇
查看全部 10 位合作者