Paper
Hub
搜索
Toggle language
Jing-Jing Li
~Jing-Jing_Li1
2
论文总数
2.0
年均投稿
4.4
平均评分
接收情况
1
/
2
会议分布
ICLR
1
ICML
1
发表论文 (2 篇)
2025
2 篇
3.3
3
SafetyAnalyst: Interpretable, transparent, and steerable LLM safety moderation
ICLR 2025
Rejected
5.5
4
SafetyAnalyst: Interpretable, Transparent, and Steerable Safety Moderation for AI Behavior
ICML 2025
Poster
合作者 (9)
AC
Anne Collins
2 篇
JB
Jana Schaich Borg
2 篇
LJ
Liwei Jiang
2 篇
MS
Maarten Sap
2 篇
MK
Max Kleiman-Weiner
2 篇
ND
Nouha Dziri
2 篇
SL
Sydney Levine
2 篇
VP
Valentina Pyatkin
2 篇
查看全部 9 位合作者