影响力指数

51.82/100

前 7.7%

全站排名 #4,936

发表论文6 篇

平均评分5.8

年均产出2.0 篇/年

Chris Cundy

Researcher@FAR AI·美国·OpenReview

研究方向

Generative Models · Normalizing Flows · Language Modelling · Reinforcement Learning · Gaussian Processes · Deep Learning

No, of Course I Can! Deeper Fine-Tuning Attacks That Bypass Token-Level Safety Mechanisms

ICLR 2026Poster

Preference Learning with Lie Detectors can Induce Honesty or Evasion

NeurIPS 2025Poster

No, of Course I Can! Deeper Fine-Tuning Attacks That Bypass Token-Level Safety Mechanisms

NeurIPS 2025Rejected

Sharpe Ratio-Guided Active Learning for Preference Optimization in RLHF

COLM 2025Poster

Planning in a recurrent neural network that plays Sokoban

ICLR 2025Rejected

合作者 (18)

博士导师2 篇

Krishnamurthy Dj Dvijotham