影响力指数

86.32/100

前 0.8%

全站排名 #535

发表论文19 篇

平均评分6.2

年均产出9.5 篇/年

Yangsibo Huang

Research Scientist@Google·美国·OpenReview

研究方向

Machine Learning Security · Privacy

Scaling Embedding Layers in Language Models

NeurIPS 2025Poster

Quantifying Cross-Modality Memorization in Vision-Language Models

NeurIPS 2025Poster

Crosslingual Capabilities and Knowledge Barriers in Multilingual Large Language Models

COLM 2025Poster

SORRY-Bench: Systematically Evaluating Large Language Model Safety Refusal

ICLR 2025Poster

On Evaluating the Durability of Safeguards for Open-Weight LLMs

ICLR 2025Poster

GMValuator: Similarity-based Data Valuation for Generative Models

ICLR 2025Poster

Unlearn and Burn: Adversarial Machine Unlearning Requests Destroy Model Accuracy

ICLR 2025Poster

Exploring and Mitigating Adversarial Manipulation of Voting-Based Leaderboards

MUSE: Machine Unlearning Six-Way Evaluation for Language Models

ICLR 2025Poster

MATH-Perturb: Benchmarking LLMs' Math Reasoning Abilities against Hard Perturbations

ICML 2025Poster

Crosslingual Capabilities and Knowledge Barriers in Multilingual Large Language Models

ICLR 2025Rejected

Scaling Laws for Differentially Private Language Models

ICML 2025Poster

Scaling Embedding Layers in Language Models

ICML 2025Rejected

On Memorization of Large Language Models in Logical Reasoning

ICLR 2025Rejected

Fantastic Copyrighted Beasts and How (Not) to Generate Them

ICLR 2025Poster

Catastrophic Jailbreak of Open-source LLMs via Exploiting Generation

ICLR 2024Spotlight

Mind the Privacy Unit! User-Level Differential Privacy for Language Model Fine-Tuning

COLM 2024Poster

Detecting Pretraining Data from Large Language Models

ICLR 2024Poster

LabelDP-Pro: Learning with Label Differential Privacy via Projections

ICLR 2024Poster

合作者 (20)

Pasin Manurangsi