最小歪みを持つ敵対的サンプルの構築

この論文を3行でいうと

敵対的サンプルはニューラルネットワークの脆弱性を示す重要な問題です。
本研究では、最小の歪みを持つ敵対的サンプルを形式的に構築する手法を提案します。
提案手法により、最近の防御法が実際に効果を持つことを証明しました。

キーワード

敵対的サンプル形式的検証ニューラルネットワーク

もう少しだけ中身を見る

敵対的サンプルは、ニューラルネットワークの安全性を脅かす重要な課題です。本論文では、任意のニューラルネットワークと入力に対して、最小の歪みを持つ敵対的サンプルを形式的に構築する手法を提案します。このアプローチにより、最近の防御法の効果を実証し、実用的な安全性向上に寄与します。機械学習や安全性に関心のある研究者に特におすすめです。

こんな人に向いていそう

機械学習やAIの安全性に興味がある研究者や実務者に向いています。

元論文はこちら

Provably Minimally-Distorted Adversarial Examples

Nicholas Carlini, Guy Katz, Clark Barrett, David L. Dill

DOI OpenAlex