最小歪みを持つ敵対的サンプルの構築

Provably Minimally-Distorted Adversarial Examples

敵対的サンプルの新しい構築法を提案

2017-09-29 被引用 101 中級
LLM異常検知CNN
  • 敵対的サンプルはニューラルネットワークの脆弱性を示す重要な問題です。
  • 本研究では、最小の歪みを持つ敵対的サンプルを形式的に構築する手法を提案します。
  • 提案手法により、最近の防御法が実際に効果を持つことを証明しました。
敵対的サンプル形式的検証ニューラルネットワーク

敵対的サンプルは、ニューラルネットワークの安全性を脅かす重要な課題です。本論文では、任意のニューラルネットワークと入力に対して、最小の歪みを持つ敵対的サンプルを形式的に構築する手法を提案します。このアプローチにより、最近の防御法の効果を実証し、実用的な安全性向上に寄与します。機械学習や安全性に関心のある研究者に特におすすめです。

機械学習やAIの安全性に興味がある研究者や実務者に向いています。

Provably Minimally-Distorted Adversarial Examples
Nicholas Carlini, Guy Katz, Clark Barrett, David L. Dill