Obfuscated Gradients Give a False Sense of Security: Circumventing Defenses to Adversarial Examples

Athalye, Anish, Carlini, Nicholas, Wagner, David

Feb-15-2018–arXiv.org Artificial Intelligence

We identify obfuscated gradients, a kind of gradient masking, as a phenomenon that leads to a false sense of security in defenses against adversarial examples. While defenses that cause obfuscated gradients appear to defeat iterative optimization-based attacks, we find defenses relying on this effect can be circumvented. For each of the three types of obfuscated gradients we discover, we describe characteristic behaviors of defenses exhibiting this effect and develop attack techniques to overcome it. In a case study, examining non-certified white-box-secure defenses at ICLR 2018, we find obfuscated gradients are a common occurrence, with 7 of 8 defenses relying on obfuscated gradients. Our new attacks successfully circumvent 6 completely and 1 partially.

adversarial example, artificial intelligence, machine learning, (19 more...)

arXiv.org Artificial Intelligence

Feb-15-2018

arXiv.org PDF

Add feedback

Country:
- Asia (0.04)
- North America > United States
  - California > Alameda County
    - Berkeley (0.04)
  - Massachusetts > Middlesex County
    - Cambridge (0.04)
  - New York > New York County
    - New York City (0.04)

Genre:
- Research Report > New Finding (0.68)
- Summary/Review (0.93)

Industry:
- Government (0.46)
- Information Technology > Security & Privacy (0.46)

Technology:
- Information Technology > Artificial Intelligence
  - Machine Learning
    - Neural Networks > Deep Learning (0.46)
    - Statistical Learning > Gradient Descent (0.30)
  - Representation & Reasoning (1.00)

Duplicate Docs Excel Report

Title
None found

Similar Docs Excel Report more

Title	Similarity	Source
None found