It's Morphin' Time! Combating Linguistic Discrimination with Inflectional Perturbations

Tan, Samson, Joty, Shafiq, Kan, Min-Yen, Socher, Richard

May-9-2020–arXiv.org Artificial Intelligence

Training on only perfect Standard English corpora predisposes pre-trained neural networks to discriminate against minorities from non-standard linguistic backgrounds (e.g., African American Vernacular English, Colloquial Singapore English, etc.). We perturb the inflectional morphology of words to craft plausible and semantically similar adversarial examples that expose these biases in popular NLP models, e.g., BERT and Transformer, and show that adversarially fine-tuning them for a single epoch significantly improves robustness without sacrificing performance on clean data.

artificial intelligence, machine learning, natural language, (21 more...)

arXiv.org Artificial Intelligence

May-9-2020

arXiv.org PDF

Add feedback

Country:
- Oceania > Australia
  - Victoria > Melbourne (0.04)
  - New South Wales > Sydney (0.04)
- North America
  - United States
    - Texas (0.04)
    - Pennsylvania (0.04)
    - Massachusetts (0.04)
    - Minnesota > Hennepin County
      - Minneapolis (0.15)
    - Louisiana > Orleans Parish
      - New Orleans (0.04)
    - Georgia > Fulton County
      - Atlanta (0.04)
    - California > San Diego County
      - San Diego (0.04)
  - Canada
    - British Columbia > Metro Vancouver Regional District
      - Vancouver (0.04)
    - Alberta > Census Division No. 15
      - Improvement District No. 9 > Banff (0.04)
- Europe
  - France (0.14)
  - Germany > Berlin (0.04)
  - United Kingdom > England
    - Oxfordshire > Oxford (0.04)
    - Cambridgeshire > Cambridge (0.04)
  - Spain > Valencian Community
    - Valencia Province > Valencia (0.04)
  - Portugal > Lisbon
    - Lisbon (0.04)
  - Italy > Tuscany
    - Florence (0.04)
  - Denmark > Capital Region
    - Copenhagen (0.04)
  - Belgium > Brussels-Capital Region
    - Brussels (0.04)
- Asia
  - Singapore (0.25)
  - Middle East > Syria
    - Latakia Governorate > Latakia (0.04)
  - China > Guangdong Province
    - Guangzhou (0.04)

Genre:
- Research Report > New Finding (0.46)

Industry:
- Government (0.46)

Technology:
- Information Technology
  - Communications > Social Media (0.93)
  - Artificial Intelligence
    - Natural Language > Machine Translation (0.94)
    - Machine Learning > Neural Networks
      - Deep Learning (0.46)

Duplicate Docs Excel Report

Title
None found

Similar Docs Excel Report more

Title	Similarity	Source
None found