Limited Effectiveness of LLM-based Data Augmentation for COVID-19 Misinformation Stance Detection

Choi, Eun Cheol, Balasubramanian, Ashwin, Qi, Jinhu, Ferrara, Emilio

Mar-4-2025–arXiv.org Artificial Intelligence

Misinformation surrounding emerging outbreaks poses a serious societal threat, making robust countermeasures essential. One promising approach is stance detection (SD), which identifies whether social media posts support or oppose misleading claims. In this work, we finetune classifiers on COVID-19 misinformation SD datasets consisting of claims and corresponding tweets. Specifically, we test controllable misinformation generation (CMG) using large language models (LLMs) as a method for data augmentation. While CMG demonstrates the potential for expanding training datasets, our experiments reveal that performance gains over traditional augmentation methods are often minimal and inconsistent, primarily due to built-in safeguards within LLMs. We release our code and datasets to facilitate further research on misinformation detection and generation.

augmentation, dataset, stance detection, (14 more...)

arXiv.org Artificial Intelligence

Mar-4-2025

arXiv.org PDF

Add feedback

Country:
- North America > United States > California > Los Angeles County > Los Angeles (0.16)

Genre:
- Research Report (1.00)

Industry:
- Health & Medicine
  - Epidemiology (1.00)
  - Therapeutic Area
    - Immunology (0.91)
    - Infections and Infectious Diseases (0.91)
- Media > News (1.00)

Technology:
- Information Technology > Artificial Intelligence
  - Machine Learning > Neural Networks
    - Deep Learning (0.71)
  - Natural Language > Large Language Model (1.00)

Duplicate Docs Excel Report

Title
None found

Similar Docs Excel Report more

Title	Similarity	Source
None found