Case-Enhanced Vision Transformer: Improving Explanations of Image Similarity with a ViT-based Similarity Metric

Zhao, Ziwei, Leake, David, Ye, Xiaomeng, Crandall, David

Jul-23-2024–arXiv.org Artificial Intelligence

This short paper presents preliminary research on the Case-Enhanced Vision Transformer (CEViT), a similarity measurement method aimed at improving the explainability of similarity assessments for image data. Initial experimental results suggest that integrating CEViT into k-Nearest Neighbor (k-NN) classification yields classification accuracy comparable to state-of-the-art computer vision models, while adding capabilities for illustrating differences between classes. CEViT explanations can be influenced by prior cases, to illustrate aspects of similarity relevant to those cases.

attention mask, cevit, explanation, (14 more...)

arXiv.org Artificial Intelligence

Jul-23-2024

arXiv.org PDF

Add feedback

Country:
- North America > United States > Indiana > Monroe County > Bloomington (0.04)

Genre:
- Research Report (0.70)

Technology:
- Information Technology
  - Sensing and Signal Processing > Image Processing (1.00)
  - Artificial Intelligence
    - Vision (1.00)
    - Representation & Reasoning > Case-Based Reasoning (1.00)
    - Machine Learning
      - Memory-Based Learning (1.00)
      - Neural Networks > Deep Learning (0.70)
      - Statistical Learning > Nearest Neighbor Methods (0.54)

Duplicate Docs Excel Report

Title
None found

Similar Docs Excel Report more

Title	Similarity	Source
None found