Convolutional Nets Versus Vision Transformers for Diabetic Foot Ulcer Classification

Adrian Galdran; Gustavo Carneiro; Miguel A. González Ballester

doi:10.48550/arxiv.2111.06894

Back

Preprint

Convolutional Nets Versus Vision Transformers for Diabetic Foot Ulcer Classification

Adrian Galdran, Gustavo Carneiro and Miguel A. González Ballester

arXiv (Cornell University)

12/11/2021

DOI: https://doi.org/10.48550/arxiv.2111.06894

Abstract

Computer Science - Computer Vision and Pattern Recognition

This paper compares well-established Convolutional Neural Networks (CNNs) to recently introduced Vision Transformers for the task of Diabetic Foot Ulcer Classification, in the context of the DFUC 2021 Grand-Challenge, in which this work attained the first position. Comprehensive experiments demonstrate that modern CNNs are still capable of outperforming Transformers in a low-data regime, likely owing to their ability for better exploiting spatial correlations. In addition, we empirically demonstrate that the recent Sharpness-Aware Minimization (SAM) optimization algorithm considerably improves the generalization capability of both kinds of models. Our results demonstrate that for this task, the combination of CNNs and the SAM optimization process results in superior performance than any other of the considered approaches.

Metrics

Details

Title: Convolutional Nets Versus Vision Transformers for Diabetic Foot Ulcer Classification
Creators: Adrian Galdran
Gustavo Carneiro
Miguel A. González Ballester
Publication Details: arXiv (Cornell University)
Identifiers: 99928860502346
Academic Unit: School of Computer Science and Electronic Engineering
Language: English
Resource Type: Preprint

Convolutional Nets Versus Vision Transformers for Diabetic Foot Ulcer Classification

Abstract

Metrics

Details

Usage Policy