Deep Multimodal Learning with Missing Modality: A Survey

Renjie Wu; Hu Wang; Hsiang-Ting Chen; Gustavo Carneiro

doi:10.48550/arxiv.2409.07825

Back

Preprint

Deep Multimodal Learning with Missing Modality: A Survey

Renjie Wu, Hu Wang, Hsiang-Ting Chen and Gustavo Carneiro

12/09/2024

DOI: https://doi.org/10.48550/arxiv.2409.07825

Abstract

Computer Science - Artificial Intelligence

Computer Science - Computer Vision and Pattern Recognition

Computer Science - Learning

During multimodal model training and testing, certain data modalities may be absent due to sensor limitations, cost constraints, privacy concerns, or data loss, negatively affecting performance. Multimodal learning techniques designed to handle missing modalities can mitigate this by ensuring model robustness even when some modalities are unavailable. This survey reviews recent progress in Multimodal Learning with Missing Modality (MLMM), focusing on deep learning methods. It provides the first comprehensive survey that covers the motivation and distinctions between MLMM and standard multimodal learning setups, followed by a detailed analysis of current methods, applications, and datasets, concluding with challenges and future directions.

Metrics

1 Record Views

Details

Title: Deep Multimodal Learning with Missing Modality: A Survey
Creators: Renjie Wu
Hu Wang
Hsiang-Ting Chen
Gustavo Carneiro
Identifiers: 991003264302346
Academic Unit: School of Computer Science and Electronic Engineering
Language: English
Resource Type: Preprint

Deep Multimodal Learning with Missing Modality: A Survey

Abstract

Metrics

Details

Usage Policy