LEMMA: Towards LVLM-Enhanced Multimodal Misinformation Detection with External Knowledge Augmentation
https://arxiv.org/abs/2402.11943
https://arxiv.org/abs/2402.11943

1.概述
多模态虚假信息通过综合文字、图像和视频等多元化形式,在社交平台上的传播过程中,相较于单一的文本虚假信息,其展现出了更高的可信度和深远的影响力,这无疑增加了其检测的难度。尽管大型语言模型(LLMs)在传统自然语言处理任务中展现出卓越的性能,但由于仅局限于文本资