【GAD】基于邻域重建的图异常检测

GAD-NR: Graph Anomaly Detection via Neighborhood Reconstruction

  • 摘要
  • contributions
  • Methodology
    • GAE via Neighborhood Reconstruction
      • 邻域重建
      • 整体重建损失
  • 实验

在这里插入图片描述

WSDM2024Link
Code |

摘要

图异常检测(GAD)是一种用于识别图中异常节点的技术,在网络安全,欺诈检测,社交媒体垃圾邮件检测和各种其他领域中找到应用。GAD的一种常见方法是图形自动编码器(GAE),它将图形数据编码为节点表示,并通过基于这些表示评估图形的重建质量来识别异常。然而,现有的GAE模型主要针对直接链接重建进行优化,导致图中连接的节点在潜在空间中聚集。因此,他们擅长检测簇型类型的结构异常,但难以处理不符合簇的更复杂的结构异常。

为了解决这个限制,本文提出了一种新的解决方案,称为GAD-NR,GAE的一个新的变种,采用邻域重建图异常检测
GAD-NR的目标是基于节点的表示重建节点的整个邻域,包括局部结构、自身属性和邻居属性。通过比较异常节点和正常节点之间的邻域重建损失,GAD-NR可以有效地检测任何异常。

在六个真实世界数据集上进行的广泛实验验证了GAD-NR的有效性,显示出与最先进的竞争对手相比的显着改进(AUC高达30%↑)。GAD-NR的源代码是公开的。重要的是,比较分析表明,现有的方法只在检测一个或两个类型的异常的三种类型的研究。相比之下,GAD-NR在检测数据集上的所有三种类型👇的异常方面表现出色,展示了其全面的异常检测能力。
在这里插入图片描述

contributions

  • 图异常检测框架:GAD-NR,利用节点表示中节点的整个邻域的重建损失,原则上可以检测上图中的所有三种类型的异常。
  • 从技术上讲,GAD-NR采用邻居表示分布的高斯近似,并计算封闭形式的KL散度作为重建损失,这大大提高了该方法的可扩展性和有效性。
  • 对六个真实世界网络的大量实验证明了 GAD-NR 与 SOTA 基线相比的有效性,以及 GAD-NR 设计细节的基本原理。

Methodology

为了检测在实践中通常更有用的节点异常,需要将边缘的重建损失聚合到节点级别,并且如何正确地聚合这些损失本身并不是一个微不足道的问题,并且通常取决于算法。

GAE via Neighborhood Reconstruction

自动编码器的目标是以最小的损失对数据进行降维,以恢复原始数据。
GAE将每个节点的属性及其一跳或多条邻域中的节点的属性编码为节点表示。
在这里插入图片描述

邻域重建

从压缩的 h u ( L ) h_u^{(L)} hu(L)解码集合 H u H_u Hu是困难的:一方面,集合的大小可能会在节点 u ∈ V u\in V uV之间变化;另一方面,集合中的元素是无序的。使用MLP来解码一个可变大小的集合是不可能的。
我们的想法受到最近工作 N W R − G A E [ 1 ] NWR-GAE^{[1]} NWRGAE[1]的启发。
将邻域信息分解为两部分,即邻域的数量(节点度)和邻域表示的分布。重建过程应该正确重建这两部分信息。

[1] Mingyue Tang, Carl Yang, and Pan Li. Graph auto-encoder via neighborhood
wasserstein reconstruction. ICLR, 2022

整体重建损失

重建节点自身属性的损失+节点度+邻居的表征分布
在这里插入图片描述
采用上式作为表征每个节点的异常程度的分数。分数越大意味着编码信息越难重构,因此对应节点越可能是异常的。

实验

In this section, we extensively compare GAD-NR with several baseline methods for graph anomaly detection. Specifically, we aim to answer the following questions:

  • 邻域重建如何促进GAD-NR对GAD的性能改善?
  • GAD-NR的哪一部分对于不同类型的异常检测很重要?
  • 重要的超参数,如隐藏表示的大小,以及不同类型的重建损失之前的权重如何影响GAD-NR的性能?
  • 所采用的邻域特征分布的高斯近似如何提高GAD-NR的运行时间效率?

对应4张图/表回答了一一以上问题
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2808604.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

istio系列教程

istio学习记录——安装https://suxueit.com/article_detail/otVbfI0BWZdDRfKqvP3Gistio学习记录——体验bookinfo及可视化观测https://suxueit.com/article_detail/o9VdfI0BWZdDRfKqlv0r istio学习记录——kiali介绍https://suxueit.com/article_detail/pNVbfY0BWZdDRfKqX_0K …

在使用nginx的时候快速测试配置文件,并重新启动

小技巧 Nginx修改配置文件后需要重新启动,常规操作是启动在任务管理器中关闭程序然后再次双击nginx.exe启动,但是使用命令行就可以快速的完成操作。 将cmd路径切换到nginx的安装路径 修改完成配置文件后 使用 nginx -t校验nginx 的配置文件是否出错 …

力扣随笔之颜色分类(中等75)

思路:定义两个指针划分left,right划分三个区域left左边是红色区域,right右边是蓝色区域,left和right之间是白色区域;定义一个遍历指针遍历整个数组,遇到红色与left所指位置数字交换,并将left自加…

考研408深度分析+全年规划

408确实很难,他的难分两方面 一方面是408本身的复习难度,我们都知道,408的考察科目有四科,分别是数据结构,计算机组成原理,操作系统和计算机网络。大家回想一下自己在大学本科时候学习这些专业课的难度&am…

快速排序C语言实现程序

快速排序 快速排序算法一种最常见的排序算法,其核心思想就是 分治 ,具体的:1) 选定一个基准数;2) 分区,将所有大于基准数的数据分为一区,将所有小于等于基准数的数据分为一区&#x…

Redis主从、哨兵、Redis Cluster集群架构

Redis主从、哨兵、Redis Cluster集群架构 Redis主从架构 Redis主从架构搭建 主从搭建的问题 如果同步数据失败,查看log日志报错无法连接,检查是否端口未开放出现”Error reply to PING from master:...“日志,修改参数protected-mode no …

《乱弹篇(十八)天灾人祸》

昨天午后笔者发表《贵州山火频发,令人扼腕痛惜》一文后,昨晚和今日上午又见社交网站上媒体发表的最新消息报道《南京一小区火灾已造成15死44伤,市长鞠躬道歉》《南京“223”火灾15死44伤:为啥1楼起火烧到了30层?除了电…

C/C++文件操作

一、文本文件操作 1、写文件操作 代码 #include<fstream> #include<iostream>int main() {ofstream outfile("Student.txt", ios::out);if (!outfile) {cout << "文件写入失败" << endl;exit(0); //程序终止}cout << &qu…

k8s-kubeapps部署 20

部署kubeapps应用&#xff0c;为Helm提供web UI界面管理&#xff1a; 下载最新版本的kubeapps并修改其values.yaml文件 下载并拉取所需镜像&#xff1a; 部署应用 添加解析 修改svc暴露方式为LoadBalancer 得到分配地址 访问http://192.168.182.102 授权并获取token 1.24前的…

LeetCode 1038.从二叉搜索树到更大和树

给定一个二叉搜索树 root (BST)&#xff0c;请将它的每个节点的值替换成树中大于或者等于该节点值的所有节点值之和。 提醒一下&#xff0c; 二叉搜索树 满足下列约束条件&#xff1a; 节点的左子树仅包含键 小于 节点键的节点。 节点的右子树仅包含键 大于 节点键的节点。 左…

Orange3数据预处理(列选择组件)数据角色及类型描述

在Orange3的文件组件中&#xff0c;datetime、categorical、numeric以及text代表不同种类的数据类型&#xff0c;具体如下&#xff1a; datetime&#xff1a;代表日期和时间类型的数据。通常用于时间序列分析、生存分析和其他需要考虑时间因素的机器学习任务中。例如&#xff0…

【Linux】部署前后端分离项目---(Nginx自启,负载均衡)

目录 前言 一 Nginx&#xff08;自启动&#xff09; 2.1 Nginx的安装 2.2 设置自启动Nginx 二 Nginx负载均衡tomcat 2.1 准备两个tomcat 2.1.1 复制tomcat 2.1.2 修改server.xml文件 2.1.3 开放端口 2.2 Nginx配置 2.2.1 修改nginx.conf文件 2.2.2 重启Nginx服务 2…

【动态规划题目讲解】AGC026D - Histogram Coloring

[ A G C 026 D ] H i s t o g r a m C o l o r i n g \mathrm{[AGC026D] Histogram\ Coloring} [AGC026D]Histogram Coloring D e s c r i p t i o n \mathrm{Description} Description 给定 N N N 列的网格&#xff0c;每列高为 h i h_i hi​&#xff0c;将每个格子染色成红…

鸿蒙开发【WebGL】简单了解

WebGL的全称为Web Graphic Library(网页图形库)&#xff0c;主要用于交互式渲染2D图形和3D图形。目前HarmonyOS中使用的WebGL是基于OpenGL裁剪的OpenGL ES&#xff0c;可以在HTML5的canvas元素对象中使用&#xff0c;无需使用插件&#xff0c;支持跨平台。WebGL程序是由JavaScr…

什么是抖音视频下载软件|视频批量下载|爬虫工具

抖音视频抓取软件是一款方便用户获取抖音平台上视频内容的工具。它具备以下主要功能&#xff1a; 批量视频提取&#xff1a;用户可以输入关键词&#xff0c;软件将自动搜索抖音平台上与关键词相关的视频&#xff0c;并将它们列出供用户选择和下载。用户可以随时停止搜索和下载过…

【数电】一文带你轻松搞定奇偶校验原理与规则(案例演示)

前言 大家好吖&#xff0c;欢迎来到 YY 滴单片机系列 &#xff0c;热烈欢迎&#xff01; 本章主要内容面向接触过单片机的老铁 主要内容含&#xff1a; 欢迎订阅 YY滴C专栏&#xff01;更多干货持续更新&#xff01;以下是传送门&#xff01; YY的《C》专栏YY的《C11》专栏YY的…

STM32 HAL库移植MPU6050 DMP库(跟着做就能成功)

STM32移植MPU6050 DMP库&#xff08;跟着做就能成功&#xff09; 0.前言一、使用CubeMX建立工程二、移植DMP库修改&#xff1a;注意&#xff1a; 使用 三、总结 0.前言 最近捣鼓FreeRTOS时需要使用一个MPU6050姿态传感器&#xff0c;到处扒拉例程时发现各式各样的教程都不太满意…

游戏 CP 专访| InOutPath 技术干货分享!

“ 编辑语&#xff1a;STEAM 上的 3D 解密游戏《InOutPath》以其清新的画面&#xff0c;独特的玩法&#xff0c;受到了广大 STEAM 玩家&#xff0c;以及 Cocos 开发者们的关注。今天有幸邀请到了这款游戏的开发商&#xff0c;为大家做一次技术分享。希望能够对在用 Cocos Creat…

【数据结构与算法】(14)基础算法 之AVL 树相关示例 详细代码讲解

目录 3.4 红黑树概述历史红黑树特性 实现插入情况删除情况完整代码小结 3.4 红黑树 概述 历史 红黑树是一种自平衡二叉查找树&#xff0c;最早由一位名叫Rudolf Bayer的德国计算机科学家于1972年发明。然而&#xff0c;最初的树形结构不是现在的红黑树&#xff0c;而是一种称…

关于js [GDOUCTF 2023]hate eat snake

查看页面源代码 发现snake.js文件 打开js文件 第7行定义了游戏的速度this.speed this.oldSpeed speed || 10 ; 全文搜索speed&#xff0c;在第237行发现自增代码this.speed; 注释或者删除自增代码 回到游戏页面 重玩游戏&#xff0c;等待60s即可 得到flag