1 引言
近年来,图神经网络(Graph Neural Networks,GNN)在NLP、风控和推荐系统等领域的研究十分火热,其对推荐系统、生物医药、社交网络和知识图谱等非结构化数据有十分优秀的处理能力。基于图神经网络的Embedding表征学习,十分重要且有意义。
图神经网络是一个很广阔的领域,涉及的知识点十分多,甚至可以专门针对它写一本书。受限于篇幅,本节以GCN和GraphSAGE两个十分经典的模型为例,阐述基于图神经网络的Graph Embedding的基本原理。
2 GCN:图神经网络开山之作
GCN(Graph Convolution Networks)图卷积神经网络,拉开了图模型与深度学习结合的序幕,可认为是图神经网络的开山之作。它利用计算机视觉中广泛使用的卷积神经网络(CNN,Convolution Neutral Networks),对非结构化图数据进行建模,从而抽取节点与其邻居之间的关系,最终可训练得到节点的Embedding向量。
图网络和视觉图像均属于二维世界,二者均可用矩阵来描述。区别在于图像是非常整齐的结构化数据,矩阵中每个元素对应图像中每个像素点。而以社交网络为典型代表的图网络则是高度非结构化的,如图6-13所示。
3 GCN总结
GCN成功将卷积神经网络应用到了图结构数据中,可以有效抽取节点间关系,并建模图数据拓扑结构。但它需要将整个图数据加载到内存或GPU显存中,资源消耗十分大,不容易处理大规模图数据。另外它通常基于静态图,难以处理动态图。最后训练时需要导入所有节点,不能处理还没有出现过的节点。针对这些问题,GraphSAGE模型被提出。
4 作者新书推荐
历经两年多,花费不少心血,终于撰写完成了这部新书。本文在6.5节中重点阐述了。
源代码:扫描图书封底二维码,进入读者群,群公告中有代码下载方式
微信群:图书封底有读者微信群,作者也在群里,任何技术、offer选择和职业规划的问题,都可以咨询。
详细介绍和全书目录,详见
《精通推荐算法》,半日达https://u.jd.com/VbCJsCz