基于时序集成的图卷积网络半监督分类【字数:8939】
目录
摘要Ⅱ
关键词Ⅱ
ABSTRACTⅡ
KEY WORDSⅡ
引言1
1问题概述1
1.1 研究背景及意义 1
1.2 研究现状 3
1.2.1 基于图的半监督学习3
1.2.2图神经网络3
1.2.3损失函数4
2原理与方法4
2.1 谱图卷积4
2.2分层线性模型5
2.3 图上的快速近似卷积 6
2.4 时序集成6
3 半监督节点分类模型7
3.1 模型7
3.2 实现8
4 实验结果及分析9
4.1 实验综述9
4.2 数据集介绍9
4.3 实验9
4.4 结果分析9
5 总结与展望10
5.1 总结10
5.2 工作展望11
致谢11
参考文献12
基于时序集成的图卷积网络半监督分类
摘要
随着深度学习的发展,人工智能对于各种各样数据的识别与分类的精度不断提高。而广义上来讲任何数据在赋范空间中都可以建立拓扑关联,拥有这种拓扑结构的数据称为图数据。图数据的处理在深度学习中占有重要的地位,有了它就可以让我们处理更多复杂架构的数据。因此如何处理图结构的数据是当前一个热门的话题。本文先简要回顾了先前的一些对图数据处理的方法,之后引入了我们的方法。具体来说,我们的方法是通过借助图的拉普拉斯矩阵的特征值和特征向量,然后定义一个图上的卷积公式来达到对图的特征的提取,并且通过半监督学习的方式和在损失函数中引入时序集成优化损失函数来提高图数据分类的效率和准确性。最后在大量的实验中,我们证实了我们的方法比相关的方法表现的更好,分类精确度更高。
引言
随着科学技术和人工智能的不断发展,人们期望人工智能能够拥有更强大的功能。而如今,数据的类型也越来越多样化,不仅有图片,视频等,还有社交网络,引文网络等图结构的数据,因此如何让人工智能去识别并处理这些数据给研究员们提出了新的挑战。
一 *51今日免费论文网|www.51jrft.com +Q: ^351916072^
直以来,人们利用人工智能对图片数据的处理研究的比较多,其主要的方式是通过一个卷积核来对其进行卷积达到特征的提取。图片数据排列整齐,每个像素点的邻居节点都相同,而与之不同的是,图数据排列不规则,每个节点的邻居节点个数是不同的,所以难以用一个固定的卷积核来进行卷积。而关于图的神经网络,在之前就有人提出通过引用类卷积的传播规则来或通过谱图卷积神经网络来对图进行分类。大部分有关于图的半监督学习的方法主要囊括为两类:一类是基于图拉普拉斯正则化的方法,另一类是在图嵌入基础上的方法。本文的方法主要是通过基于对谱图卷积神经网络框架的简化和在半监督学习的损失函数中引入时序集成,使我们能够处理更大规模的图片并且提高分类的性能。
1问题概述
1.1研究背景及意义
在图卷积网络(Graph Convolutional Network, GCN)诞生之前,卷积神经网络(Convolutional Neural Network, CNN)被广泛应用在图像上。CNN是计算机视觉领域中很重要的一部分,效果非常的突出,可以很好的提取空间特征,尤其是对图像的分类和处理。在数学中,我们定义的卷积公式如下:
(1.1)
(1.2)
公式(1.1)是在连续场合的卷积,公式(1.2)是在离散场合的卷积。于是,人们在处理图片或者视频这类的数据时希望可以通过上述这样的卷积运算来达到对其特征的提取。由于图片或者视频数据的像素点是可以排列成很整齐的矩阵的形式的,因此通过利用一个共享参数的过滤器,即卷积核,计算中心像素点以及相邻像素点的加权和来构成特征图实现对其空间特征的提取。其计算过程大致如图11所示。最左边是像素的矩阵图,最右边是特征图,右上角的式子为卷积的运算过程。中间的convolution kermel为卷积核,它通过平移并进行卷积运算来完成对原始图片特征的提取。这就是卷积神经网络所作的工作。
图11
但是在现实生活中,还有很多不是像图片、视频这类排列很整齐的数据,比如图结构数据,如图12所示。它的结构更加不规则,每个顶点相邻节点的数量都可能不一样,而且点的排列也不是整齐的,无法保持平移不变性,即无法用一个如图11中那样尺寸不变的卷积核来对其进行卷积运算,达到对数据特征的提取。因此,如何处理这类结构的数据就显得尤为重要。
本文希望通过借鉴卷积神经网络中卷积核这样的操作,即对每个节点(顶点)及其周围的节点做加权和,来达到对图结构数据节点局部特征的提取。由于图结构数据的不规则,每个节点所连的节点个数不一定相同,所以此时我们通过对图数据拉普拉斯矩阵的特征分解来达到对每个点局部特征的提取。
图12
而在在对神经网络进行训练计算损失函数时,以往的方法大都是在损失函数中使用此次迭代中预测出的标签与正确标签的一个运算来梯度下降优化参数。在本文中我们引入了一种时序集成的方法,用多次迭代中预测的数据的一个集成值来与此次迭代中的预测值进行运算,因为在运算中使用了以前迭代中预测的数据,因此我们认为用这样的方法优化损失函数,可以得到更好的参数值,提高分类的精度。
因为任何数据在广义上来说都可以被表示成图结构类型的数据,因此图卷积神经网络有很大的应用前景,研究它是很有必要且重要的,有了它以后,我们就可以处理更多复杂结构的数据,从而使人工智能的功能更加强大。
1.2研究现状
1.2.1基于图的半监督学习
有关于图的半监督学习的方法有很多种,其中的方法主要是由使用某种形式的图拉普拉斯正则化和图嵌入表示这两种方法构成的。在基于图拉普拉斯正则化的方法中主要包括:标签传播法、流形正则化法和深层的半监督嵌入法。
最近,由于受到了skipgram模型的启发,人们的注意力转移到了学习图嵌入方法的模型。Deepwalk方法主要是通过在图上的随机游走采样来预测节点的局部领域来学习嵌入。为了让Deepwalk方法的应用范围更广,LINE和node2vec使用了更繁复的随机游走或者宽度优先的搜索方案。然而,在这些方法当中都需要一个多步的管道,这个管道中包括随机游走的生成和半监督训练,并且其中的每一步管道都需要单独分开去进行优化。Planetoid方法通过在学习嵌入的过程中注入标签信息来缓解这种情况。
原文链接:http://www.jxszl.com/jsj/xxaq/606981.html