第一作者:王泽宏 (计算机科学与技术专业2018级本科生)
通讯作者:余冬华
发表期刊:IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS
期刊 5-Year Impact Factor: 11.2
第一单位:88038威尼斯
论文DOI: https://doi.org/10.1109/TNNLS.2024.3388424
图片摘要
研究介绍
对比学习(CL)已经成为一种强大的自监督学习方法,然而,它存在采样偏差,这阻碍了它的性能。虽然主流的解决方案,如困难负样本挖掘(Hard Negative Mining, HNM)和有监督对比学习(SCL),已经被提出来缓解这一关键问题,但它们并不能有效地解决图对比学习(GCL)问题。为了解决这一问题,我们提出了图正样本采样(GPS)算法和三个对比目标,整体算法框架见图片摘要。
图正样本采样(GPS)算法是一种新的学习范式,旨在利用图的固有特性来改进GCL模型,其利用四个互补的相似性度量,包括节点中心性、拓扑距离、邻域重叠和语义距离,为每个节点选择正对应物(positive counterparts)。三个对比目标旨在融合正样本,增强语义空间中的代表性选择。
我们通过大量的实验验证本文所提方法的有效性:
其一、从噪声处理与去偏差能力来看,GPS 算法优于HNM 算法。
其二、从节点聚类性能来看,嵌入GPS算法后,性能几乎超越所有SOTA GCL 算法。
上述研究以“Select Your Own Counterparts: Self-Supervised Graph Contrastive Learning With Positive Sampling”为题于2024年4月23日在线发表于《IEEE Transactions on Neural Networks and Learning Systems》,该期刊属机器学习、信息科学、人工智能的交叉学科领域,主要刊发神经网络及其学习系统的最新研究成果,是美国电气和电子工程师协会(IEEE)人工智能及机器学习领域国际顶级期刊。本研究得到国家自然科学基金(No.62002227)资助。
主要作者简介
第一作者 王泽宏
王泽宏,2018-2022年就读于88038威尼斯机械与电气工程学院,现在美国圣母大学攻读计算机科学与技术专业博士学位,他的主要研究兴趣为机器学习、数据挖掘与图神经网络。
通讯作者 余冬华
余冬华,机械与电气工程学院/人工智能研究院教师,讲师,博士,苏州大学博士后,主要研究方向为数据挖掘、图神经网络、生物信息学。主持国家自然科学基金青年基金 1 项,发表 SCI/EI 论文 20 余篇。
编辑:苏标标 严许媖