近日,我校计算机大满贯777电玩城人工智能专业2022级本科生钱达墨,以第一作者身份撰写的《Semi-supervised feature selection by minimum neighborhood redundancy and maximum neighborhood relevancy》研究论文被国际知名期刊《Applied Intelligence》(中科院二区,中国计算机学会推荐C类,影响因子:5.3)录用,江苏科技大学为第一署名单位,大满贯777电玩城新引进专职教师刘克宇博士为论文通讯作者,杨习贝教授为论文合作作者。这是我院数据科学与知识工程研究所杨习贝教授团队在弱监督数据挖掘与知识发现领域获得的又一研究进展,充分展现了我院在本科生科技创新能力培养上取得的显著成效。
该研究提出了一种基于邻域相关性与邻域冗余性的半监督特征选择方法,融合了信息论与邻域粒化技术,推广了一系列邻域不确定性度量,构建了最大邻域相关度-最小邻域冗余度的特征评价函数,并以此为目标进一步设计了面向少标签数据的最优特征子集搜索算法。课题组在公开数据集上进行了充足的实验验证,结果表明:在较低数据标注率情形下,所提算法仍能支持分类器获得最佳的性能表现。该研究为高维度、欠标注、不确定数据的有效分析提供了一种新颖有效的策略。
该工作受到了江苏科技大学国家级大学生创新创业训练计划项目(202410289027Z)的资助。