计软院2018级硕士研究生论文被数据挖掘领域顶级国际学术会议KDD2020全文录用

发布者:常月圆发布时间:2020-07-09浏览次数:1343

  近日,从ACM SIGKDD 2020(Knowledge Discovery and Data Mining’20传来喜讯,计软院NuPath实验室2018级硕士研究生施万里论文第一作者其指导老师顾彬教授合作的论文 “Semi-Supervised Multi-Label Learning from Crowds via Deep Sequential Generative Model”被KDD 2020 Research Track全文录用,标志着计软院师生在数据挖掘领域的研究迈入了新的台阶。

  论文题目Semi-Supervised Multi-Label Learning from Crowds via Deep Sequential Generative Model

  论文作者:施万里,Victor S. Sheng, 李翔,顾彬

  论文概述多标签学习问题在现实问题中非常常见。传统的多标签问题通常假设有足够的有标签数据来训练分类器。但是,在实际问题中,获取大量的真实标签通常费时费力。在数据挖掘领域,人们通常通过众包技术收集数据的标签。这使得获得的标签常常是有噪声的。同时为了节省成本,在多标签问题中通常会留有大量的未标记数据。如何高效的利用众包数据和无标签数据是数据挖掘领域的重要问题。为了解决这一问题,该论文提出了一种深度序列化生成模型,通过潜变量描述有标记/未标记的数据,以及众包数据的标记过程。同时,该论文还引入了一个高效的序列推理模型来逼近模型的后验并推断无标签数据的真实性标签。该论文在不同数据集上的实验结果证明了新模型的有效性。

  ACM SIGKDD Conference on Knowledge Discovery and Data Mining(国际数据挖掘与知识发现大会,简称KDD),是世界数据挖掘领域最高级别的国际性学术会议,也是中国计算机学会(CCF)推荐A类国际学术会议该会议创始于1995年,每年举办一次由于其广泛的应用性,近年来国际影响力快速增长,引起了世界各国人工智能、机器视觉、数据库、生物信息科学、高性能计算、大数据分析等众多领域的著名企业和学者的高度重视和积极参与。

  根据会议主办方提供的数据,本届KDD2020会议的Research Track共收到有效投稿1279篇,最终216篇论文被大会录取为研究论文,录用率约为16.9%施万里同学的论文能够在中国大陆如清华、北大、南大等中国大陆985顶级高校以及阿里、京东、华为等国内顶级公司第一单位署名录用的40余篇文章中脱颖而出,得益于计软院提供的国际化教学和科研环境计软院近年来在人才培养方面不断进步的又一成果。

  为保证学院科研教学质量计软院在防控疫情的特殊时期竭力克服疫情带来的不利影响,多措并举有序推进各项科研项目申报工作,确保疫情防控期间不停学、不停研对学院学科建设和科研工作的发展起到了积极的促进作用下一步,计软院将充分发挥学科、专业优势特色,持续推动开展各项科研工作,努力提升师生的科研学术能力和学术水平,更好地服务于人才培养和经济社会发展。