我院博士生马畅翼在国际顶级会议SIGIR发表论文

创建时间: 2020年6月03日, 星期三

我院博士生马畅翼在国际顶级会议SIGIR发表论文

近日,深圳市大数据研究院计算机与信息工程专业博士生马畅翼为第一作者的论文被2020 ACM SIGIR信息检索顶级国际会议收录。论文由顾崇林博士后、李文烨教授、崔曙光教授等老师指导完成。

 

 

| 会议简介

 

 

SIGIR (ACM International Conference on Research and Development in Information Retrieval)国际计算机协会信息检索大会是一个展示信息检索领域中各种新技术和新成果的重要国际论坛,专注于信息存储、检索和传播的各个方面,同时也是中国计算机学会推荐的A类学术会议,享有很高的国际学术声誉。

 

 

| 论文介绍

 

论文题目:Large-scale Image Retrieval with Sparse Binary Projections

论文摘要:受神经科学前沿技术启发,李文烨博士及其团队于2018年和2019年分别发表NeurIPS文章和技术报告,揭示了稀疏二值投影和竞争模型的诸多优良特性,为信息检索等经典问题提供了新的研究思路。不同于传统方法通过减少数据维度加快检索速度,我们的模型首先将样本投影到高维空间,然后利用WTA竞争对数据向量进行稀疏化和二值化重新表达。沿着该思路,本文借助一种新的算法,通过无监督训练来获得高质量的稀疏二值投影矩阵,并成功地应用于图像检索领域。实验结果表明,该方法针对大规模图像检索任务除了具有良好的稳定性之外,更能够有效提高检索精度和速度,并有效降低数据的存储需求,适合实际工业应用。

 

 

 

 

| 学生简介

 

 

| 指导教师简介

 

 

 

 

 

 

| 导师点评

 

利用稀疏二值矩阵来加速图像检索速度和精度具有新颖性和突破性。该方法的难点是如何设计这样一个投影矩阵,在重新表达的同时保证检索精度和速度。我们提出了一种利用WTA自身特点的迭代优化方法,并在ANN和IR的准确度上超过了现有的经典方法。该方法也获得了评审者的一致好评,他们认为我们的SBP方法在检索速度、准确度及通用性上具有一定的优越性。

 

马畅翼同学具有很好的编程能力,并且对机器学习有着不错的理解。她在接近三个月的时间里尝试了各种想法并最终形成了有效的方法,获得了令人满意的结果。希望她在未来的科研生涯中再接再厉,做出更好的工作!也欢迎对人工智能基础理论感兴趣的同学加入我们的团队,共同探索人工智能时代下的前沿思想方法和应用。