科研项目
面向机器学习任务的缺失数据处理研究
2021-01-27 科研项目
一、研究人员
李文烨
二、研究内容
针对常见的机器学习任务,研究缺失数据处理的模型和方法
三、应用领域
支持向量机、最近邻分类等经典机器学习算法
四、研究成果
发现了缺失数据处理与子空间交替投影(von Neumann投影)和凸集交替投影(Dykstra算法)之间的关联,并据此建立了缺失数据处理模型。
与经典的数据补全方法相比,所建立的缺失数据处理模型,具有更强的、确定的理论保证和实际性能提高。同时针对该模型,开发了适合大数据处理的高效并行算法。
五、代表性论著:
Large-scale RLSC Learning Without Agony (ICML’2007, 早期工作)
Estimating Jaccard Index with Missing Observations: A Matrix Calibration Approach (NIPS’2015, 早期工作)
Scalable Calibration of Affinity Matrices from Incomplete Observations (ACML’2020)