2022年数据科学国际研讨会（线上）顺利召开

12月17日至12月18日，2022年数据科学国际研讨会（MIIS 2022）在线上顺利召开，本次会议由深圳市大数据研究院主办，香港中文大学（深圳）、清华-伯克利深圳学院、雷达信号处理国家级重点实验室、综合业务网理论及关键技术国家重点实验室、鹏城实验室、广东省大数据计算基础理论与方法重点实验室、国家健康医疗大数据研究院（深圳）协办。

会议邀请了鄂维南、Yinyu Ye、Rui Zhang、翟广涛、郑海荣、韩德仁、王筱平、Nikos Sidiropoulos、Asu Ozdaglar、李纯明、黄绍伦、陈景东、Yonina Eldar、陈兵龙、赵鼎、张纵辉共16位来自学界的世界顶尖数据科学相关领域专家进行学术分享，共有超过150名科学家、研究人员、工程师和学生等参会。

随着全球数字化进程加速，数据要素潜能被不断激发，数据科学的价值持续彰显。作为极具国际影响力的数据科学领域盛会，数据科学国际研讨会自2012年以来已连续举办11届，已经成为展示数据科学、信息科学、大数据分析以及人工智能领域问题和研究进展的重要国际化交流平台。多年来，会议得到了各方的广泛参与和积极支持，也受到了许多专家学者的聚焦关注。

开幕式嘉宾致辞

罗智泉院士

香港中文大学（深圳）副校长、深圳市大数据研究院院长

开幕式上，香港中文大学（深圳）副校长、深圳市大数据研究院院长罗智泉院士致欢迎词。他首先对与会学者、研究人员和学生等表达了热烈欢迎和由衷感谢。他说，信息科学及相关技术的飞速发展推动了MIIS数据科学国际研讨会的诞生，今年已是第11年举办MIIS，目前MIIS已成为信息/数据领域的国际年度学术活动。研讨会秉承“以数学为基础、以数据为驱动、以重大应用为导向”的理念，旨在交流和分享信息科学和大数据领域的新思想、新理论和新技术，帮助促进数据科学理论和工业应用的研究和发展。

张晓平院士

清华大学深圳国际研究生院信息学科首席教授

清华大学深圳国际研究生院信息学科首席教授张晓平院士随后致辞，他表示清华大学深圳国际研究生院数据赋能理论与应用研究中心（DELTA）面向数据赋能落地、国家重大需求和国际学术前沿，聚焦面向智慧城市的大数据理论和应用落地两大方向进行研究，致力于更好地推动信息科学发展。

张纵辉教授

香港中文大学（深圳）理工学院助理院长、深圳市大数据研究院信息系统大数据实验室副主任

香港中文大学（深圳）理工学院助理院长、深圳市大数据研究院信息系统大数据实验室副主任、广东省大数据计算基础理论与方法重点实验室副主任张纵辉教授介绍了这次MIIS研讨会的主协办单位，他表示，本次研讨会让与会人员了解到数据科学及相关领域的最新研究进展与趋势，帮助青年科学家、工程人员、学生开阔学术视野，提高科研创新能力。

精彩回顾

鄂维南

北京大学

鄂维南院士的报告题目是“Stochastic Gradient Descent Algorithms in Machine Learning”。鄂院士聚焦于机器学习领域最受欢迎的随机梯度下降算法，从随机修正方程（stochastic modified equations）的角度来研究该算法的理论，主要涉及其收敛特性，最优学习速率（learning rate）与批量大小（batch size），在过度参数化情况下随机梯度下降算法会收敛到特定的全局最优点。

叶荫宇

斯坦福大学

叶荫宇教授的报告题目是“Accelerated Second-Order Methods for Convex and Nonconvex Optimization”。叶教授介绍了四个子研究课题：基于半正定技术的最优对角共轭梯度下降法，基于齐次下降方向来加速二阶算法，基于降维信任域法求解无约束优化问题，基于势函数下降法求解线性规划问题。叶教授强调，巧妙地利用二阶方法里面的信息可以用于加速一阶算法的收敛性。

张瑞

香港中文大学（深圳）、深圳市大数据研究院

张瑞教授的报告题目是“Multi-IRS Multi-Reflection Beam Routing for Future Wireless Networks: Performance Scaling, Graph-based Optimization, and Implementation Issues”。Rui Zhang教授首先介绍了在5G这个大背景下智能反射面技术的重要性，对比了与其他技术的优势；其次针对多智能反射面的场景提出了基于波束路由（beam routing）的建模思路；最后张教授提出了基于图论技术的优化策略来求解该类模型。

翟广涛

上海交通大学

翟广涛教授的报告题目是“多媒体信号的感知质量评估”。多媒体信号已成为我们的主要信息来源，青少年和成人的平均屏幕时间每天达到9至10个小时。但是，多媒体信号的质量通常在采集、压缩、传输和显示阶段会受到环境、设备和操作的负面影响。感知质量评估算法旨在评估观众的QoE（经验质量），从而为该算法提供优化目标多媒体信号处理系统。翟广涛教授在报告中介绍多媒体感知质量评估的挑战，以及在使用自由能模型、灾难模型等方法来扩展主观视觉效果进行了尝试研究。最后，翟教授还对该领域的前沿问题进行了相关探讨。

郑海荣

中国科学院深圳先进技术研究院

郑海荣教授的报告题目是“基于物理驱动的机器学习方法的磁共振成像”。近年来机器学习方法广泛应用于医学成像，磁共振成像（MRI）是临床诊断的常用成像方式，也是科学研究的热点。与自然图像的恢复不同，基于机器学习的磁共振成像方法涉及特殊的领域知识，比如Fourier编码，多对比度和多层面等，这些问题亟需结合数据驱动的方法来解决。郑海荣教授在报告中将引入基于物理驱动的机器学习方法来实现快速智能的磁共振成像，这将涵盖学习理论，成像电子学及不同成像的应用场景。郑教授在报告中提出很多开放问题，这将对于可靠和可解释性的医学成像系统的未来研究至关重要。

韩德仁

北京航空航天大学

韩德仁教授的报告题目是“Stochastic Alternating Structure-adaped Proximal Gradient Descent Method with Variance Reduction for Nonconvex Nonsmooth Optimization”。韩教授针对分块优化问题，基于随机优化问题中现行的方差降低梯度估计，提出了一种交替结构的自适应随机梯度下降算法s-ASAP，并将其应用在图像处理的实际问题中。该研究严格证明了s-ASAP方法的次线性收敛性，并在一定条件下证明了其线性收敛性。

王筱平

香港中文大学（深圳）、深圳市大数据研究院

王筱平教授的报告题目是“Recent Progress on Topology Optimization”。王教授介绍了拓扑优化方面的最新进展。拓扑优化是一种根据给定的负载情况、约束条件和性能指标，在给定的区域内对材料分布进行优化的数学方法。随着原材料成本的增加，非常有必要从早期阶段对机械零件的设计进行优化。拓扑优化可以广泛应用于金属3D打印、增材制造等工业技术中。针对线性弹性、流体网络和多孔介质问题，王筱平教授开发了基于阈值动力学方法的拓扑优化新方法。该方法具备操作简单、效率高、鲁棒性强等优点。

Nikos Sidiropoulos

弗吉尼亚大学

Nikos Sidiropoulos教授的报告题目是“Tensors in Statistical Learning and Combinatorial Optimization”。Sidiropoulos教授以他近期的一些研究工作为基础，向大家介绍了运用低秩张量模型来解决概率论、密度函数估计、监督型学习和组合优化中问题的方法与思路。在报告中，Sidiropoulos教授以朴素贝叶斯模型为例，阐述了通过边际分布函数来估计高维分布函数的可行性。此外，Sidiropoulos教授还分享了一些在建立低秩张量模型与组合优化间联系的进展与思考。

Asu Ozdaglar

麻省理工学院

Asu Ozdaglar教授的报告题目是“Independent Learning Dynamics for Stochastic Games: Where Game Theory Meets Reinforcement Learning”。Asu Ozdaglar教授介绍了博弈论与强化学习方面的最新进展。强化学习在人工智能中有着广泛的应用，例如围棋游戏、自动驾驶和机器人等，这些应用涉及多个智能体。然而，传统的强化学习框架不适用于多智能体学习，因为它假设智能体的环境是稳定的，且未考虑适应其他智能体。针对动态环境中多智能体强化学习的随机博弈，Asu Ozdaglar教授开发了独立动态学习方法。在该方法中，每个智能体都能独立地选择对其他智能体的最佳响应动作，无需与其他智能体进行协调。该方法可以保证零和以及相同兴趣的场景设置中随机博弈的收敛性，有效解决了传统强化学习框架无法适应多智能体学习的问题。

李纯明

电子科技大学

李纯明教授的报告题目是“Knowledge Based Medical Image Segmentation and Related Issues”。李教授的报告侧重于医学图像分割，并介绍了一系列基于知识的医学图像分割以及用于灰度不均匀性校正的相关数学模型和算法。这些方法具有坚实的理论基础，数学模型和算法简洁透明，具有理想的可解释性。他们的实验结果也验证了这些算法的有效性和分割精度的优势。

黄绍伦

清华-伯克利深圳学院

黄绍伦教授的报告题目是“Distributed Hypothesis Testing Over AWGN Channels“。黄教授的报告研究了AWGN信道中的分布式假设测试问题。为了解决计算问题，他建议关注编码方案基于经验分布而不是原始数据。在这种公式下，他进一步提出了一种基于解码和转发混合的编码策略，其中可实现的检测误差指数可以通过信息几何来表征和解释。此外，他还证明了这种可实现的误差指数的最优性。最后，他描述了实现最佳误差指数所需的功率量。

陈景东

西北工业大学

陈景东教授的报告题目是”Array Design and Processing for Acoustic Signal Acquisition and Reproduction"。陈教授介绍了声学信号处理的特点和基本方法。尤其是系统地讲解了声学信号波束成型的方法，对比雷达信号处理和无线通信中的束成型技术进行了详实的分析。

Yonina Eldar

魏茨曼科学研究所

Yonina Eldar教授的报告题目是“Model Based Deep Learning: Applications to Imaging and Communications"。Yonina Eldar教授介绍了基于模型的深度学习方法。具体讲解了该领域的两种技术路线，展示了该种方法在无线通信，超声波诊断，图像超分辨率等领域的应用以及绝佳的使用效果。

陈兵龙

中山大学

陈兵龙教授的报告题目是“复几何中的双曲线”，本次演讲讨论复杂几何中各种双曲性的概念，陈教授重点从拓扑学的角度介绍了他们最近的工作。陈教授首先从Kahler 双曲率、Kobayashi 双曲率、等周不等式以及径向等周不等式等几何基本定义深入浅出地进行讲解，最后详细地解释了主要径向等周不等式定理以及证明思路。

赵鼎

卡内基梅隆大学

赵鼎教授的报告题目是”值得信赖的强化学习”，本次演讲讨论强化学习(RL)在交通、制造、安全和医疗保健等应用中的巨大潜力，以及其快速发展中伴随着的风险隐患。在这次演讲中，赵教授从三个方面概述值得信赖的强化学习：鲁棒性、安全性和泛化性。赵教授介绍每个类别的分类、定义、方法和流行的基准测试，也分享了他在研究和实验过程中的经验教训和对未来研究方向的展望。

张纵辉

香港中文大学（深圳）、深圳市大数据研究院

张纵辉教授的报告题目是“z-SignFedAvg: 一种统一的基于随机符号的联邦学习压缩“，本次演讲主要讨论联邦学习现阶段的优缺点，并且探讨针对其在训练大规模机器学习模型时通信成本高的问题，张教授团队提出的新的联邦学习压缩算法。张教授介绍，其团队提出了一种新的噪声扰动方案，该方案具有一般对称噪声分布，用于基于符号的压缩，不仅可以灵活地控制梯度偏差和收敛性能之间的权衡，而且还为现有的基于随机符号的压缩方法提供了统一的处理视角。另外，该团队提出了第一个基于符号的FedAvg算法(z-SignFedAvg)。从理论上讲，z-SignFedAvg实现了比现有的基于符号的方法更快的收敛速度，并且在均匀分布的噪声下，可以享受与未压缩的对应方法相同的收敛速度。

最后，深圳市大数据研究院执行院长李平博士和院长罗智泉院士进行了会议闭幕致辞。

深圳市大数据研究院执行院长李平博士表示，MIIS会议是深圳市大数据研究院最核心的国际学术会议之一，我们期望能为全球的学者、工程师等搭建一个学术交流的平台，建立紧密的联系，共同推动大数据学科的发展。同时也感谢所有为这次会议作出努力的朋友，包括协办单位伙伴、袁亚湘院士、会议组织工作人员、听众朋友等。

罗智泉院士提到，MIIS会议于2012年由西安电子科技大学举办，从北京到深圳，已流转了11个年头，未来深圳市大数据研究院将继续秉承办会的宗旨，不断前进。