2026年4月9日上午,九章学术讲堂第41期在海天苑大楼E101会议室成功举办。西安电子科技大学数学与统计学院教授、博士生导师贾西西应邀担任主讲嘉宾,作题为“Globally Q-linear Gauss-Newton Method for Overparameterized Non-convex Matrix Sensing”的学术报告。学院10余位师生参会,会议由彭江军副教授主持。

报告中,贾西西教授围绕过参数化非凸低秩矩阵感知问题的优化方法展开深入讲解。该问题不仅是统计学习与信号处理中的基础问题,同时在深度学习优化中也具有重要理论意义。针对传统方法的局限性,贾教授指出:一阶方法(如梯度下降)虽然计算简单,但在非凸优化中往往受到大量鞍点影响,尤其在病态问题或过参数化情形下,算法容易被鞍点吸引,导致收敛速度显著下降;而通过加入随机扰动来“逃离”鞍点的方法,又面临扰动幅度难以合理设定的问题,实际效果不稳定。
基于此,报告重点介绍了一种近似高斯-牛顿(AGN)算法。该方法在每一步迭代中具有与梯度下降相当的计算复杂度,但通过引入近似二阶信息,使算法在鞍点附近仍能保持显著的下降幅度,从而避免被鞍点吸引。理论分析表明,即使从随机初始化出发,该方法也能够实现全局Q线性收敛,其收敛速度不受问题条件数影响,相比现有方法具有明显优势。贾西西教授还从理论上分析了不同算法在鞍点附近的行为差异:梯度下降及其改进方法在鞍点附近的下降幅度随扰动趋近于零,而AGN方法则能够保持与误差无关的稳定下降,从机制上解释了其快速收敛的原因。
讲座内容紧扣非凸优化理论前沿,系统展示了二阶方法在复杂优化问题中的潜力。报告结束后,现场师生围绕算法设计思想及其在深度学习中的应用前景展开了深入讨论,学术氛围浓厚。与会师生就非凸优化方法在实际问题中的理论性质与应用潜力进行了积极交流,例如在过参数化非凸矩阵分解框架下,若进一步引入稀疏性、平滑性等结构化正则项,是否仍能够保持良好的优化几何结构和收敛性质;同时,针对当前高维数据分析中的需求,部分师生还探讨了该类非凸矩阵分解方法向张量分解模型推广的可能性,以及在多维数据恢复和高维结构学习中的潜在应用。贾西西教授对相关问题进行了耐心细致的解答,并分享了该方向的最新研究进展,使在场师生受益匪浅。本次讲堂的举办进一步促进了优化理论与机器学习领域的学术交流,拓宽了师生的科研视野。
文/图:彭江军/审核:都琳


英文


微信二维码