学术报告之三十八：具有确定性全局最优保证的新一代机器学习训练算法-信息工程学院(人工智能学院)

学术报告之三十八：具有确定性全局最优保证的新一代机器学习训练算法

发布日期：2023-05-06浏览次数：

报告题目：具有确定性全局最优保证的新一代机器学习训练算法

报告人：花开勋南佛罗里达大学助理教授

报告时间：2023.5.12（星期五）16：00-17：00

报告地点：信息工程学院（人工智能学院）三楼报告厅

主办单位：信息工程学院（人工智能学院）、江苏省知识管理与智能服务工程研究中心、科学技术处

欢迎大家参加!

个人简介：花开勋目前是加拿大不列颠哥伦比亚大学应用数学研究院和化学与生物工程系的博士后。他将于2023年秋天入职南佛罗里达工业与管理系统工程系，担任助理教授。他的研究重点是利用可聚类性表示和确定性全局优化算法来建立可扩展的可信机器学习系统。他于2019年在马萨诸塞大学波士顿分校获得计算机科学博士学位，师从Dan A. Simovici教授。在此之前，他分别于2013和2012年在康奈尔大学和上海交通大学获得系统工程硕士以及电子计算机工程学士学位。

报告摘要：由于许多机器学习问题（如聚类、决策树和神经网络）所具有的NP-难性质，当前的一个主要的观点是，求解机器学习问题到全局最优在计算上是难以实现的。基于此，实践中的主流方法大多基于启发式或局部优化算法，以产生次优的解决方案。另一个普遍的观点是，在大数据时代，那些具有较强可解释性的简单模型（如决策树）无法具有与黑箱模型（如神经网络）相同的预测能力。本次演讲中，我们提出一种新的训练框架，它在理论上对大规模机器学习问题具有确定性的全局最优保证。我们的算法在两个典型的机器学习任务上，即基于中心点的聚类（centroid- based clustering）和稀疏决策树（sparse decision tree）, 说明了它的有效性。在百万和千万级数据集上的实验结果表明，我们的训练框架挑战了上述两个传统机器学习观念，并得出以下结论。1）通过对问题结构的检测，训练大规模机器学习问题到确定性全局最优在计算上是可行的。2）在大数据集上，当训练获得全局最优时，可解释模型的泛化性能可以得到显著提高。

信息速递