北京通用人工智能研究院BIGAI

「通用人工智能讲座系列」针对物理信息系统的安全性、效率和弹性的学习、控制方法

报告简介

普适传感、通信和计算技术的迅猛发展已经在机器人和自主系统、智能电网、航空航天和智能城市等各个领域中彻底改变了物理信息系统(CPS)和物联网(IoT)。将基于学习的方法融入CPS的控制中能为AI系统带来巨大机遇。然而,当前的决策框架缺乏对通信、学习和控制之间三向关系的全面理解,这给在复杂和动态环境中运行的多智能体系统的研究带来了挑战。为了解决这些问题,在演讲的第一部分中,我们着重介绍利用通信能力进行学习和控制的信息共享方法。我们首先介绍了一种多辆互联的自动驾驶车辆(CAV)协同感知的不确定性量化方法。我们的研究结果表明,多个智能体之间的通信可以提高目标检测准确性并降低不确定性。在此基础上,我们开发了一种安全可扩展的深度多智能体强化学习(MARL)框架,利用智能体之间的共享信息来提高系统的安全性和效率。我们验证了通信在MARL中的益处,特别是在具有挑战性的混合交通场景中的CAVs的情况下。为了激励智能体进行通信和协调,我们设计了一种基于Shapley值的稳定高效的MARL奖励重新分配方案。此外,我们还针对状态不确定性(如感知模块中的不确定性量化或最坏情况对抗性状态扰动)对MARL方法的鲁棒性进行了理论分析。在演讲的第二部分,我们简要概述了在自主载客出行(AMoD)系统和可持续出行方面的数据驱动鲁棒优化研究,并着重介绍了我们在CPS安全性方面的研究成果,并提供了我们在学习和控制领域正在进行的工作的见解。通过我们的研究结果,我们旨在推动AI增强型CPS在动态环境中实现更安全、高效和具有弹性的系统。

主讲人简介

苗菲博士自2017年起,任康涅狄格大学计算机科学与工程系和电气与计算机工程系助理教授,并隶属于先进系统工程研究所和Eversource能源中心。她将于2023年秋季晋升为终身教授。她曾于2016年至2017年在宾夕法尼亚大学的GRASP实验室和PRECISE实验室担任博士后研究员。她于2016年获得宾夕法尼亚大学电气与系统工程领域博士学位,并获得最佳博士学位论文奖,同时获得统计学双学位硕士学位。她于2010年获得上海交通大学自动化学士。她的研究重点是多智能体强化学习、鲁棒优化、不确定性量化和控制理论,以解决网络物理系统的安全性、效率、稳健性和安保挑战,适用于互联自动驾驶车辆、可持续和智能交通系统等系统 、智能电网和智能城市。 苗菲获得了NSF career award和其他几个奖项。分别于2021年和2015年第12届和第6届ACM/IEEE物理信息系统国际会议(ICCPS)获得最佳论文奖和最佳论文入围奖、23年AAAI DACC研讨会最佳论文奖。

Facebook
Twitter
LinkedIn
Email