北京通用人工智能研究院BIGAI

朱松纯团队研究成果登上Science头条!为机器立“心”迈出重要一步!

今日(7月14日),国际顶级学术期刊发表了朱松纯团队(UCLA袁路遥、高晓丰、北京通用人工智能研究院郑子隆、北京大学人工智能研究院朱毅鑫等作者)的最新研究成果——实时双向人机价值对齐 Bidirectional human-robot value alignment。论文同时被Science官网和Science Robotics官网头条刊登。

论文地址:https://www.science.org/doi/10.1126/scirobotics.abm4183

本论文提出了一个可解释的人工智能(XAI)系统,阐述了一种机器实时理解人类价值观的计算框架,并展示了机器人如何与人类用户通过实时沟通完成一系列复杂人机协作任务。朱松纯团队长期从事可解释人工智能相关工作。此文是团队第二篇发表在 Science Robotics 的关于可解释人工智能的论文。这项研究涵盖了认知推理、自然语言处理、机器学习、机器人学等多学科领域,是朱松纯教授团队交叉研究成果的集中体现。

为机器立“心”,实现“小数据,大任务”范式的重要一步

当今广泛应用的人工智能系统是一种被动的智能,只能机械地按照人类给定的任务行事,缺乏像人类一样的认知和推理能力,更缺乏像人类一样的情感和价值观,在缺“心”的情况下,人工智能很难理解人类的意图、执行人类真正在意的价值需求,自然也就难以获取人类的信任、难以融入人类社会。  

在发现“大数据,小任务”范式自身存在的局限性之后,朱松纯教授研究团队转换赛道,致力于“小数据、大任务”范式的探索。“大任务”的核心是让人工智能系统按照人的方式自主定义任务,而人定义任务是从自身的价值需求出发,因此为机器立心,让人工智能学会人的价值函数便成为了“小数据,大任务”的核心工作。

此次研究成果的发布,标志着人工智能系统具备了在实时交流中学习人类价值函数并实时对齐当前人类价值目标的能力,是为机器立心,实现“小数据,大任务”范式的重要一步。

读懂价值:为机器立“心”

近年来,一系列研究表明:高效的人机协作依赖于团队之间拥有一致的价值目标,以高效地建立整个团队对任务的共识。这就要求机器能够通过与人的有效沟通来完成协作,即每个成员都要推测队友的价值需求,并尽最大可能向队友展示自己当前的价值需求。同时,人类也要为AI提供反馈,逐渐地教会AI理解自己的价值目标。这个人机价值目标逐渐统一的过程被称为价值对齐,在这一过程中AI获得了人的价值函数成为了有“心”的机器。

本文作者北京通用人工智能研究院郑子隆研究员表示:“生活中很多任务是无法清晰地描述或者难以直接表达的。例如,当一个家境普通的人去购物商城买衣服,售货员挑了一件款式、面料和颜色都不错的衣服,但是他一问价格是4000,他对售货员摇摇头说不合适,售货员又挑选了一件各方面还不错的衣服,他再问价格是5000,他又摇了摇头;这时售货员好像猜到了什么,拿了一件款式、面料和颜色接近的衣服,但是只卖800,这时他点了点头说可以。这时售货员就做到了“察言观色”,读懂了这个人买衣服背后的一个价值需求:衣服不要太贵。所以,在不同场景下,确保人工智能系统能够快速准确地识别用户的价值目标、和人类的价值实时双向对齐,成为了人机协作的一个重要基础,我们的研究团队在这一难题上取得了突破。”

实现自主智能,打造“AI大白

在科幻电影《超能陆战队》中,有一个“大白”智能陪伴机器人,“大白”可以陪电影男主角一起学习、玩耍、做游戏,具有很高的实时互动性。而当电影男主角情绪失落时,“大白”还能“读懂”他的情感价值需求,主动安慰,给一个大大的拥抱。

“大白”其实是一个很智能的通用智能体。朱松纯团队所在的北京通用人工智能研究院,联合北京大学人工智能研究院等单位,致力追寻人工智能的统一理论与认知架构,实现具有自主的感知、认知、决策、学习、执行和社会协作能力,符合人类情感、伦理与道德观念的通用智能体。

本研究提出了一个基于即时双向价值对齐模型的可解释人工智能系统。在该系统中,一组机器人通过与人类的即时交互并通过人类的反馈来推断人类用户的价值目标,同时通过“解释”将其决策过程传达给用户,让用户了解机器人做出判断的价值依据。此外,该系统通过推测人类的内在价值偏好,并预测最佳的解释方式,生成人类更容易理解的解释。研究团队经过一系列实验验证了所提出的计算框架。实验结果表明,该学习模型可以在复杂协作任务中提高人机协作的效率,进而提升人机信赖关系,实现真正的自主智能。本研究从传统AI数据驱动转变为价值驱动,让XAI系统理解了人类价值观,做到了为机器立,朝着实现“小数据,大任务”范式的通用人工智能迈出了一大步。

Facebook
Twitter
LinkedIn
Email