今日,由科技部、国家发展改革委、工业和信息化部、国务院国资委、中国科学院、中国工程院、中国科协、北京市政府共同主办“2023中关村论坛前沿科技与未来产业展”于中关村国家自主创新示范区展示中心圆满落幕。
在展览期间,有两位小朋友正在人工智能板块的一块触摸屏面前聚精会神地作答IQTest题目,测试的题目从易到难,想要取得高分并不容易。这正是北京通用人工智能研究院在本次展览重点展出的项目之一:“IQTest通慧模型”。
两位小朋友正在一块触摸屏面前聚精会神地作答IQTest题目
“通慧模型”超越深度学习大模型:战胜人类“最强大脑”
研究“通用人工智能”在某种程度上等价于研究“人”,因此,以衡量人的智商水平为出发点和参考标准来衡量AI模型的能力就显得尤其重要。为此,北京通用人工智能研究院研发了一个具有人类认知推理能力的模型——“通慧模型”,该模型能够使用小数据来理解IQ测试中隐含的时空因果关系,并学到背后的数理逻辑推理等认知能力。
图释:“通慧模型”与深度学习大模型的区别
该模型在IQ测试中超过了深度学习大模型,也战胜了来自国内顶尖学府学生的“最强大脑”,是“小数据大任务”范式的一个成功案例,离通用人工智能又迈进了一步。
图释:“通慧模型”与深度学习大模型和学生的比赛现场
图释:随机生成的三道IQTest题目
图释:“通慧模型”与不同人群以及其他大模型在IQ测试中的得分对比
通慧模型是一个原型和底座,未来人们可以基于通慧模型研发新的模型来解决涉及到复杂逻辑推理的海量任务,例如解决自动驾驶场景中复杂动态环境下的推理和决策任务。
而在当下,通院已经将通慧模型背后展现的认知推理能力迁移应用到了具身智能机器人上面。
构建具身智能机器人:由价值驱动实现“自主智能”
研究具身智能(人工智能结合机器人的应用)具有重要意义。人对世界的 “知” 是建立在“行”的基础上的,通用智能体想要真正进入物理场景和人类社会,其关键在于置身于真实的物理世界和人类社会中,只有这样它们才能切实了解并习得真实世界中事物之间的物理关系和不同智能体之间的社会关系,从而做到像人一样“知行合一”。
北京通用人工智能研究院首创地将机器人与操作对象进行整体运动学建模,并将通用人工智能的自主智能认知与决策架构应用在具身智能(机器人)平台上,这套认知架构整合了计算机视觉、认知推理、机器学习等多领域的能力,实现了场景理解、物体识别、意图识别、任务规划、运动规划等综合能力。
图释:具身智能机器人能够实现场景理解、识别人的意图
该机器人在平台移动、机械臂运动、物体抓取三个核心动作的协调度和流畅度方面达到世界先进水平,大大拓展了机器人对复杂室内环境的适应性,并提高了长步骤任务中规划方法的通用性与可扩展性。
图释:具身智能机器人实现了柜门、机械臂、底座三者的协调运动
该机器人背后的技术可应用于多种具身智能平台,使具身智能体由价值驱动,在几乎不受人为干预的情况下,自主完成日常生活中的复杂操作任务,做到像人一样“眼中有活”、自主规划和主动帮助,为将来实现通用智能体打下了坚实的基础。该技术使得机器人在将来可以真正进入到千家万户服务人类,还可为恶劣环境作业任务和大规模灾害救援等任务提供广泛的应用前景。
未来,通院将继续面向国家重大战略需求,布局“通用人工智能”这一最前沿科技,以原创的哲学思想作为指导,以有组织科研的方式组建大团队开展科研攻坚,探索智能“暗物质”,实施“小数据、大任务”范式等原创的技术路线,力争在通用人工智能前沿基础理论、关键算法、创新应用方面产生颠覆性的技术和原创性的科研成果,支撑人工智能产业发展,服务社会重大需求。