1月28-29日,“迈向通用人工智能前沿科技成果展”(以下简称“成果展”)成功举办。
北京通用人工智能研究院(以下简称“通研院”)呈现了在通用人工智能领域产业融通的实践,特别是在具身智能体、技术赋能平台、AI赋能场景应用等方面,为助力北京市建设国际科创中心与全球人工智能创新策源地积蓄力量。
01
聚焦科技创新需求,以具身智能体打开人工智能产业新空间
具身智能是通往通用人工智能的关键钥匙。通用智能体想要真正进入物理场景和人类社会,其关键在于置身真实的物理世界和人类社会中,切实了解并习得真实世界中事物之间的物理关系和不同智能体之间的社会关系。在本次成果展上,由通研院打造的“眼里有活”具身智能机器人,依托在计算机视觉、自然语言处理、认知推理、机器学习等方面的能力,将具身智能技术赋能在机器人上,使具身智能机器人拥有感知、认知、决策和行动能力,并可根据所处的复杂动态环境自主产生并完成任务。未来有望做到无需交互,自主识别需求执行任务;根据环境变化调整行动策略;实现多智能体任务协调。可被应用于智能家居、智能制造、康复疗养、特种任务、危险场景作业等多种场景中。
图|人形机器人
人形机器人是实现具身智能的最佳形态之一。聚焦人形机器人的研究,通研院有着深厚的积淀,并在本次成果展现场展示了人形机器人与高密度触觉灵巧手。其中,人形机器人具备在复杂环境下鲁棒行走的能力,能够进行手脚协调的全身运动。高密度触觉灵巧手作为基于光学触觉感知技术自主研发的高自由度仿真机器手,实现了空间分辨率小于0.1mm接触表面纹理和接触时法向力与切向力的感知,丰富了机器人在抓取和操作任务中的多模态感知能力。高密度触觉灵巧手可以做到基于物理常识的抓取姿态生成算法,产生抓取策略;实现对物体的抓、拿、放等多种交互动作;可对柔软物体及易碎物品实现柔性抓取。可在未来应用于医疗服务、智能家居、康复养老、危险场景作业等场景中。
02
结合市场应用导向,以前瞻技术为搭建一流创新平台赋能
迈向通用人工智能时代,从虚拟到真实场景应用、从技术研发到产业规模化落地,这一路的演化离不开开放协同的科研生态。为此,通研院打造了通用人工智能科研平台“通境”(TongVerse),作为“AI+机器人”仿真练武靶场,通境支持多类型机器人(人形机器人、复合协作机器人)技能训练。通境已被应用于“第二十六届中国机器人及人工智能大赛人形机器人创新挑战赛”为人形机器人训练等提供支持。除了应用于科研、赛事,通境还将面向智能制造、特种行业等需求,提供多场景、多任务的机器人应用解决方案。
图|智慧司法判决辅助平台“通鉴”
在成果展现场,通研院与北京大学联手带来了智慧司法判决平台“通鉴”。通过构建高效司法模拟系统,覆盖大规模专业司法案例知识库,通鉴能够结构化显示案情和裁判依据。在基于案件要素的法条抽取中,通鉴的相关法条抽取召回率优于当前大模型结果。在基于法条逻辑的决策推理方面,通鉴可自动生成可解释、强推理的逻辑链条。做到人工智能预测量刑结果可解释和可溯源,能够在智慧法庭、法律咨询、案件管理、诉讼支持等方面,帮助相关人员进行分析决策。经过大规模的案例测试,通鉴在各个模块上表现优异。
在成果展“音乐人工智能与新艺术形式探索 通感同心共振”展区,通研院、北京大学与阿里妈妈携手合作打造交互式人工智能音乐,以人工智能前沿理论及关键技术进行无版权音乐生成。研究团队通过建立Music AOG模型,跨模态生成可解释、可操控、可交互的音乐与视频配乐,使生成的音乐具有局部可控性,且能够与人类创作者的情感认知和审美对齐,推动人工智能音乐更好应用于不同艺术形式配乐、文娱影视音乐创作、短视频平台音乐生成、游戏等领域。
图|“音乐人工智能与新艺术形式探索 通感同心共振”展区
03
盘活科技创新要素,以新质生产力为场景应用拓土
人工智能是新质生产力重要的驱动。通研院通过对人类认知架构、心与理(UV)双系统的数理解构,剖析感知、认知、决策、价值等所产生的机理,研究人类社会演化的动力学方程式,从而为智能社会治理赋能。
基于这样的构想,通研院在成果展上展示了用于社会智能决策的文明模拟平台。依托人工智能、VR、大数据等技术,通过构建UV动力学模型,模拟个体与社会的相互作用,可以探索各种社会组织与机构的形成,社会分工与经济社会模式的演化,能够为人文社科、跨学科研究提供开放的验证实验平台,提高社会治理的智能化、科学化、精确化水平。
图|用于社会智能决策的文明模拟平台
✦✦✦
未来,在共同的目标下,通研院将与学界、产业界共同携手,不断培厚创新土壤的同时,创造更好的生态环境,推动产业数智化转型。