6月21日,由中国科学院自动化研究所(以下简称自动化所)南京人工智能芯片创新研究院主办的“决策智能与计算前沿论坛”在南京召开。中国科学技术大学教授李厚强、南京大学教授俞扬、西安交通大学教授柯良军,华为诺亚方舟实验室郝建业以及自动化所研究员兴军亮等学者,聚焦机器博弈、智能博弈、多智能体博弈、“强化学习如何走出游戏”等分别发表主旨报告。
李厚强在报告中分享了他们在机器博弈的博弈论、强化学习和多智能体三个方向上分别取得的成果,提出未来机器博弈将会向强化均衡、终身学习、可解释性等方向发展;俞扬认为强化学习走出游戏的难点在于真实世界的场景有限、试错成本高、样本效率低等,提到基于环境模型的强化学习被认为是有望解救强化学习样本效率低下的主要途径;柯良军则从数学模型角度分别对单智能体与环境博弈问题、大小规模疆土守卫问题进行讲解,并提出采用全局深度强化学习,局部博弈论是未来的发展趋势。兴军亮与郝建业分别围绕如何从低质量的数据中学习出高水平的决策模型、深度强化学习所面临的挑战及相应的解决方案等主题展开报告和研讨。
据介绍,“决策智能与计算前沿论坛”旨在通过邀请该领域的杰出学者和青年英才共同探讨决策智能未来发展的关键前沿理论和技术难题,促进决策智能研究方向纵深发展,推动决策智能科技与人才的交流。
活动中,自动化所副所长、研究员刘成林介绍,自动化所已把自主进化智能作为重点投入、发展和突破的方向,中科院人工智能创新研究院平台上已有约20个团队开展决策智能基础理论、算法、环境、评价、应用等研究。
麒麟科创园管委会副主任韦斌在致辞中表示,麒麟科创园将与中科院自动化所共同建设具备“可评估、可推演、可解释”优势的新型AI重大科技基础设施,并以人才链、创新链、技术链、产品链、产业链和资本链的智能产业“雨林模式”为发展核心,聚焦基础理论创新和核心关键技术突破,构建产业技术与应用生态,打造产业新型智库,形成产业人才高地。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。