通讯员张平媛 记者刘万生 1月18日,大连理工大学电子信息与电气工程学部孔祥维教授团队进行的视频分类实验,它可应用于社会事件分类,在反恐防暴中让极端分子没有“藏身之所”。以此技术为基础,该团队成员硕士研究生郭君研发了模式分类领域全新分支,相关研究成果被第30届美国人工智能协会年会(The AAAI Conference on Artificial Intelligence,简称AAAI)正式录用为大会口头报告。利用50余种常见的社会事件作为基础,通过不同场景、人物等变化,形成6000余部人类行为视频。坐在电脑前,输入一段未知小视频,敲上代码……无论经过任何修饰与伪装,都“无所遁形”,计算机会在60秒内显示结果:视频中的人在做什么事一目了然。
该研究成果应用于模式分类场景下的判决解析型字典学习算法。模式分类是人工智能系统面对纷繁复杂的数据时,从中提取出有意义信息时所采取的关键处理步骤。以视频分类为例,模式分类的任务就是找出某“类”事物的“本质属性”,即所有成员的共同性质。
据了解,在模式分类中,稀疏字典学习已成功应用于基于视频、图像、语音等的许多任务中,然而,这些方法都集中于综合型字典学习的框架。作为字典学习的另一个主要分支,解析型字典学习却因为其判决力较低而没有在模式分类应用中被完全开发。
本项研究成果提出了一种判决解析型字典学习算法,极大地提升了解析型字典学习在模式分类场景下的判决力。应用此方法不仅能显著提高解析型字典学习的判决力,其性能也比其它前沿的综合型字典学习方法好。这也改变了解析型字典学习在模式分类应用中被长期弃用的状态,开辟了模式分类领域一个新的研究分支,为人工智能系统通过模式分类处理大数据提供了新的技术支撑。
以上研究受到国家自然科学基金青年项目、面上项目及创新研究群体项目的联合资助。