基础前沿研究

智能视觉感知

 

视觉感知是人类通过视觉和大脑来对周围环境和物体的空间、色彩、形状及动态进行识别和分析的过程。智能视觉感知是通过软硬件系统来模拟和学习人类视觉感知的能力,并在感知范围和精度上超越人类视觉。视觉数据是人工智能技术处理的主要数据类型,智能视觉感知是人工智能技术最成功的应用和突破领域之一。

 

 

目前工作及展望

 

(1)可解释的视觉感知

开展基于视觉图像的深度神经网络的可解释理论研究,为深度神经网络模型推荐、网络泛化能力分析与性能衰减预测、工程应用适应性验证与超界预警提供理论支持。构建基于图卷积神经网络的视觉图像识别框架,应用图理论分析网络节点、层级、连接函数等对识别结果的影响和评价,提高学习网络的可解释性。

 

(2)实时的视觉感知

很多场景对视觉感知的实时性有着很高的要求,需要完成核心视觉感知环节的算法嵌入式开发,能够在芯片端完成视觉感知算法的边缘计算,满足应用领域对于视觉感知实时性的要求。

 

(3)可迁移的视觉感知

针对不同应用领域视觉感知目标样本库不足的问题,分析已有样本库视觉数据与特殊应用领域视觉数据各自的特点,设计迁移学习策略,构建适合多类型视觉数据的通用深度学习框架,应用对抗生成网络来解决特殊领域视觉数据样本的不足的问题。

 

 

 

联系人:朱强   zhuq@zju.edu.cn