siat.cas.cn  
研究方向
 
您当前所在位置:首页 > 机构设置 > 科研部门 > 集成所 > 研究单元 > 多媒体集成技术研究中心 > 研究方向
研究方向  
 

快速图像去雾

提出基于插值引导滤波的快速图像和视频去雾,速度提升10倍以上,利用单核CPU实现对1024×768以内的视频的实时去雾处理。

    

 

跨年龄跨模态人像识别

跨年龄人像识别算法在MORPH Album 2(国际上最大的跨年龄阶段人脸数据集)上达到93.5%(第一识别率),在国际最大的素描-照片数据库上和光学红外数据库上均达到世界领先的识别率(前者大于97%;后者大于85%)。研制的初步模型已经在广州市公安局组织的广州地铁动态测试(真实场景下的视频监控的人脸测试)中取得令人满意的结果。

 

                                          跨年龄阶段人像识别                                 跨模态人像识别(左素描-照片;右光学红外)

 

人脸年龄与属性估计

 研究团队开发了基于二值化编码与维度选择的快速人脸属性识别。同时开发正交高斯回归的人脸年龄估计算法,在MORPH数据库误差<4.2岁,在FGNET数据库上误差< 4.8岁,均位居国际前列。

                                                                基于二值化编码与维度选择的快速人脸属性识别

三维物体重建与检索

研究复杂线画图的拆分重构方法,提出基于贝叶斯学习的图元匹配方法、人造平面物体对称性检测算法等,大大提高了对于复杂线画图重构的稳定性和准确性。 并开发了基于学习语义属性的三维物体检索方法。

        

 

场景快速分类

 提出区域共生特征用于场景和纹理分类,在多个大规模数据Labelme, UIUC-sports, Scenes-15,MIT-indoor,SUN上取得世界领先的识别率,且其速度快,可以用30ms处理256x256的图像。

场景文本检测

提出基于卷积神经网络场景文本检测方法,在ICDAR05 和ICDAR11数据库上取得世界领先的结果 。

    

 

复杂场景下行人检测

引入深度学习方法,复杂场景下行人检测精度达世界领先水平,在Caltech, ETH等数据集上较当前最好方法相对错误率降低5%以上。

  较其它新发表方法误差率降低百分比

多视角超向量

提出融合多种局部特征的新型图像和视频表方法,利用混合概率CCA模型分解不同类型特征的共享和独立部分,成果论文被CVPR 2014录用为Oral,录用率5.75%.

 

视频中人的姿态检测

提出Dynamic poselet模型用于视频中人的姿态检测,在MSR-II和JHMDB上取得远超传统方法的结果。

智能编辑技术

a)物体切割

在图像切割中我们采用一个简单的交互式算法来实现对物体的切割。扩展到视频切割中,我们采用object propagation model(OPM)将关键帧中物体的切割结果扩展到其它帧上。

 

                                    交互式图像切割                                                             视频切割

b)多媒体场景合成

本项目目标是精确的将图像或视频中的物体精确抠出并计算透明度,从而实现背景替换等特效。

c)物体抹去

我们采用运动估计的方法,建立起帧间对应点的联系,并通过加速使计算时间大为缩短。

d)内容重构

图像内容重构是指对图像中内容进行或者场景进行重排、内容复制或者给予内容的不失真图像尺度变换。采用图像块贴补方式,并使用多层置信传播算法进行优化。