版权信息
省级大型综合性科技类期刊
主管部门:自治区科技厅
主办单位:自治区科学技术信息研究院 
协办单位:自治区科学技术情报学会
编辑出版:科技期刊编译室
刊社地址:呼和浩特新城西街149号本刊杂志社
邮政编码:010000
电      话:0471-2536371

E-mail  :

nmgkjzz@vip.163.com 

网站地址:www.nmgkjzz.com


往期杂志
当前位置: 首页>往期杂志>详细介绍

基于asm算法上的归一化改进

时间:2016-05-03来源: 作者: 点击: 569次


陈 爱斌 ,李 婷

(中南林业科技大学计算机信息与工程学院,湖南长沙 410004)

  要:针对人脸识别(asm算法)中的一些不足之处,提出自己的观点和看法,并给出相应的解决方案。对人脸识别中的归一化问题进行了讨论研究,以几何变换为基础,采用瞳孔定位方法,使用灰度值方法和手工标定来确保瞳孔定位的准确性。本方法在定位过程中更加精确,且无需迭代可一次性完成。实验结果表明,该方法的正确性和一定的实用性。

 

关键词:ASM算法,人脸识别,瞳孔定位,特征提取,procrustes方法

中图分类号:TP399       文献标识码:A

Improved method for normalization based on ASM algorithm

Chen Ai-bin,  Li Ting

(School of Computer and Technology,Central, South University of Forestry and Technology, Changsha,Hunan 410004, China)

Abstract: In view of the face recognition(the algorithm of asm)’s insufficiency,the paper provides my own improvement methods and points.At the same time,it proposes some solution to solve the problem.The study is made on the method used for normalization of human face recognition,which is based on the geometric characteristics.In the improved algorithm,the paper has used the method of pupil orientation and used not only the method of grey value but manual calibration to insure the accuracy of pupil orientation.The method on this paper is more accurate during the process of orientation and can be completed at one time without iteration,The result of experiment proved that,this method has is own accuracy and practicality.

Keywords:active shape model(asm);face recognition;pupil orientation;feature extraction;the method of procustes















人脸识别特指利用分析比较人脸视觉特征信息进行身份识别的计算机技术[1]。在进入21世纪以来,人脸识别更是得到了广泛的改进和应用。然而,在识别的过程中由于人脸的多变性和识别过程中的光照强度、角度以及面部表情差异等方面的影响,使得识别的准确性降低。在人脸识别的算法中,asm算法具有较好的准确性,asm算法不仅可以检测到物体的外轮廓而且可以检测到物体的内部轮廓。

asm[2]的训练过程中的形状归一化时候,一般采用procrustes[3]方法。该方法将一系列的点分布模型通过适当的平移、旋转、缩放变换[4],对其到同一个点分布模型上,从而减少非形状因素的影响。实践证明,该方法是一个很好的方法。但该方法在训练集多的时候消耗的资源大时间长,且这是一个迭代的过程,有可能出现死循环;一般选取第一张人脸进行对齐,如果第一张人脸并不标准,那么将会花费很多时间和精力。本文基于基本的平移旋转和缩放变换,结合瞳孔定位,给出了一种相对于原始的普鲁克算法计算更快速并且保持了原来方法精度的归一化方法。

一.Asm算法简介

Asm是一种基于点分布模型(point distribution model,PDM)的算法。在PDM算法中,可以对物体的形状进行很好的描述,外形相似的物体,可以通过若干关键特征点的坐标依次串联形成一个向量来表示。它可以灵活地改变模型的形状以适应目标形状的不确定性,又可以对目标的形变进行控制使其分布不脱离目标。首先给出一个标定好89个人脸关键特征点的人脸面部图片。


图一:人脸面部图片

Fig 1:human face’s picture

Asm在应用的过程中,包括训练和搜索两个部分,其中在训练的过程中,第一步是需要搜集n个含有人脸面部区域的样本图片,注意在此处并不需要考虑图像的归一化等问题。第二步是手动的记录下每个训练样本中的k个关键特征点以供以后使用,记录其坐标信息并进行保存,第三步是构建训练集的形状向量,即将每个训练集所标定的K个关键点组成一个形状向量:

这样的n个训练样本就变成了n个形状向量,其中表示第i个样本上的第j个特征点的坐标,n为样本的个数。第四步就是利用procrustes方法对这个训练集进行对齐。该算法目的在于对前面手工标定的人脸形状进行归一化或者对齐操作,从而消除一些由于角距、距离、光线、姿势等“非形状因素”的干扰。经过平移、旋转和缩放变换,在不改变点分布模型的基础上对齐到同一个模型(一般是第一个),从而减少非形状因素的干扰。对于每个计算的参数有4个,分别是旋转角度、缩放尺度、水平方向的平移量、垂直方向平移量。每一个训练集向第一个对齐的过程就是使得最小化的过程,其中。其中W为对角矩阵,令表示一幅图像中第K个点和第1个点的距离,表示训练集中不同图像的方差,计算得到:

具体步骤是:

1. 将训练集中的所有人脸模型对齐到第一个人脸模型

2. 计算平均人脸模型

3. 将所有人脸模型对齐到平均人脸模型

4. 重复23直到收敛

procrustes算法的过程可知,它存在着一些缺陷和不足,具体方面列举以下三点:

1. 在训练集多的时候消耗的资源大时间长。

2. 一般选取第一张人脸进行对齐,如果第一张人脸并不标准,将会花费很多时间和精力。

3. 对齐过程可能会不精确,所受影响较大。

二.procrustes算法的改进

在一幅人脸图像中,在标定m个训练集的特征点时候,还可以提取每张人脸的瞳孔(定位点),由于人脸的瞳孔灰度值较低,所以称为最容易准确定位的部分。

1.粗略定位

1.1粗略对人脸图像进行定位,可以使用的方法有基于重心模板的人脸检测方法等,它的精确度将影响以后的效果。

   基于重心模板的人脸检测方法:可以基本上定位出鼻尖的位置,可以设为原点(x0,y0),并以此位置进行瞳孔定位,选取x>x0 , y>y0 的点,在此区域内进行下一步操作,减小下一步二值化处理人脸的范围。本步骤例如:图二(b

           

       (a                          b

图二:人脸检测重心定位图

Figure 2:human facial searching and localization

1.2将图像进行二值化处理,使整个图像呈现出明显的黑白效果,使图像变简单,数据量减小,最重要的是使得眼部区域更加明显,加快匹配速度。二值化处理图像的处理有很多种,这里选取的是基于谷底最小值的阈值方法,该方法寻找双峰的谷底作为阈值,实验结果表明,经过二值化处理的图像匹配准确率更高。对比图如下:

图三:对比图

Figure 3:the comparison picture

1.3由于瞳孔是具有最小灰度值的像素点位置,由上一步得出的结论,在这一步可以非常容易地粗略判断出瞳孔所在位置(基本上眼球已经出来了,但是我们追求更为准确,所以进行下一步的精确定位),此处就不再加赘述。

2.基于hough变换圆检测方法的瞳孔精确定位

     在上一步得出的结论中,人的左右眼是精确的圆形,但是由于各种因素例如睫毛和上下眼皮的存在,会使得眼睛的部分边缘被遮住。此处使用hough变换,这种方法经常被用来进行圆和椭圆的检测,它具有受噪声和边缘间断影响小的优点,因此这个方法是定位精确瞳孔的一种十分有效的方法。

2.1 hough 变换是图像处理中的一种特征提取技术,利用hough变换,hough变换的基本原理在于利用点与线的对偶性,将原始图像空间给定的曲线通过曲线表达形式变为参数空间的一个点,把检测整体特性转换为检测局部特性。圆的方程是:(x-a)^2+(y-2)^2=r^2。

2.2由于前面粗略地定位了瞳孔的位置,提取图像边缘,记录位置信息和方向信息,由于圆的半径一定垂直于圆的切线的直线上,即在圆上任意一点的法线上。同样采用二维的参数空间,对于图像上的每一个前景点,和其方向信息,都可以确定出一条直线,圆的圆心就在这条直线上,这就是我们要找的瞳孔的位置。利用hough变换求得圆心,即为比较精确的瞳孔。这是进行了左眼的瞳孔定位,右眼的瞳孔定位就和它是一样的。Hough变换的图示如图四所示:

图四:Hough 变换(相交中心为圆心)

Figure 5 : Hough transform

  所选取的人脸图像如图五所示:

图五:人脸图像

Figure 5: human faces

 

3.每个训练集的瞳孔定位完成后,每个训练样本有n+2个特征点,其中n个需要手工标定。由于在后面的数据分析过程中,数据是有序的,所以可以对这两类特征点分开采集再合并,以免一次性采集出现差错不好更改。两个眼睛的定位点可以单独进行存放,经过以上步骤得到的人眼瞳孔是较精确的瞳孔位置。与原来一样,将第i幅图定位点表示为:

n=1表示左眼位置,当n=2时表示右眼的位置。

在获取了特征点数据和新的定位点数据之后,通过procrustes的几何变换方法将m个训练样本对齐。接下来在原来的普鲁克算法对齐过程中添加一些步骤。

1.  获取特征点和定位点的平均分布。

2.  利用基于重心模板的人脸检测办法,将每一个训练样本重心平移到原点,对每一张人脸的n个特征点坐标分别减去该人脸重心处的坐标。

3.  通过上面方法找到的瞳孔位置,两个瞳孔的坐标连线可以知道人脸的倾斜角度。

4.校正人脸:

5.缩放变换

   所用参数:

   对于每一幅图:

6.再进行平移变换

三.与原算法的比较

ORL人脸数据库中取出40幅不同的人脸图片作为实验样本,姿势和年龄不相同。与最初的普鲁克算法比较,改进后的算法在准确度、所用时间方面得到了改善,具有更加良好的性能,如图五所示。但本算法也有不足,就是在进行瞳孔定位的时候花费了一些时间,在对于训练集较小的情况下不太适用,这种情况下手工进行标定比较好;但是在训练集大的情况下,手工标定便不实用,会花费很长时间,因此在这里改进的算法在训练集大的情况下会起到比较明显的作用,花费的时间会比较小。由图五可以看出,改进后的Procrustes 算法的精度更高。

图六:精度对比图

Figure 5 : the comparison of accuracy

四.结束语

本文在原来的Procrustes算法上进行了改进,总结出了一种新的可以应用于asm模型上的归一化算法,该方法在训练集比较大的情况下,所用的时间小,具有更好的精度和适用性,可以更好的消除非形状因素的影响。改进后的算法中的瞳孔定位不需要自己手工标定,减少工作量。但不足的地方就是每个训练样本的特征点都需要手工标定,如果训练集过大,虽然瞳孔定位不需要手工标定,但是每个其他特征点仍需手工标定,因此在建立点分布模型上会消耗一定的时间。

 

参考文献/References

[1] 甘早斌,李开,鲁宏伟. 物联网识别技术及应用. 清华大学出版社,2014.

[2] Cootes T F,Taylar C J,Cooper D H,et al.Active shape models their training and applicaton[J].Computer Vision and Image Understanding,1994,61(1):38-59.

[3] Gower J C.Generalized procrustes analysis[J].Psychometrika,1975,40(1):33-51.

[4] 章毓晋. 图像工程(上册):图像处理[M].2.北京:清华大学出版社,2006.

[5] 侯云书,付中华,张艳宁等. 基于改进ASM的人脸特征点提取[J].

计算机应用研究,200611):255-257.

[6] 冯振华,吴小俊. 改进的用于ASM的归一化算法.2009,452

[7] 王胜正,施朝健. 基于两种色彩的颜色选择方法[J]. 计算机应用与软件,2004

21(2:61-67

[8] Cootes T F,Taylor C J,Cooper D H,et al.Active appearance models[C]//Proc of ECCV.1998:231-236

[9] 陶亮,庄镇泉. 复杂背景下的自动人眼定位[J].计算机辅助设计与图形学学报,2003,

15(1):38-42

[10]Kass M,Witkin A,Terzopoulous D.Snakes:ctive contour models[C]//Brady I M,Rosenfield A.Proceedings of the 1st International Conference on Computer Vision.London:IEEE Computer Society Press,1987:259-268

[11]张晓飞,赵瑞莲. 基于Hough 变换圆检测的人眼睛确定位方法[J]. 计算机工程与应用,2005,4127):43-45

[12]徐品,翟静. 基于AdaBoost算法和人眼定位的动态人脸检测[J],电视技术,2011,359):114-117

[13]朱杰,唐振民. ASM与彩色Gabor特征相结合的人脸关键特征点提取[J]. 计算机科学,2010,374):265-268

[14]T F Cootes and C J Taylor. Active shape model search using local grey-level models;A quantitative evaluation, in Proceedings, British Machine Vision Conference,1993

[15]杨杰,张田昊等. 改进的主动形状模型方法在人脸特征点定位中的应用[J]. 上海交通大学学报,2007,41:1320-1323

[16]山时光. 人脸识别中若干关键问题的研究[D]:[博士学位论文]. 中国科学院计算机技术研究所,2004

[17]杨丽敏. 图像特征点定位算法研究及应用[D][博士学位论文]. 上海 上海交通大学,2008

[18]赵丽红,刘纪红,徐新和. 人脸检测方法综述[J]. 计算机应用研究,20049:1-3

[19]吴证. 人脸特征点定位研究及应用[D][硕士学位论文]. 上海:上海交通大学电子信息学院,2007

[20]Waite J,Vincent J.A probabilistic framework for neural facial feature location [J].British Telecom Technology Journal,1992,10(2):20-29

[21]Huang C L, Chen C W .Human facial feature extraction for face interpretation and recognition[J]. Pattern Recognition, 1992,25(12):1435-1444.

作者简介:

第一作者:陈爱斌(1971-),男(汉族),湖南省长沙市,教授,中南林业科技大学计算机学院副院长,主要研究领域是图形图像处理,人工智能。承担多次国家科研项目。

第二作者:李婷(1994-),女(汉族),湖南省长沙市,学生,主要研究领域:图像识别。

 

本刊创刊于1982年,是由自治区科技厅主管、自治区科技信息研究院主办,由自治区科技情报学会协办、国内外公开发行的省级综合性科技刊物,是反映内蒙古自治区科技与经济发展的窗口。杂志入选《中国期刊全文数据(CJFD)》全文收录期刊和《中国学术期刊综合评价数据(CAJCED)统计刊源期刊,《中国核心期刊(遴选)数据库》收录。本刊是公开发行的综合性科技期刊,为月刊,大16开本。本刊坚持以科技创新为目标,融科技、经济、信息、产业、市场为一体,是促进科技成果转化、推动科技进步、加强技术创新,促进经济发展的专业性期刊。