基于AdaBoost算法的嘴唇检测与提取
李思潼 冯彦婕 杜帅 朱从亮 东北林业大学
【摘 要】摘要:唇语识别技术主要通过讲话时嘴唇形状的动态变化来识别讲话内容,可以提高语音识别在噪声较大环境下的准确率。本文提出了一种利用Haar-like特征和AdaBoost算法对人脸和嘴唇区域进行检测及分割并使用色彩空间对分割出的嘴唇区域进行嘴唇提取的方法。
【期刊名称】数码世界
【年(卷),期】2019(000)004
【总页数】1
【关键词】唇语识别 嘴唇提取 Haar-like特征 AdaBoost算法
引言
近几年,人机交互技术的应用越来越广泛,唇语识别作为人机交互中的关键技术,也越发受到关注。谷歌DeepMind实验室提出了一种新的唇语识别技术LipNet。目前唇语识别技术主要是针对语音识别在噪声较大环境下的识别率问题,作为对语音识别的补充和纠正。
关于唇语识别研究的热点主要在嘴唇特征提取以及唇动特征跟踪上,但如何从静态图片或动态视频流中检测出人脸和嘴唇区域并将嘴唇提取出来,对之后的嘴唇特征提取有着至关重要的影响。文献提出了使用RGB色彩空间对嘴唇区域进行提取,利用唇色与肤色在G、B分量上的差异对嘴唇进行提取。本文使用开源的计算机视觉库(OpenCv)中预先训练好的Harr Cascada分类器对人脸区域和嘴唇区域进行检测,之后对分割出来的嘴唇区域利用色彩空间进行嘴唇提取。
1 Haar-like特征
Paul Viola提出了一种快速的人脸检测算法,该算法是一种基于Haar-like特征和AdaBoost自适应增强算法的人脸检测算法,OpenCv中给出了该算法的实现。
Haar特征首先由Papageorgiou提出,用于对物体和人脸的快速检测,之后Rainer Lienhart在文献对其进行了补充,形成了Haar-like矩形特征库。本文所使用的OpenCv中的Harr Cascad分类器便是基于此特征库编写的。
本文来源:https://www.2haoxitong.net/k/doc/f5520cf73e1ec5da50e2524de518964bcf84d2a8.html
文档为doc格式