最大稳定极值区域算法原理【字数:1669】
1.1最大极值稳定区域原理 以MSER+为例,首先将自然场景中的彩色图像进行灰度转换操作,接下来在对转换后的灰度图像进行二值化,当阈值从0到255慢慢变大的过程中,仔细观察并随时记录图像中每一个灰度值变化所对应的灰度值,将像素值小于阈值的点忽略掉,把大于阈值的灰度值点记录下来,所产生的像素点区域则为极值区域。当阈值从255向0慢慢减少时,若该区域没有变化,则所检测到的稳定区域为极小值区域。 在进行图像数字化的过程中,场景信息被采样、量化为不同区值得有限个像素,对于灰度图像,像素取值应对应该处的亮度,以常见的八位灰度图像I(x,y)为例,各像素的亮度被量化为{0,1,….,255},总共256级,以上灰阶为阈值t对图像进行二值化处理后得到的结果。约定在二值化操作中,灰度值小于阈值的像素将被置为黑色(I(x,y)=0),而灰度值大于等于阈值的像素将被置为白色(I(x,y)=255)。那么,当阈值从0到255逐渐递增时,二值图像将经历从全白到全黑的过程,浮想的黑点对应图像亮度的局部极小值,随着阈值的提高,局部极小值区域将发生合并。以上过程所得全部连通区域,共同构成最大区域集合,这其中,部分连通区域较大范围内几乎不随阈值变化而发生变化,满足这一条件的连通区域为MSER+。对元灰度图像做反向操作,并且重复以上二值化过程,即可得到最小区域集合,对应的稳定连通区域为MSER-。一般情况下,MSER检测的结果是MSER+和MSER-的并集。 将灰度图相中的每一像素的灰度值看成为该处的海拔高度,并且将阈值的递增过程看作是注水操作,就能够直观的发现,MSER检测算法与分水岭算法在本质上是相同的,二者之间的本质区别在于输出方面。分水岭算法的输出是一组互不相交的集水盆,集水盆之间的边缘即为分水岭,此算法关注的重点在于集水盆即将发生交汇时的阈值,该阈值通常并不稳定。MSER检测算法则侧重于寻找集水盆保持相对稳定的阈值,并非是关注全局或者最优阈值选择。算法对全部有可能的阈值进行筛选,并对所得到的连通区域进行评估,其输出是稳定连通区域的集合,在多个稳定阈值存在的情况下,算法输出还可能为多个集合的相互嵌套。另外,MSER检测还可拓展至高维图像。1.2 检测方法简述 场景文本中的文字信息不收拘束,然而检测识别之后会出现相对稳定的字符区域。针对上面存在的问题,在这里可以将场景图像依据不同的分辨进行划分,然后在对每一部分采用同样的方法进行检测与识别,最后在根据检测结果找出场景图像中的文本区域。场景文本中的字符通常具有有以下特点:一、边缘明显,并且颜色和背景差异较大。二、场景文本中的长宽比例会满足必要的条件,而且会形成较为规则的区域。1、金字塔分解 自然场景图像中的文字大小任意,颜色随意,字体不定。传统的自然场景文本检测与识别算法是对图像中的文本信息进行同样的处理,可是自然场景图像中的文字存在上述诸多问题,不符合传统的文本检测技术,所以,针对自然场景中的文本,为了将其识别出来,将自然场景中的图像划分为不同大小的子图,通过不同条件的识别技术分别对场景文本中的文本信息进行提取与识别。2、边缘提取和二值化 自然场景中的文本信息由于排版问题会出现紧凑的问题,而且这类图像常常会与图像中的水平边缘保持平行,所以,针对这种情况可以首先对图像的边缘进行提取,然后通过对边缘密度EI(X,Y)公式 通过边缘算子提取的边缘E(x,y)表示,把边缘密度进行归一化处理之后,在采用全局性质的阈值二值化处理图像。3、基于边界提升MSER算法的区域提取 传统的基于极值稳定区域自然场景文本识别算法将极值区域面积变化到达极小值的之后所对应的区域作为最大稳定极值区域。但是传统算法处理之后的图像边界模糊,往往会在图像的边界附近生成多个相互嵌套的极值稳定区域。Canny边缘检测算子应用非极大值区域抑制技术,对识别之后的有效区域进行获取,对无效区域进行剔除。 关于边界提升的基于极值稳定区域自然场景文本检测算法的原理是,传统的mser算法基础上所得到的稳定极值区域成分树上,根据边界吻合度公式,对其中边界吻合度小的部分进行剔除。Canny边界与区域叠加边界提升MSER4最大稳定极值区域实现步骤 1.依据自然场景文本图像的灰度值排序,对彩色图像进行灰度转换。 2.根据排序结果按照一定的顺序放入图像,对图像中的链接区域和面积,使用高效的UnionFind算法维护
原文链接:http://www.jxszl.com/lwqt/yzlw/218001.html