实现了sauvola算法,原论文去google一下就有了~
参数是:k, windowSize,自己调调看效果
void sauvola(unsigned char * grayImage,unsigned char * biImage,int w,int h,int k,int windowSize)
{
int whalf = windowSize >> 1;
int i,j;...
/***********************聚类操作*******************************/
//图像进行颜色聚类
//输入:灰度图像
//输出:颜色聚类结果图片、聚类标签矩阵
int color_cluster(IplImage * src,IplImage * dst,int * class_mat)
{
if(src == NULL || dst == NULL...
int calEdgeHistogram(IplImage *image,IplImage * dst,double * edge_hist_feature)
{
if(NULL == image || NULL == edge_hist_feature)
return 1;
CvHistogram *hist = 0; // 直方图
IplImage* canny;//边缘图像
...
结合这周看的论文,我对这周研究的Histogram of oriented gradients(HOG)谈谈自己的理解:
HOG descriptors 是应用在计算机视觉和图像处理领域,用于目标检测的特征描述器。这项技术是用来计算局部图像梯度的方向信息的统计值。这种方法跟边缘方向直方图(edge orientation histograms)、尺度不变特征变换(scale-invarian...
安装Tesseract-OCR
准备工作:
编译环境: gcc gcc-c++ make(这个环境一般机器都具备,可以忽略)
1
yum install gcc gcc-c++ make
依赖的包: autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel leptonica(1.67...
中文识别:清华文通TH-OCR XP(8.0);汉王文本王5800;尚书七号OCR。
英文识别:ABBYY FineReader70pro;Cuneiform pro v6;Scansoft OmniPage SE;Scansoft PaperPort v9.0。
中英文混合识别:清华文通TH-OCR XP(8.0);汉王文本王5800;尚书七号OCR。
中文识别:汉王文本王5800更...
腐蚀的算法:
用3x3的结构元素,扫描图像的每一个像素,用结构元素与其覆盖的二值图像做“与”操作:如果都为1,结果图像的该像素为1。否则为0。
结果:使二值图像减小一圈
B}í S = { x,y | Sxy?定义:E = B
膨胀的算法:
用3x3的结构元素,扫描图像的每一个像素,用结构元素与其覆盖的二值图像做“与”操作:如果都为0,结果图像的该像素为0。否则为1
结果:使二...
tesseract 训练字库先做两个准备工作
1.下载工具cowboxer
http://download.csdn.net/detail/cxf7394373/5305519
2. 下载tesseract-ocr.exe
https://code.google.com/p/tesseract-ocr/downloads/list
3. 安装tessract-ocr
我直接安装在了D:...
读研的时候写过一篇文本定位相关的论文,当时有一个处理步骤是对断裂的边缘进行连接,当时的程序已经不知道扔哪儿去了,最近又要用到这个程序,把论文翻出来,把程序写了一遍。这个边缘连接的方法我也不知道叫什么名字,随便写写吧。
对所有的端点(该点八临域内有且只有一个前景点)查找其更外层的16个点,若有前景点,则将该端点和前景点之间的点也改为前景点(图1)。边缘连接的结果表明该方法能把相邻的前景点连接起...
最近在看车牌识别相关领域的论文,自己也试验了一些开源的代码,opencv自带的找四边形的程序等等,感觉效果都不好。在车牌识别中,关键的是车牌定位,决定了车牌识别的准确率,目前研究比较多的也就是基于颜色、边缘、纹理的车牌定位方法,看了几篇论文,有一篇硕士论文叫《汽车牌照识别系统中车牌定位与校正及字符分割的研究》,南航的一位同学的硕士毕业论文,想实现其中的车牌定位算法。可以去网上搜索该论文,在道客巴巴...
经常用opencv下的cvCvtColor函数直接把图片颜色空间转换到了HSV下,今天自己写了一段代码进行转化,RGB转HSV的计算公式如下:
在这里把h规范化到位于 0 到 360°之间,s和v均规范化到0-1之间,和opencv的范围不同。
IplImage * src;
int * h;
float * s;
float * v;
int width = src->w...
Tesseract-ocr的dll tesseract-3.02.02-win32-lib-include-dirs下载地址:
Google-Tesseract-OCR
解压之后包括 include文件夹和Lib文件夹,配置头文件和库文件,建立工程进行测试。
#include "baseapi.h"
#include "strngs.h"
#pragma comment...
最近在用opencv写一个文本定位的程序,获取到字符轮廓之后需要进行合并,涉及到判断矩形是否相交的问题,记得去年去三星通信研究院面试同样问到了这个问题,如何判断两条线段是否相交,如何判断两个矩形是否相交。以前写过一篇如何判断线段相交的问题,上网查了一些方法,在这里做一下后一个问题的总结:
方法一:假定矩形是用一对点表达的(minx,miny)(maxx, maxy) ,那么两个矩形rect1...
|
|