使用OpenCV和SVM与图像

我在阅读图像,提取训练function以及使用SVM在OpenCV中testing新图像方面遇到困难。 有人可以请我指向一个伟大的联系? 我已经看过OpenCV支持向量机简介 。 但是这对阅读图像没有帮助,我不知道如何将其纳入。


非常感谢解释。 我的目标是分类图像中的像素。 这些像素将属于一条曲线。 我理解形成训练matrix(例如,图像A 1,1 1,2 1,3 1,4 1,5 2,1 2,2 2,3 2,4 2,5 3,1 3,2 3, 3 3,4 3,5

我将形成我的训练matrix[3] [2] = {{1,1} {1,2} {1,3} {1,4} {1,5} {2,1} .. {} }

不过,我对标签有点混淆。 根据我的理解,我必须指定训练matrix中的哪一行(图像)对应于曲线或非曲线。 但是,如果有一些像素属于曲线而有些像素不属于曲线,那么如何标记训练matrix行(图像)呢? 例如,我的训练matrix是[3] [2] = {{1,1} {1,2} {1,3} {1,4} {1,5} {2,1} .. {}} ,像素{1,1}和{1,4}属于曲线,其余的不是。

非常感谢 –

最近我不得不面对这个问题,这就是我最终做了什么来让SVM为图像工作。

要在一组图像上训练SVM,首先必须构buildSVM的训练matrix。 这个matrix被指定如下:matrix的每一行对应一个图像,并且该行中的每个元素对应于该类的一个特征 – 在这种情况下,该特征点处的像素的颜色。 由于你的图像是二维的,你将需要将它们转换为一维matrix。 每行的长度将是图像的面积(请注意,图像必须是相同的大小)。

假设您想要在5个不同的图像上训练SVM,每个图像都是4×3像素。 首先你必须初始化训练matrix。 matrix中的行数将是5,列数将是图像的面积,4 * 3 = 12。

int num_files = 5; int img_area = 4*3; Mat training_mat(num_files,img_area,CV_32FC1); 

理想情况下, num_filesimg_area不会被硬编码,而是通过循环目录并计算图像的数量并获取图像的实际区域而获得的。

下一步是用每个图像的数据“填充” training_mat的行。 下面是这个映射如何为一行工作的例子。

将二维图像矩阵转换为一维矩阵

我已经将图像matrix的每个元素都编号在训练matrix的相应行中应该放在哪里。 例如,如果这是第三个图像,这将是训练matrix中的第三行。

您将不得不遍历每个图像,并相应地设置输出matrix中的值。 以下是多个图像的示例:

训练矩阵与多个图像

至于你如何在代码中做到这一点,你可以使用reshape() ,但由于matrix不连续,我有问题。 根据我的经验,我做了这样的事情:

 Mat img_mat = imread(imgname,0); // I used 0 for greyscale int ii = 0; // Current column in training_mat for (int i = 0; i<img_mat.rows; i++) { for (int j = 0; j < img_mat.cols; j++) { training_mat.at<float>(file_num,ii++) = img_mat.at<uchar>(i,j); } } 

对每个训练图像执行此操作(记住要递增file_num )。 在此之后,您应该将您的训练matrix正确设置以传递到SVM函数。 其余步骤应该与在线示例非常相似。

请注意,在执行此操作时,还必须为每个训练图像设置标签。 例如,如果您正在根据图像对眼睛和非眼睛进行分类,则需要指定训练matrix中的哪一行对应于眼睛和非眼睛。 这被指定为1Dmatrix,其中1Dmatrix中的每个元素对应于2Dmatrix中的每一行。 为每个类别select值(例如,非眼睛为-1,眼睛为1),并将其设置在标签matrix中。

 Mat labels(num_files,1,CV_32FC1); 

所以如果这个labelsmatrix中的第3个元素是-1,则意味着训练matrix中的第3行是“非眼”类。 您可以在评估每个图像的循环中设置这些值。 你可以做的一件事就是将训练数据分类到每个类的单独目录中,并循环遍历每个目录中的图像,并根据目录设置标签。

接下来要做的就是设置你的SVM参数。 这些值将根据您的项目而有所不同,但基本上您会声明一个CvSVMParams对象并设置值:

 CvSVMParams params; params.svm_type = CvSVM::C_SVC; params.kernel_type = CvSVM::POLY; params.gamma = 3; // ...etc 

网上有几个关于如何设置这些参数的例子,就像你在问题中发布的链接一样。

接下来,您创build一个CvSVM对象并根据您的数据进行训练!

 CvSVM svm; svm.train(training_mat, labels, Mat(), Mat(), params); 

根据你有多less数据,这可能需要很长时间。 训练结束后,您可以保存训练有素的SVM,这样您就不必每次都重新训练。

 svm.save("svm_filename"); // saving svm.load("svm_filename"); // loading 

要使用训练的SVMtesting图像,只需读取图像,将其转换为一维matrix,然后将其传递给svm.predict()

 svm.predict(img_mat_1d); 

它将根据您设置的标签返回一个值(例如,基于上面的眼睛/非眼睛示例,-1或1)。 或者,如果您想一次testing多个图像,则可以创build一个与前面定义的训练matrix具有相同格式的matrix,并将其作为参数传入。 不过,返回值会有所不同。

祝你好运!