图像中的标识识别

有没有人知道最近在图像中进行标识识别的学术工作？请仅在您熟悉此特定主题的情况下回答（我可以自己searchGoogle“标识识别”，非常感谢）。任何熟悉计算机视觉，并且已经完成目标识别工作的人都可以发表评论。

更新：请参考algorithm方面（您认为合适的方法，现场的论文，是否应该对真实世界的数据进行工作（并经过testing），效率的考虑），而不是技术方面（使用的编程语言或无论是在OpenCV中…）在图像索引和基于内容的图像检索方面的工作也可以提供帮助。

你可以尝试使用像SIFT这样的本地特性： http : //en.wikipedia.org/wiki/Scale-invariant_feature_transform

它应该工作，因为徽标形状通常是恒定的，所以提取的特征应该匹配得很好。

工作stream程将如下所示：

检测angular落（如哈里斯angular落探测器） – 耐克标志，他们是两个尖锐的结束。
计算描述符（如SIFT – 128D整数向量）
在训练阶段记住他们; 在匹配阶段find训练期间获得的数据库中的每个特征的最近邻居。最后，你有一组匹配（其中一些可能是错误的）。
使用RANSAC挑出错误的匹配。因此，您将获得描述从理想的徽标图像转换为您find徽标的图像的matrix。根据设置，您可以允许不同types的转换（只是平移;平移和旋转;仿射变换）。

我假设你想在照片中find标识，例如find所有的百事可乐广告牌，所以他们可能会被扭曲。如果您需要在屏幕上find电video道徽标（以免旋转和缩放），则可以更容易（模式匹配或其他）。
传统的SIFT不考虑颜色信息。由于徽标通常具有不变的颜色（尽pipe确切的颜色取决于闪电和相机），您可能想要以某种方式考虑颜色信息。

我们致力于在真实世界的图像中进行标志检测/识别。我们还创build了一个FlickrLogos-32数据集并公开发布，包括数据，基本事实和评估脚本。

在我们的工作中，我们将标识识别作为检索问题来简化多类识别，并允许这样的系统可以很容易地扩展到许多（例如数千个）标识类。

最近，我们开发了一种捆绑技术，称为Bundle min-Hashing ，将多个局部特征的空间configuration聚合成高度独特的特征包。包表示可用于检索和识别。有关徽标检测，请参阅以下示例热度图：

在这里输入图像说明

你会发现更多关于内部操作的细节，这个方法的潜在应用，对它的性能的实验，当然还有很多参考文献中的相关工作[1] [2] 。

在此工作：体育video数据库中的商标匹配和检索获得论文的PDF： http ://scholar.google.it/scholar?cluster=9926471658203167449&hl=zh-CN&as_sdt =2000

我们使用SIFT作为商标和图像描述符，以及归一化的阈值匹配来计算模型和图像之间的距离。在我们最新的工作中，我们已经能够使用元模型大大减less计算量，创build评估同一商标不同版本中存在的SIFT点的相关性。

我想说的是，由于目前使用的电视标准的视觉质量很差，一般来说，使用video工作比处理照片更困难。

马尔科

我曾经在一个项目上做过类似的事情。起初我尝试使用这个软件的哈尔训练技巧

OpenCV的

它工作，但不是我们需要的最佳解决scheme。我们的源图像（我们在寻找标志的地方）是一个固定的大小，只包含标志。正因为如此，我们可以使用已知匹配的cvMatchShapes，并比较返回的值来认为匹配良好。