当前位置:首页>>新闻动态 >> 酒童的博客 >> 一分钟了解以图搜图

一分钟了解以图搜图

作者:原创   发布时间: 2018-08-09 11:05:44

图像检索技术作为网站建设服务中的一个重要应用,历来都是人们非常重视的部分。

最初图像搜索技术主要基于数据库检索,简单说就是
「1」建立图像数据库
「2」给每张图打标签
「3」检索
由于是基于数据库的检索,也就只能采用技术数据库的优化手段,当数据量很大,或者标签量很大时,系统性能会受到很大影响。

然后就开始导入搜索引擎,基本上解决了据量很大,或者标签量很大时带来的系统性能的问题。但是,在实际的应用当中,人们会发现,其实标签也有不靠谱的时候。原因是数据量很庞大的时候,很难有一个很完善的标注、审核校对的机制,确保标签是充分的,准确的。即便排除人为因素,其实有很多场景下,很多图片是很难用文字去描述的。这就给我们带来一个新的课题,如何基于图片的内容去检索?

基于内容的视觉信息检索技术 content-based visual information retrieval CVIR基本上解决了我们所困扰的问题,或者至少说正在解决这些问题。这也就是我们常说的以图搜图,是通过搜索图像文本或者视觉特征,为用户提供互联网上相关图形图像资料检索服务的专业搜索引擎系统,是搜索引擎的一种细分,即通过上传与搜索结果相似的图片或图片URL进行搜索。

简单来说以图搜图分为以下几步
「1」提取目标图片的特征值,简单来说特征值就是利用图像的颜色、形状、纹理、轮廓、对象的空间关系等基本视觉特征建立的一组数据。描述图像特征值的算法有很多:包括直方图法,累计直方图法,局部直方图法等等等等,用的比较多的是:SIFT描述子,指纹算法函数,bundling features算法,hash function(散列函数)等。
「2」将图像特征值进行编码,基于图像特征值建立海量图像数据库及搜索引擎。对于目标图像,可以对分辨率较大的图像进行降采样后在进行图像特征提取。
「3」相似度匹配运算:利用目标图像的编码值,在图像搜索引擎中的图像数据库进行全局或是局部的相似度计算;筛选最佳匹配图片。

沈阳网络公司