视觉搜索地图问世,神经网络实现逆向图像搜索

 
视觉搜索地图问世,神经网络实现逆向图像搜索

图片来自:TechCrunch

Terrapattern 是一个视觉搜索引擎,当我第一次使用它时,不禁感慨,为什么谷歌近十年的时间没有研发出这样的好东西?只要点击地图的某处——如棒球场,码头等,它会立刻将周围看起来同样功能的地方高亮。这款软件的处理速度飞快,而且简单易懂,拥有广阔的应用前景。

 点击此处可以试用这款软件,看看神经网的学习到底到了何种程度。惊奇之余,我们对它背后的工作原理有了很深的兴趣。这款工具只有少数几个画家及工程师参与开发,总开发费用不超过 3.5 万美金,他们是如何做到的?

秘密来自于最近大火的卷积神经网络系统,大多数的计算机视觉识别项目都采用了相似的原理。本质上来说,卷积神经网络是人工智能的一种,它将图片切割成小块,从每个小块中识别相似点,通过相似点的多少判断两张图片的相似程度。 

在 Terrapattern 中,神经网络把地图切分为无数个小块,然后和庞大的数据库进行比对,将每一个商业场所逐一打上标签。

视觉搜索地图问世,神经网络实现逆向图像搜索

图片来源:TechCrunch

摄像机是如何进行脸部识别的?它如何判定你是在眨眼还是微笑?电脑当然不会认识你,它只是把你在摄像头前的样子和你以往的照片进行比对,匹配相应的表情包。

无论是小船还是水塔,Terrapattern 将所有地理景观都收录其中,并对各种景观的视觉特征进行了分析采集。它目前开通了免费的纽约、匹兹堡、底特律和旧金山地区四个地区的详细地图。它扫描所有景观并与一个庞大的内置数据库进行比对, 经快速查询后立即返回相似结果。(神经网络并没有做任何“思考”,当你点击一个功能,它就匹配相应的数据) 。

当然,你可以只搜索“奥克兰的网球场”等,并且获得非常不错的搜索结果,但这绝非它的强项。如果你执意要把它当普通地图使用,你可能会在田地中间看到房屋,导航到死胡同里,或者在地图上看到圆形的停车场。Terrapattern 目前并不适合日常使用,最多显示一下机场大致位置以及轮船的终点站,神经网络的应用才是他们的独门神器。

Terrapattern由 Golan Levim、David Newbury和Kyle McDonald共同完成,由骑士基金会的原型基金提供赞助。目前,他们仅能四个城市的地图,但在不久之后,会有更多地图推出。而幸运的是,搜寻的精度仍在不断提高。目前来讲,搜索一个棒球场是非常容易的,但搜索一个四路公交站台或监狱,则还要假以时日。

这个项目采用知识共享(Creative Commons)协议,你可以进入GitHub 网站自由查看源代码。

转载请注明出处。GIS帝国网站报道中出现的商标及图像版权属于其合法持有人,只供传递信息之用,非商务用途。

You may also like...

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

CAPTCHAis initialing...