博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
发布Google-Landmarks: 世界最大的人造和自然地标识别数据集
阅读量:5786 次
发布时间:2019-06-18

本文共 1273 字,大约阅读时间需要 4 分钟。

文 / Google Research 软件工程师 André Araujo 和 Tobias Weyand

图像分类技术在过去几年取得了显著进步,例如在 Imagenet 分类挑战赛中,错误率每年都在大幅下降。为了继续推进计算机视觉的发展,许多研究员现在将更多精力放在精细和实例级识别问题上 - 许多人都在设计能够识别埃菲尔铁塔、富士山或波斯猫的机器学习算法,而不是识别建筑物、山峰和猫等一般实体。不过,这个领域一个比较大的研究障碍是缺乏大型的标注数据集。

我们高兴地宣布 Google-Landmarks,它是全世界最大的人造和自然地标识别数据集,希望这个工具能推动实例级识别的发展。Google-Landmarks 将作为地标识别和地标检索 Kaggle 挑战赛的一部分发布,这两个挑战赛将是 CVPR’18 Landmarks 专题讲座的重点。

  • 地标识别挑战赛:https://www.kaggle.com/c/landmark-recognition-challenge

  • 地标检索挑战赛:https://www.kaggle.com/c/landmark-retrieval-challenge

数据集包含超过 200 万个图像,这些图像描绘了全世界 3 万个独特的地标(它们的地理分布如下图所示),许多类别要比现在的常用数据集大 30 倍左右。此外,为了激励这个领域的研究,我们将开源 Deep Local Features (DELF):

http://arxiv.org/abs/1612.06321

这个具有专用的本地特征描述符的数据库,我们认为它非常适合这种任务。

发布Google-Landmarks: 世界最大的人造和自然地标识别数据集

我们数据集中的地标的地理分布

地标识别具有一些与其他问题显著不同的差异。例如,即使在一个大型标注数据集中,也可能没有很多用于一些不知名地标的训练数据。此外,由于地标通常是不可移动的刚性对象,类别内变化非常小(换句话说,地标的外观在它的不同图像中不会发生很大变化)。因此,变化仅来自于拍照条件(例如遮蔽、不同的视角、天气和光照),这就让地标与其他图像识别数据集不同,在其他数据集中,某种类别图像(例如狗)的差异可能非常大。其他实例级识别问题(例如艺术品识别)也有这些特性 - 因此,我们希望新数据集也能为其他图像识别问题的研究提供帮助。

两个 Kaggle 挑战赛会提供标注数据的访问权限,以便帮助研究人员解决这些问题。识别挑战赛的任务是构建识别正确地标的模型,它可以处理具有挑战性测试图像组成的数据集,而检索挑战赛的参与者需要检索包含相同地标的图像。

发布Google-Landmarks: 世界最大的人造和自然地标识别数据集

Google-Landmarks 数据集中的一些示例图像,包括大本钟、圣心堂

如果您计划参加今年的 CVPR,我们希望您能出席 CVPR’18 Landmarks 专题讲座:

https://landmarkscvprw18.github.io

不过,所有人都可以参与挑战赛,以及通过 Kaggle 网站访问新数据集。我们希望这个资源可以为您的研究提供帮助,我们已经迫不及待地想要倾听大家对地标识别的想法了。

转载地址:http://zktyx.baihongyu.com/

你可能感兴趣的文章
Tasks and Back stack 详解
查看>>
关于EXPORT_SYMBOL的作用浅析
查看>>
成功的背后!(给所有IT人)
查看>>
在SpringMVC利用MockMvc进行单元测试
查看>>
Nagios监控生产环境redis群集服务战
查看>>
Angular - -ngKeydown/ngKeypress/ngKeyup 键盘事件和鼠标事件
查看>>
Android BlueDroid(一):BlueDroid概述
查看>>
Java利用httpasyncclient进行异步HTTP请求
查看>>
宿舍局域网的应用
查看>>
html代码究竟什么用途
查看>>
Hadoop HDFS编程 API入门系列之路径过滤上传多个文件到HDFS(二)
查看>>
Python version 2.7 required, which was not foun...
查看>>
context:annotation-config vs component-scan
查看>>
exgcd、二元一次不定方程学习笔记
查看>>
经典sql
查看>>
CSS3边框会动的信封
查看>>
JavaWeb实例设计思路(订单管理系统)
查看>>
source insight中的快捷键总结
查看>>
PC-IIS因为端口问题报错的解决方法
查看>>
java四种线程池简介,使用
查看>>