分享

厉害了!谷歌地图用深度学习实时更新街景

 timtxu 2017-05-05

进入互联网时代以后,许多人都喜欢使用网络地图为自己之路。为了提供最佳的用户体验,地图信息需要不断的根据现实世界的变化做出调整,为此,谷歌地面实况团队计划从地理位置图像自动提取信息来升级谷歌地图,用深度学习实时更新街景。

从谷歌发布的从街景图像中提取基于注意机制的结构化信息”一文中可以看出,谷歌在街景视图中使用深度神经网络自动,而且能准确无误地读出街道名称,在挑战“法国街道名称识别数据集”中,谷歌的算法系统达到了84.2%的正确率,优于之前的最优系统。重要的是,谷歌的系统在提取其他类型信息也是很容易扩展的。比如现在帮助谷歌自动提取商店前面的商户名称。据悉,目前该模型已经开源。

自然环境中的文本识别在计算机视觉和机器学习上是一个非常具有挑战性的问题,传统的光学字符识别(OCR)系统主要侧重于从扫描的文档中提取文本,在自然场景中由于视觉伪影,如失真、闭塞、定向模糊、杂乱的背景或不同的角度给提取文本提升了难度。

事实上,谷歌从2008年开始致力于解决这一问题,使用神经网络模糊了街景图像中的脸和车牌,以保护谷歌用户的隐私。从最初的研究中,团队意识到经过足够的标记数据训练后,机器学习不仅能保护用户的隐私,而且还可以自动升级谷歌地图相关的最新信息。

另外,谷歌还创建和发布了法国街道名称标志(French Street Name Signs,FSNS),有超过100万的街道名称训练数据集,旨在提高人们对OCR模型在实际使用情况下的认识。FSNS是谷歌经过多年的努力而构建的,它比SVHN数据集更加庞大,也更具挑战性,因为如果要准确识别某个街道标识,可能需要对各个角度所拍摄的图片进行整合处理。

目前,谷歌是世界上唯一一个用深度学习实时更新街景的科技企业,虽然谷歌这么牛,但是谷歌地图暂时还未对中国开放使用,不过大家可以使用网页版的谷歌地图,感受一下和其他地图的区别。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多