文章来源:Google 编辑:lily 在谷歌,研究人员开发了先进的计算机视觉机器学习系统,不仅可以用于谷歌自身的产品和服务,还推广至整个研究社区。创造能够在同一张图片里定位和识别多种物体的机器学习模型一直是业内的核心挑战,谷歌宣称自己已投入大量时间进行训练和实验。 其中一个模型在示例图片中对象识别的效果 去年10月,谷歌内部的物体识别系统达到了业内最高水平,并在COCO识别挑战中荣获第一。此后,该系统为大量文献提供了结果,并被一些谷歌的产品所采用,如NestCam,同样的理念也被识别谷歌街景街道名称和门牌号的图像搜索采用。 今天,我们很高兴通过TensorFlow目标检测API把该系统开源给更大的研究者。代码库是一个建立在TensorFlow顶部的开源框架,方便其构建,训练和部署目标检测模型。目的是支持当前最佳的模型,同时允许快速探索和研究我们的第一个版本包含:
1)带有MobileNets的SSD(单拍Multibox Detector) https://research./2017/06/mobilenets-open-source-models-for.html 2)带有Inception V2的SSD https:///abs/1512.00567 3)带有Resnet 101的R-FCN https:///abs/1605.06409 4)带有Resnet 101的更快的RCNN https:///abs/1506.01497 5)带有Inception Resnet v2的更快的RCNN https:///abs/1506.01497 https:///abs/1602.07261
SSD模型使用了轻量化的MobileNet,意味它们可以轻而易举地在移动设备中实时使用。在2016年COCO挑战中,谷歌使用了Fast RCNN模型,它需要更多的计算资源,结果更为准确。了解更多细节,请参阅CVPR 2017的论文:https:///abs/1611.10012
|
|