分享

中国计算机视觉“四小龙”如何看懂世界

 标准生活 2018-06-20

视觉使人类得以感知和理解周边的世界,计算机视觉则是让机器理解看懂这个世界,即通过电子化的方式来感知和理解影像,以达到甚至超越人类视觉智能的效果。


具体来讲,主要是研究如何使机器“看”,通常是用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理。通过计算机视觉,电脑将处理更适合人眼观察或传送给仪器检测的图像。计算机视觉的主要任务是通过对采集的图片或者视频进行处理以获得相应场景的三维信息。


计算机视觉与人工智能的关系

第一, 它是一个人工智能需要解决的很重要的问题。

第二, 它是目前人工智能的很强的驱动力。因为它有很多应用,很多技术是从计算机视觉诞生出来以后,再反运用到AI领域中去。

第三, 计算机视觉拥有大量的量子AI的应用基础。


计算机视觉典型应用

从1966年学科建立(MIT:The Summer Vision Project)至今,尽管计算机视觉在感知与认知智能方向仍有大量难以解决、尚待探索的问题,但得益于深度学习算法的成熟应用,侧重于感知智能的图像分类技术在工业界逐步实现商用价值,助力金融、安防、互联网、手机、医疗、工业等领域智能升级。

计算机视觉典型应用


计算机视觉“四小龙”由来

从2014年“人工智能”开始成为资本关注的方向,至今有超过500家投资机构、累计投资600多亿人民币。尤其是2017年下半年之后,商汤科技、旷视科技等部分企业的单笔融资金额高达10亿人民币以上。近期,商汤科技和依图科技先后宣布获得C+轮融资,可见资本对人工智能的关注仍热度不减。


从资本追逐的热度不难看出,计算机视觉作为人工智能的细分领域,其在应用领域商用成效显著且潜力巨大。根据IDC近期发布的《IDC 2018中国计算机视觉应用市场研究》,截至2017年12月底,中国在该领域的规模达15.45亿元人民币,同比2016年增长184.0%。


而参与该领域的主流厂商,既包括商汤科技、依图科技、旷视科技、云从科技等初创公司,又包括腾讯云、百度云、阿里云、金山云等大型CSP厂商,除此以外还有众多传统的安防厂商如海康、大华、易华录等。


其中,商汤科技、依图科技、旷视科技和云从科技被称为计算机视觉“四小龙”。根据IDC的数据,“四小龙”的总体市场份额达到了69.4%,而其他厂商总体只占市场的30.6%。


商汤科技:基础平台型公司

商汤科技SenseTime成立于2014年,以计算机视觉和深度学习的原创技术赋能产业,应用覆盖行业范围最为广泛。商汤科技是2017年互联网行业计算机视觉应用最为领先的厂商,是全球领先的人工智能平台公司。


创始团队


商汤科技由香港中文大学工程学院团队创立,战略合作伙伴包括高通、华为、小米科技、本田汽车和麻省理工大学等。


商汤科技联合创始人、CEO徐立本硕毕业于上海交通大学,博士毕业于香港中文大学。拥有十余年计算机视觉、模式识别、图像处理领域的研究和产品开发经验。


2011年,汤晓鸥、徐立所在实验室的几十个博士、教师开始研究深度学习。这是学术界最早涉猎深度学习的华人团队。


商汤科技发展及融资


2014年,自主研发的人脸识别技术首次超越人眼识别准确率,突破工业化应用的红线,获A轮数千万美元融资,在ImageNet国际计算机视觉挑战赛中荣获世界第二成绩,仅次于Google。


2015年,获数千万美元A+轮融资,建立自主研发的深度学习超算平台Parrots,对超深的网络规模、超大的数据学习以及复杂关联应用等支持更具优势,ImageNet国际计算机视觉挑战赛中获检测数量、检测准确率两项世界第一,成为首个夺冠的中国企业。


2016年,商汤科技在ImageNet 2016一举揽下物体检测、视频物体检测和场景分析三项冠军。


2017年,商汤科技宣布完成4.1亿美元B轮融资,创下全球人工智能领域单轮融资最高纪录。此次轮融资包括B1、B2两轮。B1轮由鼎晖领投,B2轮由赛领资本领投,近20家顶级投资机构和战略伙伴参投。2017年11月8日,商汤科技入选中国商业案例TOP30。


2018年4月,商汤科技宣布完成6亿美元C轮融资,再次创下全球人工智能领域融资记录,并成为全球最具价值的人工智能平台公司。


2018年5月31日,商汤科技宣布获得6.2亿美金C+轮融资,领投方包括厚朴投资、银湖投资、老虎基金、富达国际等,战略投资方包括高通创投、保利资本和世茂集团等。


商汤科技现已在香港、北京、深圳、上海、成都、杭州、日本京都、东京和新加坡成立分部。


核心业务:智慧金融、智慧商业、智慧安防、互联网+


技术特点:人脸技术、智能监控、图像识别、文字识别、图像及视频编辑、深度学习框架


解决方案


1、基于核心技术的智能视频、身份验证、移动互联网解决方案


SensePose是第一个可以使用RGB摄像头来做实时人体姿态恢复的设备。商汤还发布了一款名为SenseVideo的产品,这款产品主要做视频结构化处理。


SenseVideo是商汤科技在2016年ImageNet中取得视频中物体检测第一名的模型的实际应用成果,可以在安防监控视频当中,准确的检测到人、车和非机动车,并且给它们打上所有的属性和标签。


商汤科技还有SenseFace、SenePhoto、SenseAR等原创AI解决方案,这些解决方案可以广泛应用在智慧城市、智慧家居、互联网娱乐、手机、无人驾驶、医疗等多个领域。


2、商汤科技SenseGo智慧商业解决方案


基于人脸动态识别、行人检测、人脸属性分析、人脸实时比对等计算机视觉技术,从视频中提取消费者各类信息,从而形成消费者画像和行为分析。为连锁零售企业、大型购物中心、新型娱乐场所、零售解决方案提供商等目标客户提供云+端的智慧商业解决方案。方便目标客户进行精细化运营分析、顾客管理和个性化营销决策。


3、商汤科技SenseDrive解决方案


提供完整的车内驾驶员监控解决方案,包括人脸检测、疲劳检测、注意力检测和手势识别。兼顾了安全、驾驶辅助和车内互动娱乐。基于商汤科技深度学习技术,利用单目摄像头,在各种天气、光照等条件下,实时识别不同种类的车道线。同时,输出车辆与车道前车碰撞预警和行人检测预警。

 

基于商汤科技深度学习技术,利用单目摄像头,实时识别前方机动车、非机动车和行人。并实时输出前方识别物体的相对距离、相对速度,以及相对碰撞时间和绝对碰撞时间。当报警时间达到临界值时,输出报警信号线的距离,以及车辆即将驶出车道线的时间,在未打转向灯时及时发出预警。


4、商汤科技和华为联合发布SenseAtlas超高密人脸识别一体化方案


基于GPU加速和商汤算法的加持,服务器单机即可实现224路高清视频流人脸识别的实时处理,为千亿的智能视频分析云端市场打造软硬一体的最佳人工智能解决方案。


本次发布的SenseAtlas超高密人脸识别一体机,在硬件、AI算法以及应用方面实现了完美结合。该一体机采用华为Atlas平台硬件技术,结合商汤科技在算法上针对GPU加速的深度优化,能够高性能地执行人脸检测、跟踪、关键点定位、特征提取等任务。


应用场景:广泛地应用于楼宇、文博、教育、企业、交通、园区等行业及场景。


旷视科技:立足于原创深度学习算法

旷视科技成立于2011年,旷视以深度学习和物联传感技术为核心,立足于自有原创深度学习算法引擎 Brain++,深耕金融安全,城市安防,手机 AR,商业物联,工业机器人五大核心行业,致力于为企业级用户提供全球领先的人工智能产品和行业解决方案。Face++平台现已开放多项计算机视觉服务,并提供丰富的API/SDK,受到开发者的广泛认可。


创始团队


2011年10月,唐文斌与姚班同学印奇、杨沐共同创立北京旷视科技有限公司。

 

创始人印奇是一个技术天才,高中还没毕业就被清华大学选中;进入清华后,他入选姚期智的实验班。

 

姚期智是中国科学院院士、量子计算专家、图灵奖获得者,旷视科技的另外两个联合创始人和不少团队成员也出自“姚班”。目前,姚期智已是旷视科技学术委员会的首席顾问。


微软研究院首席研究员孙剑博士于2016年7月入职旷视担任首席科学家,同时担任旷视研究院院长。


旷视科技发展及融资


旷视的核心人脸识别技术 Face++ 曾被美国著名科技评论杂志《麻省理工科技评论》评定为 2017 全球十大前沿科技,同时公司入榜全球最聪明公司并位列第 11 名。在中国科技部火炬中心“独角兽”榜单中,旷视排在人工智能类首位。

核心业务:FaceID 在线身份验证服务、Face++ 人工智能开放平台、智能地产解决方案、智能安防解决方案


技术特点:动态人脸识别、在线/离线活体检测、超大人像库实时检索、证件识别、行人检测、轨迹分析


解决方案


1、旷视(Face++) “智能地产解决方案


旷视(Face++) “智能地产解决方案”致力于静态、动态人脸识别技术在商业领域当中的应用,通过真实的应用场景以及各行业领域实现端到端 (End-To-End) 的整体解决方案输出,可实现视频监控、车辆管理、人员通行管理、智能零售等功能。目前智能地产产品线包括但不限于智慧楼宇、智能企业、智能商超、智能生活、智能会议等行业解决方案。


解决方案构成


首先在硬件组成上,旷视智能地产解决方案至少包括前端图像采集单元(200 万像素人体科学专用高清摄像机、1 英寸传感单元专用半球机)和后端处理单元(图像、算法处理专用服务器、数字智能机顶盒);在软件组成上,包含旷视智能地产核心系统,并由人员通行管理、车辆管理、视频监控三大模块组成,用户可根据自身需求进行集成或进行二次开发。


应用场景:企业楼宇园区、生活社区、校园管理、连锁商超


2、智能安防解决方案


基于人脸识别技术的智慧安防解决方案,可广泛应用于视频监控、入侵告警、出入口控制、门禁、电子巡更、联网告警等主要安防领域,有效解决公安、海关、机场、铁路等政府安全相关机构对于可疑人员身份确认、实名制认证、人脸电子围栏、重点人员布控告警等实战诉求。


解决方案构成

应用场景:重点场所管控;人像卡口利旧改造;营区&周边安全;立体化防控;


依图科技:拓展人工智能新疆界

依图科技:深耕安防领域,维持金融业务,大力布局医疗影像业。依图科技是2017年安防领域表现最强的算法型厂商。


创始团队

 

朱珑,美国加州大学洛杉矶分校(UCLA),获统计学博士。师从霍金的弟子艾伦·尤尔(Alan Yuille)教授。从事计算机视觉的统计建模和人工智能的研究。

 

林晨曦,前阿里云计算资深专家。2008年至2012年期间,组建并带领百人以上的优秀工程师团队,搭建了国内最大的拥有自主知识产权的飞天分布式云计算操作系统。

 

依图科技发展及融资

 

2012年,依图科技成立。

2013年,获得真格基金天使轮融资。

2014年,获得红杉资本和高榕资本的A轮融资。

2015年,蜻蜓眼系统获得“公安部科技进步奖”。与阿里云合作搭建“贵州公安交警大数据实时作战云平台”。招商银行将“依图人脸识别技术”推广到全国1500家网点。浦发银行“人像识别平台及直销银行远程开户视频认证建设项目”投产,实现VTM和手机银行的人脸身份认证。


2016年,完成由云锋基金领投的数千万美元B轮融资。开始在医疗健康,城市数据大脑等领域的探索和实践。搭建全球最大的人像系统,覆盖超过18亿人像。为海关总署及中国边检提供人像比对系统。

 

2017年,完成由高瓴资本集团领投,云锋基金、红杉资本、高榕资本、真格基金跟投的3.8亿元C轮融资。在美国国家标准与技术研究院(NIST)主办的人脸识别测试(FRVT)中获得冠军。在美国国家情报高级研究计划局(IARPA)主办的全球人脸识别挑战赛(FRPC)中获得冠军。

 

2018年,6月12日,AI独角兽依图科技在其官方公众号发文称,近期完成了2亿美元C+轮融资,本轮高成资本、工银国际、浦银国际以新投资人的身份加入。


核心业务:智能安防平台、城市数据大脑、智慧医疗健康、智能硬件设备


技术特点:计算机视觉、自然语言理解、知识推理、智能硬件、机器人技术

 

应用及解决方案

 

1、依图安防


依图智能安防技术主要由人工智能算法、高性能计算、分布式计算和存储、大规模运维等构成。其中视觉智能算法主要涉及人脸识别、车辆车型识别、文字识别、目标跟踪、图像特征搜索等技术。


2、依图医疗


依图医疗凭借在深度学习、计算机视觉、自然语言处理等领域的先进技术以及在医疗行业的深厚积累,面向放射科、超声科、儿科等多个科室提供临床诊疗辅助诊断和智能管理,并结合前沿医学热点,提供专业的科研大数据分析和前沿的跨学科科研及转化应用。


目前已推出care.ai ™ 系列产品,包括:care.ai ™胸部CT智能辅助诊断、care.ai ™ 儿童骨龄智能辅助诊断、care.ai ™ 儿科门诊智能辅助诊断、care.ai ™ 病历智能搜索引擎、care.ai™临床智能科研平台等。


3、依图金融


依图自主研发的金融行业解决方案已覆盖金融各个领域,包括银行、互联网金融、证券、基金、保险、汽车金融等。依图针对各个细分领域、结合用户场景,提供完整的智慧金融解决方案。


(1)刷脸取款解决方案

依图自主研发的双目活体检测人脸认证系统现已应用于招商银行、农业银行等多家银行ATM机具,为无卡取款业务的用户提供身份核验功能,帮助用户在自助设备无人监控情况下,安全实现刷脸取款的功能。


(2)智能网点解决方案

智能网点系统能够基于前端抓拍摄像机和后台公有云,实现线下网点场景下的视频监控和客流数据智能分析。


(3)远程核身解决方案

依图手机端人脸验证SDK提供活体检测、人脸1v1比对、身份证OCR三种功能的验证。


云从科技:计算机视觉的国家队

广州云从科技(cloudwalk)是中国的一家专注人脸识别的高科技公司,投资公司位于广州,运营公司位于重庆。

 

创始团队


创始人周曦师承“计算机视觉之父”,Thomas S. Huang教授,四院院士,20多年技术积累。周曦是“中国科学院百人计划”,中国科学院、上海交通大学博导,并在国际大赛多次折桂。


云从科技发展历程


2011-2014年,中科院人脸识别团队建立并发展,专注科技技术产品化,入选中国科学院战略性先导科技专项


在2015年4月,广州云丛信息科技有限公司与中科院重庆研究院合资成立了重庆中科云从科技有限公司,重点转化人脸识别技术、人群监测技术、警用图侦技术和交通识别技术等科研成果。


公司创始团队曾获2011年FERA国际表情识别分析挑战赛、2010年IMAGENET大规模视觉识别挑战赛、2010年PASCALVOC国际人体动作识别挑战赛和2009年PASCALVOC世界图像物体识别挑战赛等比赛冠军,并获得图像处理国际会议(IEEEICIP2007)、模式识别国际会议(ICPR2008)和多媒体国际会议(ACMMultimedia2013)“最佳论文”奖。(证明材料来自腾讯财经)

 

核心业务:快速部署平台、智能硬件、智能系统

 

技术特点:人脸信息检测、特征提取融合、质量属性分析、人脸相似度比对、特征相似度对比、ocr识别

 

典型应用案例


1、中国农业银行|超级柜台人脸识别

中国农业银行超级柜台采用了云从人脸识别技术,极大缩短了自助业务办理时间,提升业务的便捷性和安全性。


2、广东省公安厅

广东省公安厅采用云从科技人脸识别技术在地铁、车站、重点小区等重要场所进行布控和实战并取得了良好的效果,抓获了一批嫌疑人,为公安破案提供了新的思路和战法,受到全国公安系统广泛关注。


3、北京西站|动态人脸布控

通过对人脸动态识别系统的应用,北京西站派出所辖区的治安环境有了较大改善,车站绕序、拉客等现象得到一定程度的抑制。


4、中移电子商务|远程身份认证

中移电子商务有限公司采用云从科技人脸识别技术,实现和包实名认证等业务场景。


小结

从以上典型的计算机视觉公司不难发现,在商业化方面,安防、金融、互联网服务、企业服务等行业走在前列。但计算机视觉在行业创新中发挥真正价值,仅仅拥有顶级的算法还不够的,还需和场景合作方形成强势资源的深度绑定,透彻解读场景需求。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多