分享

2018 全球(南京)人工智能应用大赛赛题——智能城市篇

 标准生活 2018-05-31


日前,由高创中国参与举办的2018 全球(南京)人工智能应用大赛正式发布了赛题,大赛组委会针对包括“智能制造”、“智能驾驶”、“智能生活”、“智能医疗”、“智能城市”在内的5大产业应用领域方向遴选出20个赛题,届时每个产业应用领域方向分别遴选出10个优秀入围项目颁以单项奖,优选其中前4名项目(共20个)进入最终路演环节,通过比赛评选出综合奖一、二、三等奖共10个奖项,针对优秀的获奖项目,南京市有关部门给予现金奖励与相应的扶持政策,同时引进资本进行对接。


智能城市篇


1

采用深度学习技术实现架空输电线路无人机缺陷检测


背景说明

【整体背景】

为确保电网能够安全稳定的运行,依据相关规定,工作人员必须进行架空输电线路的定期检查。传统检测方式主要依靠人工巡检和目测检测,在其存在误检或者漏检问题的同时,又耗费了大量的人力和物力。高压传输线路规模大、范围广,周围的环境存在很多潜在的危险,不利于人工检测,使得传统的维修和巡检方法适用范围大大减小。针对这一问题,直升机巡检技术、无人机巡检技术相继得到了广泛的应用,它们搭载照相或摄像设备沿输电线路走廊飞行,近距离拍摄线路及其关键部件,获取航拍图像,人工标注航拍图像中架空输电线路的缺陷部位。传统的图像标注是人工完成的,对图像的理解与标注相对准确,但是在大数据环境下的图像标注中,人工标注工作量巨大,并且容易受到主观经验的影响,对同一幅图像的标注不一致。于是,有学者提出了利用计算机技术实现图像的自动标注的智能检测方法。智能检测方法因其优良的性能、广泛的适应范围、符合现代智能化和自动化的要求等优点作为新的线路巡检方式而越来越受到重视。

图1 无人机巡检航拍场景图

【业务背景】

无人机作为现代巡检重要技术手段,在架空输电线路缺陷检测方面扮演着至关重要的角色;机器学习是人工智能的一个重要分支,是使计算机具有智能的根本途径,而深度学习作为机器学习的分支,在缺陷检测方面发挥着极其重要的作用。因此,将深度学习与现代巡检技术相结合,在电力缺陷检测方面具有很高的便利性与优越性。然而,用于深度学习模型训练的样本需要人工标注,耗时费力,如果采用计算机技术实现训练样本的缺陷批量标注,将会节省大量人力物力,因此,在原有深度学习缺陷检测上做出如上的改进,才能满足现代智能巡检要求。

图2 基于人工标注的研究思路示意图


项目说明

【问题说明】

目前架空输电线路中的悬垂线夹的特定部件—销钉的脱落缺陷检测都是基于人工进行标注的,人工标注工作量巨大,效率低下,并且容易受到主观经验的影响,经常出现漏检的情况。采用基于上述改进过的深度学习的缺陷检测技术对销钉松动缺陷标注, 一方面,在保证低误检率的前提下,可以大幅度提高缺陷标注效率;另一方面,模型训练时避免了人工参与标注,提高了模型训练效率。

图3 销钉脱落

图4 销钉完好

【用户期望】

(1)训练与测试用的图片数据(背景单一)包含正常与销钉脱落两大类别,提供1000张未标注图片供参赛者训练和测试所标注的测试模型;200张图片用于验证所建模型,要求参赛者所建立的模型可以标出存在缺陷的图片中销钉脱落位置;

(2)以上提供的1000张供参赛者训练和测试用的图片数据源,训练集和测试集的比例为7:3,另外,参赛者可以人工手动标注用于训练模型(后续记作模型1);

(3)以mAP(mean Average Precision)为评定指标,针对验证集,要求mAP在0.65以上。


【预期经济效应】

“十二五”期间,我国电网建设经历了高速发展的阶段,规模已跃居世界首位。目前我国已经建成了六大跨省区的电网,分别是南方、西北、华东、华中、华北和东北这六大电网,输电线路总长度超过了115万千米,500KV及以上的输电线路已成为各区电网输电主力。我国的国土幅员辽阔,地形也相对复杂,丘陵较多、平原较少,加上气象条件的复杂多变,给跨区电网和超高压输电线路工程的建设带来一定难度,加上建成之后的维护与保养,仅仅依靠现有的检查手段和常规测试并不能满足高效快速的要求,也不能达到很好的效果。无人机技术的运用,能够很好的完成电力巡检和建设规划任务,将深度学习与无人机巡检技术相结合自然能得到电力企业的认可及大规模应用。


任务要求

【技术路径】

(1)基于深度学习(卷积神经网络等)的缺陷检测;

(2)参赛者可以自行设法获取不超过1000张图片数据

(背景不做要求,但必须针对线夹销钉松动)用于批量自动标注(而非手动标注)训练模型(后续记作模型2),完成自动批量标注的参赛者会有额外加分;


【技术指标】

模型1与模型2均要进行验证,以最终的200张图片数据源作为验证集,以mAP(数值在0-1之间)为验证指标,针对测试集,要求模型1的mAP在0.65以上,模型2的mAP在0.6以上;


【提交标准】

请参赛者从电力巡检角度出发,设计一套满足巡检需求

的方案:

(1)针对有缺陷的图片,能够准确的用矩形标注缺陷位

(2)参赛者可以只提交模型1,也可以提交模型1和模型2,但对于测试集,要求模型1的mAP在0.65以上,模型2的mAP在0.6以上;

(3)参赛选手的最终得分为:模型1的mAP值*50*0.3+

模型2的mAP值*50*0.7(满分100分,如果只提交模型1,则模型2的mAP值记作0)


【赛题亮点】

本赛题旨在鼓励各个参赛选手通过思考、实践来解决目前基于深度学习的缺陷检测中的一大技术难点——手动标注训练样本,对于解决此问题的参赛者可以获得更高的分数。另外,为了鼓励更多参赛者能够参与到比赛中来,这里允许参赛者通过手动标注的方式来训练模型。


【任务清单】

(1)针对只是上交模型1的参赛者,需要上交模型源代码或者可执行文件;

(2)针对上交模型1和模型2的参赛者,需要上交所有模型源代码或者可执行文件,另外还要上交用于自动标注而非手动标注的数据源和自动标注的程序;

(3)上交的可执行文件需要有程序说明文档,说明程序原理。


参考信息

【参考工具】

labelImg

【参考资料】

https://github.com/experiencor/keras-yolo2

https:///darknet/yolo

http://blog.csdn.net/hjimce/article/details/50187029

【数据接口】


2

公路干线物流区域货源供需关系预测与区域间调度 


背景说明

公路干线物流是这样一种场景:托运方(货主)在平台发布货源信息,通常需要 4.2-17米的货车,货源包括但不限于:钢件,化工原料,建材,农产品,快递等。承运方(司机)寻找可以承接的运输任务,然后进行单程的公路运输行为。当前的货运供需市场是不透明的,发货量和司机数量并不匹配,去程和回程也不匹配。供需双方受到很多因素影响。这造成了巨大的资源浪费。比如空载率高,货运价格波动严重等。 


问题说明

提供江苏省地区最近三个月的发货信息,司机行为日志,该区域内的司机 GPS 坐标打点状况,以及地区天气状况等数据。其中司机行为日志包括司机的浏览货源,点击货源,拨打电话货源日志。GPS 坐标打点为每十分钟上传一次打点经纬度位置信息,天气状况为江苏省最近三个月对应的各个区县的天气数据。在有了这些不同类型的训练数据之后,需要对江苏各区县未来一周的发货量和司机量进行预测,并根据预测结果在供需不平衡的地方引导司机弥补供需,进行路线规划的方案。 


用户期望

能够根据历史数据,准确预测次日各个区县、地块的发货数量和活跃司机数量。并对供需不平衡的地方进行倒流调整。满足供需平衡,同时降低空载行驶里程。 


经济指标

提升货源运输效率(货源成交率),降低空驶率和燃油消耗。 


技术路径

其中hi表示某地区某天的预测量, u表示该地区该天的实际值。RMSEcargo表示发货量预测结果的均方根误差,RMSEdriver表示司机量预测结果的均方根误差,score 为参赛者本次提交预测结果的最终得分。 


提交标准

1. 初 赛 时 提 交 江 苏 省 个 区 县 最 近 一 周 对 货 源 和 司 机 的 预 测 结 果 到http://aidata. 比赛平台,根据技术路径中的评分标准,对预测结果进行打分排名 

2. 根据训练数据预测得到的发货量和司机量之间的比例关系,提供路线规划调度建模方案


任务清单

1. 对未来一周日内江苏各区县的发货量和司机量进行预测 

2. 根据问题 1 中预测的发货量和司机量之间的比例关系,提供路线规划调度建模方案 


参考

可以使用 github,学术文献在内的任何思路或技术进行实现。可自行检索关键字:回归预测。到达时间预测。线路调度。 


数据接口

司机 app 内访问日志(浏览,点击,电话) 

货主发货记录 

司机 GPS 打点记录 

城市间公路距离 

城市天气记录 

用户画像表(司机表,货主表) 


备注

打开实现设计链接: http://aidata. 


3

红外视频图像中移动目标识别处理 


背景说明

【整体背景】 

随着视频技术与计算机的普及应用,与之相关的基于视频图像处理的视频识别技术也得到广泛的研究和应用。视频中的运动目标检测、目标分类、遮挡处理和多目标跟踪技术已经成为计算机视觉领域研究的热点,有着广阔的应用前景。


项目说明

【问题说明】 

利用先进光学视频图像处理分析技术,实现在复杂环境条件下对小目标的探测识别,对于红外视频图像中的模糊图像自主、快速有效的智能识别,并自动进行分类信息标定。支持对多种制式和多种清晰度的红外视频进行识别处理。 


【用户期望】 

1)能够实现复杂环境条件下小目标的识别; 

2)能够对运动场景下机动目标进行智能识别及分类,并自动进行分类信息标定; 

3)能够依据输入的相机位置(经纬度信息)、速度(0-60km/h)和移动方向计算出视频中所出现目标的相对位置、距离信息、大小、速度;

4)能够对指定类目标进行搜索,并给出目标出现场景的帧定位信息;  

5)能够标记视场背景下选定目标的运动轨迹; 

6)能够对视频质量进行评估,对目标识别准确性进行预估; 

7)能够实现对多种制式和多种画质的红外视频进行识别处理; 


【预期经济效应】 

红外视频目标识别技术在民用和军事的诸多领域中都具有极为广阔的应用前景,包括智能监控、基于视觉的人机交互、智能交通、机器人视觉导航、精确制导系统等,本方案可应用于航海搜寻,路面交通监控、地铁安防、视频监控等,具有巨大的经济效应。


任务要求

【技术路径】 

基于WINDOWS/安卓/linux等计算机操作系统。

 

【技术指标】 

(所需达到的各项详细数据指标和要求) 

1)能够有效处理运动速度0-60km/时的红外视频图像; 

2)能够对≤10m×5m×3m小目标的有效识别; 

3)基于数量≥100的目标数据,识别分类标定正确性≥80%; 

4)目标识别响应时间≤5s; 


【提交标准】 

请参赛者依据项目说明与任务要求,设计并实现一套软件系统。 

作品展示时由参赛者自带电脑,出题方提供测试视频(U盘存储),参赛者对系统方案进行介绍并进行现场演示。 


【任务清单】 

任务时间要求:具体时间可能会调整,届时将另行通知。

5月底赛题发布、报名参赛; 

6月10日前申领训练集; 

6月29日申领验证集; 

7月29日任务清单提交; 

7月31日现场评审、结果公布。 

训练集与验证集申领方式:参赛者报名成功后通过答疑邮箱申请领取。 

任务清单包括但不限于产品的可执行程序安装包、软件文档。 

软件文档应包括《概要设计及详细设计》、《测试报告》、《用户手册》。《概要设计及详细设计》应包括算法模型,软件模块。 

现场评审时由参赛者自带电脑,出题方提供测试视频,参赛者对系统方案进行介绍并进行现场测试。由评委根据提交本赛题评分准则进行现场打分、统计,公布获胜队伍。 

评分准则参见下文附件《红外视频图像中移动目标识别处理评分细则》。


参考信息

【参考工具】 

混合高斯模型 


【参考资料】 

(赛题解决方案中可参考的相关技术资料) 

[1]基于红外视频流的机动目标识别技术研究.张文廷,姜月秋,高宏伟.沈阳理工大学.2016 

[2]红外目标识别图像复杂度度量方法综述[J]. 乔立永,徐立新,高敏.  红外技术. 2013(02) 

[3]红外图像序列中的人体检测算法[J]. 龚卫国,杨金妃,李建福.  计算机工程. 2010(23) 

[4]智能视频监控中的目标识别与异常行为建模与分析.张一.上海交通大学.2010 

[5]基于特征知识的视频识别技术.杨海璐.北京邮电大学.2015 

[6]视觉显著性在视频目标识别中的应用研究.梁何.南京邮电大学.2016 

[7]多种角度比较SIFT、SURF、BRISK、ORB、FREAK算法

[J]. 索春宝,杨东清,刘云鹏.北京测绘. 2014(04) 

[8]视觉显著性应用研究[D]. 敖欢欢.中国科学技术大学 2013 

[9]Multiscale Symmetric Part Detection and Grouping[J].Alex Levinshtein,Cristian Sminchisescu,Sven Dickinson. International Journal of Computer Vision . 2013 (2) 

[10]Speeded-Up Robust Features (SURF)[J] . Herbert Bay,Andreas Ess,Tinne Tuytelaars,Luc Van Gool.  Computer Vision and Image Understanding . 2007 (3) 


【数据接口】 

无 

 

附:红外视频图像中移动目标识别处理评分细则

本细则使用方法:评委根据参赛者提交的文档与现场演示情况,根据评分标准对每项指标进行打分。 前七项权重*打分之和加上第八项得分,计算得总分,总分高者夺冠。


4

复杂业务场景下的安全身份认证算法


背景说明

【整体背景】 

进入信息时代,无论是银行、电信运营商,还是政府部门,面向客户的经营活动越来越强烈地依赖信息资源和信息网络,而网络在带来利益、价值和方便的同时,也带来了巨大的风险和安全隐患。很多犯罪分子利用虚假身份信息或者通过匿名制的方式进行相关业务办理,搭建违法犯罪的工具,给社会安定带来了破坏。 

电信、金融、网络诈骗犯罪是严重影响人民群众合法权益、破坏社会和谐稳定的社会公害,为更加有效防范、精准打击电信网络诈骗犯罪,切实保障人民群众合法权益,进一步完善业务受理环境、落实用户真实身份信息登记制度可极大减少匿名制滋生的各类信息骚扰和违法犯罪活动。 


【业务背景】 

运营商、银行、市政业务等诸多部门每时每刻都在面向不同的、大量的用户群体开展各类(包括不同安全等级)业务办理,情形复杂多变,很容易被犯罪分子钻空子。为保证业务的安全性、高效性等,必须对用户身份的真实性进行多种核查,这就需要对相关视频、图片、声音等信息具有多种核查、身份认证的技术手段,在尽可能保障安全性的同时,还需满足业务规范性要求、高准确性、高效率等多项指标要求,因此需要多种技术能力具备上述的各项能力,以面对各复杂业务、各安全等级业务、突发情况下的业务受理也包括相关时间段、地点下出现相关情况的业务受理,尽可能减轻人工参与量,在提高安全性的同时也为受理单位节省大量人力、物力,具有较好的社会、经济效益,因此开发多生物特征的安全身份认证系统势在必行。 


项目说明

【问题说明】 

本项目中的复杂业务场景下多生物特征的安全身份认证系统主要以人脸身份认证和声音特征认证两大较为成熟使用的生物特征为主,人脸身份认证主要通过活体、图片业务规范性检测、伪造照片识别、相似照片办理、人证比对、人脸搜索(黑灰白名单检测等)等6个技术方法来实现,声音身份认证则通过语音内容识别和声纹识别2个方法来实现。 


【用户期望】 

(1)目前用户在业务受理后,都配有较多人员对业务受理中的身份信息(包括业务单签名、图片真伪、图片中人员身份信息等)进行稽核,在人脸身份认证中如伪照片、不符合业务规范照片、黑灰白名单检测等需要高“查全”能力强,也就是该系统面对错误数据的情形下都能尽可能找到相关问题数据; 

(2)人脸身份认证的“查准”可靠性高,该系统在面对一定的样本数据的情形下可以精准地查找到需要的数据; 

(3)系统的应用场景可多样化,能够适用于不同的业务场景,节约业务部门的工作量,提高工作效率。 


【预期经济效应】 

(1)直接经济效应。 

保证用户身份安全越来越得到政府、电信运营商、银行等单位的

重视,此系统一旦得到大面积推广,在国内的市场前景预计可达50亿

元以上。 

(2)间接经济效应。 

此系统上线后,可有效避免犯罪分子的趁虚而入,大大降低电信、金融等诈骗犯罪的案发率,每年可为国家和普通群众挽回数以百亿计的损失,为社会的和谐稳定贡献力量。 


【设立3个分项与1个综合项的奖项说明】 

设立3个分项与1个综合总项,分别如下 

图像类: 

第1大类:防伪、欺诈类,具体包含活体、图片业务规范性检测、伪造照片识别、相似照片办理等4个子方面。关于该类的各情况的分数构成及权重见【比赛说明】的5.1部分,为百分制,得分最高为一等奖 

第2大类:身份识别类,包括人证比对、人脸搜索。关于该类的各情况的分数构成及权重见【比赛说明】的5.2部分,为百分制,得分最高为一等奖 


语音类: 

语音身份认证:语音内容识别、声纹识别。关于该类的各情况的分数构成及权重见【比赛说明】的5.3部分,为百分制,得分最高为一等奖 


综合类:

参加完了图像的2大类、语音1大类所有3个子项进行分数汇总。关于该类的各情况的分数构成及权重见【比赛说明】的5.4部分,为百分制,得分最高为一等奖 

          

【测试说明】 

1、出题方将根据每个技术方法为每队参赛者提供相关测试数据。

2、对于活体、图片业务规范性检测、伪造照片识别、相似照片办理等4种情况提供50-500不等的测试数据(和最终比赛测试数据类似的情况,下同)供测试用,数据提供方会对部分敏感数据进行脱敏放到网上供参考。对于人证比对、人脸搜索将提供1000-10000不等的测试数据。声音数据提供50-100人的30秒-1分钟左右的单通道录音数据片段及对应的标注文本供测试使用,包括安静及带部分噪声等环境,除了语速正常、字正腔圆的正常情况以外还包括平翘舌音不标准、略带方言、语速较快等情况。 

3、由于相关测试数据涉及企业生产信息,相关参与方需签保密协议,在测试过程中不能拷贝、拍摄测试数据等泄露提供数据方信息的行为,如有将请参与方删除,如有泄露出去,将请主办方进行相关规定处理 


【比赛说明】 

1、由于涉及出题方的数据信息,出题方将提供机器环境,包括cpu、gpu环境的windows、linux2种操作系统的机器 

2、对于活体、不符合业务规范图片检测、伪造照片识别、相似照片办理等4种情况提供各小项50-800不等的类似测试数据的数据供比赛用。对于人证比对、人脸搜索将提供10000-300000不等的比赛数据。 

3、比赛图片数据的每张处理速度如在cpu环境下,不能超过3秒/张,gpu环境下不能超过2秒/张 

4、对于语音识别提供100-200人的30秒-1分钟左右的单通道录音片段作为比赛数据(详细情况见上述测试数据相关说明)。 

5、关于几项内容的分数构成(再确定) 

5.1、涉及安全性较多的防伪类包括活体、图片业务规范性检测、伪造照片识别、相似照片办理等4种情况。如各项中含有子项,其中分项中除伪造照片外(该分项的查全、查准按照0.55、0.45的权重算各子项的分数)涉及查全、查准的按照0.5、0.5加权平均作为最后的该子分项的准确率百分比,将各子项相加平均对应的百分比即为该分项的最后的分数,最后将上述4项的分数分别按照0.15、0.15、0.6、0.1等各权重加权平均算总分,该大项总分数为100分 

如下图所示:

5.2、 涉及人证比对、人脸搜索等将按照第一准确率算百分百比,换算成数目对应的分数,按照0.55、0.45的加权平均,算出最后的该大项的分数,总分数100分 

如下图所示 

5.3、 涉及声音身份认证的,根据识别内容、声纹等2类将按照第一准确率算百分百比,换算成数目对应的分数,按照0.55、0.45的加权平均,算出最后的该大项的分数,总分数100分 

如下图所示 

5.4、最后总分数将按照0.45、0.35、0.2的权重对上述各自大项(按上述顺序)进行加权平均,满分为100分 

如下图所示 

5.5 最后按照百分制的对各参赛单位进行总分排名 


【自主研发说明】 

为保证公正、公平,不得使用成熟的第三方接口、sdk,借大赛促进人工智能算法的研究、开发、应用的发展,主办方委托专家团队在保证参赛队伍知识产权的前提下对进入名次的单位进行是否自主检查,以下是细则 

1、要求各参赛单位各个功能都是自主研发的,不得调用第三方接口、sdk(如市面上公开的人脸、语音识别等sdk)等方式,如有,主办方将根据情况降低或取消对应分项分数 

2、为保障各参赛单位的知识产权同时相关参赛单位为证明自己的算法自主性,如有必要可以提前制作好各自的docker镜像,比赛完后可以删除掉 

3、参赛方需对自己的算法原理、处理过程进行说明,同时如有涉及参赛单位的隐私,可以以口头说明的形式加以说明 

4、为验证进入名次单位的算法自主性,主办方根据情况请相关专家对代码的自主性进行验证,方式根据参赛情况确定。如在特定的机器上请参赛方以docker镜像等方式进行代码编译,然后对同样的数据执行出比赛中的同样结果等方式,同时为保障参赛方的知识产权要求,机器提供方可以根据参赛方的要求删除掉镜像甚至重做整个系统等


任务要求

【技术路径】 

多生物特征: 

(1)人脸身份认证:活体验证、不符合业务规范图片检测、各类伪造照片检测、相似照片识别、人证比对、人脸搜索; 

(2)声音特征分析:语音内容识别和声纹识别。 


【技术内容与评价指标】 

1、活体识别 

内容说明:需有6个动作:头部向上、下、左、右、眨眼、张口,每次识别时随机提供2-4种动作

评价指标: 

查全: 不能遗漏动作 

查准:动作识别的准确性 

该项分数:按照各0.5加权相加算该项最后的分数 


2、图片业务规范性检测

内容说明 

a) 大侧脸检测:指脸部侧度过大,无法准确、完整识别五官等关键的脸部信息,包括脸的侧边轮廓、侧脸后眼睛、嘴巴等不能完整显示

b) 遮档检测:脸部五官被部分遮挡无法全部识别脸部信息,包括但不限于用手、带深色(墨镜)眼镜、带帽遮挡、口罩等以及其他物体(业务办理中电脑等)的遮挡。 

评价指标:

查全: 不能遗漏上述违规情况。(注:关于查全应该根据图片的真实情况来,有什么就是什么,遗漏了则计入查全。还有的情况为综合的,应以事实情况计算,其它类推。在比赛时数据提供方尽量少或不提供很复杂的含有多种情况(含有多个不符合业务规范、防伪子类等)的图片以方便计算相关指标,下同) 

查准:检测违规情况的准确性 

该项分数:按照各0.5加权相加算该项最后的分数


3、伪造照片识别 

主要包括利用各种工具进行人像的翻拍、p图合成(包括办理照、大头照等)等,要求能够在正常照片、各种伪造照片合在一起的情况下,将下述的各类伪造、正常照片能区分开来 

a) 手机照片:识别出用手机中的照片作为拍摄对象的照片 

b) 纸片照片:识别出用纸片上的照片作为拍摄对象的照片 

c) 电脑照片:识别出直接使用电脑的照片 

d) 水波纹照片:识别出水波纹特点的伪造照片 

e) 噪音照片:识别出有噪音(翻拍时会有人的头发出现类似放电等情况)的伪照片 

f) PS图片:识别出PS过的图片,包括拍摄照、大头照 

g) 明显翻拍的照片:不清楚上述情况的下的较为明显的翻拍 

h) 算法生产的图片:通过算法生成相关业务办理图片以及脸,如通过GAN相关模型生成的图片 

i) 一般翻拍的照片:不清楚上述情况的下的不太明显的翻拍 

j) 其它:如照片中不存在人像、明星照片、颜色异常等情况 


评价指标 

查全: 不能遗漏上述违规情况。另外补充说明有的伪造照片会呈现多个伪造特点如在手机翻拍的情况下会有水波纹甚至还含有电脑翻拍的情况,这样就会有3种情况,因此计算查全时除了图片中呈现的单特征外,还包括多个特征中含有该情况也要计算在内,其它多个情况下类推 

查准:检测违规情况的准确性。另外补充说明有的伪造照片会呈现多个伪造特点如在手机翻拍的情况下会有水波纹甚至还含有电脑翻拍的情况,这样就会有3种情况,以此为例查出一种情况为0.333分,两种成功为0.6666,三种成功为1分,其它多个情况下类推 

该项分数:分别按照0.55、0.45加权相加算该项最后的分数 

 

4、相似照片识别 

在业务办理过程中,利用留存的照片在进行不更改、稍微更改等情况下,在真人不用到现场的情况下进行业务办理,需要将相同、相似的图片检测出来 

评价指标 

查全:不能遗漏上述违规情况 

查准:检测违规情况的准确性 

该项分数:分别按照0.5、0.5加权相加算该项最后的分数 


5、人证比对 

在真实生产的复杂业务情况下,只有经过上述的防伪识别后才能进行人脸身份认证,因此要求在此参与的图片理论上伪照片要很少甚至没有,如有将计入查全的准确率,如有参与认证比对、搜索的有100张照片,但是其中还有10张左右是伪造照片,因此在此处进入下个环节的查全为0.9,后面认证比对、搜索的最终的查全率为0.9*子项查全率。 (提示:因此如有意参加综合或参加该类比赛的队伍为提高进入的合格图片的查全率,可以对前面的各种防伪技术进行合理优化,如只参加防伪单项则不存在该问题) 

该大项和前面的防伪大项的总体过程如下: 

人证比对是通过现场拍照与证件上的头像进行快速比对从而确定用户身份 

评价指标 

查全:不能遗漏办理人员(主要是识别不到人脸)。在此应乘以防伪检查后图片进入该环节的查全率为该部分的最终查全率。如由于前一步的防伪检测遗漏下10张伪造的(总共100张),真实合格的图片为90,因此该处的查全为0.9*该子项的查全 

查准:包括相同人、不同人的双准确性,二者平均值为该指标的准确率 

该项分数:分别按照0.3、0.7加权相加算该项最后的分数 

 

6、人脸搜索 

在真实生产中,只有经过上述的防伪识别后才能进行人脸身份认证,因此要求在此参与的图片理论上伪照片要很少甚至没有,如有将计入查全的准确率。计算方法为乘以该处的查全因子,计算方法参照5

人脸搜索指通过拍摄用户的脸部信息,并迅速从数据库中调取用户的信息,准确定位用户的身份,以在业务办理中知道黑、灰、白名单 

评价指标 

查全: 不能遗漏需要搜索的人员(主要是识别不到人脸) 。计算方法为乘以该处的查全因子,计算方法参照5该项查全指标计算 

查准:包括在黑、灰、白名单中人员以及陌生人,二者平均值为该指标的准确率 

该项分数:分别按照0.3、0.7加权相加算该项最后的分数 

 

7、语音内容识别 

语音内容识别通过识别说话人录音片段,识别出说话内容并对比识别文本和对应的标注说话,获取识别准确率。语音内容识别应准确、完整地反映用户的语音信息。 

评价指标 

查准:包括不能多、遗漏、内容准确等几种情况下的准确率,几者平均值为该指标的准确率(将识别出的文本与标注文本一一对应求出准确率,包括安静环境和带部分环境下内容准确率,两者平均值作为该指标的准确率) 

 

8、 声纹识别 

声纹识别通过对比识别出的用户标签与实际用户标签,获取识别准确率。声纹识别要求从声纹信息中准确辨别出用户。 

评价指标 

查准:在黑灰白名单中的以及陌生人2种情况下的准确

率,2者平均值为该指标的准确率 

 

【提交标准】 

请参赛者从开发者角度,设计一套满足上述开发需求的方案,参赛者需独立开发完成全套系统,不能引入第三方参与其中。 

(1)人脸身份认证功能模块(包括上述的几种功能); 

(2)声音身份认证功能模块(包括上述的几种功能)。

 

【任务清单】 

(1)方案文档,包含系统的原理说明 

(2)执行程序 

(3)含全部(或部分)源码或含源码的打包好的执行环境,如含源码的docker环境 


参考信息

【参考工具】 

无 

【参考资料】 

无 

【数据接口】 

无 


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多