分享

高速公路AI稽核系统建设及数据分析

 guoxiongxin 2022-08-15 发布于广西

作者:谢鹏远(山西交通控股集团有限公司)

摘要:随着省界收费站全部取消,全国实现了“收费一张网”,极大地提升了高速公路路网通行效率,然而在经济利益的驱使下,偷逃通行费行为层出不穷并呈现出多样化、隐蔽化特点。传统稽核方法存在依赖人工、遏制难度大、运营服务能力不足等问题,无法满足新收费模式下的稽核需求。本文基于大数据、边缘计算、AI算法等技术,对AI稽核系统平台建设进行了探讨,提出了多流水融合路径还原、边缘计算实时稽查、多维AI稽核引擎等方法,并建立了多种偷逃费稽核模型。结果表明,AI稽核系统可有效核查多种偷逃费行为,模型准确率高,能够满足核查需求。

截至2019年底,全国29个联网收费省份487个省界收费站全部取消,实现了全国“收费一张网”[1]。据统计,全国拥有ETC客户1.92亿、门架系统24588套、ETC车道48211条、不停车称重系统11401套,在大幅提高高速公路通行效率的同时[2],偷逃通行费行为呈不断增长态势,偷逃通行费金额巨大,且呈现出多样化、隐蔽化、高科技化的特点[3],严重扰乱了高速公路收费工作正常秩序。为有效克服传统稽核手段存在的弊端,本文基于大数据、边缘计算、AI算法等手段的稽核方法[6-7],针对山西省全过程、全时段、全区域深入挖掘偷逃漏通行费行为,通过深度研究车辆抓拍图像、通行流水及多维度结构化通行轨迹等方式,真实还原通行过程车辆信息,为偷逃漏通行费稽核提供证据链判定,达到维护高速公路正常收费秩序和公平缴费环境、有效防范和遏制偷逃漏通行费行为、提升实时交易和稽核追缴成功率、有效降低偷逃漏通行费比重的目的。

传统稽核方法存在的问题

随着高速公路路网不断扩大,不法车辆利用各种形式偷逃通行费且隐蔽性强,给国家、企业造成了巨大经济损失。然而,传统稽核手段[4-5]存在以下问题:(1)依赖人工识别,存在稽核准确性不高、效率低下、手段单一,且数据量大、分散程度高、人工筛选难等问题,导致缺乏追缴证据链;(2)遏制难度大,换卡逃费、大车小标等传统偷逃通行费行为难以遏制,新型偷逃通行费行为层出不穷;(3)运营服务能力急需提高,由于高速公路通行费计费方式不同、计费金额差异等原因,社会负面影响大,车主用户满意度低,且现场稽查带来的拥堵情况难以避免;(4)稽核信用体系缺失,行车信息与社会信用未形成关联,无法纳入不良征信体系并对人车黑、灰和预警名单等信用低下车辆规范行车或驾驶行为。可以看出,传统稽核手段已无法满足当前高速公路运营管理需要。

AI稽核系统总体建设方案

本文重点分析ETC识读率低、牌识流水与抓拍率低、假冒减免车辆、套牌、改变缴费路径作弊等问题,从提高数据采集的精准性、数据传输的可靠性、数据分析的智能性3个方面出发,创新引入AI流量卸载、人工智能、大数据、边云协同等技术,充分利用ETC门架、收费站等流水和图像信息,开展多流水融合路径还原、边缘计算实时稽查、多维AI稽核引擎等方法研究,实现智能实时稽核,解决人工投入大、时效性差等问题,同时不断提高稽核追缴成功率,形成稽核业务闭环“一张网”,总体设计思路如图1所示。
图片
图1 AI稽核系统总体设计
(一)数据源
数据源是开展收费稽核工作的基础,包括通行、交易、牌识、视频等采集数据和车辆发行、路网、费率、节点等基础数据,具体如下[8]
1、车道收费数据
具体包括车道收费交易数据和车道牌识数据,其中车道收费交易数据包括出入口站点、出入口时间、车牌、车型、轴重、轴数、行驶里程、收费金额等;车道收费牌识数据包括收费站编号、抓拍时间、识别车牌号、识别车型、抓拍图片等。
2、门架计费数据和牌识数据
具体包括门架计费交易数据和门架牌识数据,其中,门架计费交易数据包括入口信息、交易时间、车型、车牌、计费里程、计费金额等;门架牌识数据包括门架编号、抓拍时间、识别车牌号、识别车型、拍摄位置、抓拍图片等。
3、发行数据
包括ETC和OBU的发行数据,具体包括发行省份、发行时间、车牌、车型、颜色、图片、轴数以及办理人的相关信息。
4、跨省拆分数据
包括车辆跨省通行的车辆通行数据和收费数据,具体包括车辆通行收费站出入口数据、车道交易数据、门架计费数据等信息。
5、全省治超数据和治超牌识数据
主要包括车辆通行数据、计重数据和牌识数据,具体包括车辆通行时间、车牌、车型、轴重、轴型、图片等数据。
(二) AI稽核系统设计思路
1、AI稽核网络拓扑
AI稽核系统采用了大数据集群服务器、地图引擎服务器、应用服务器,网络拓扑如图2所示。其中,大数据集群服务器主要对收费数据、发行数据、拆分数据、治超数据、牌识数据接收、存储以及对稽核模型、路径还原等进行计算,还能通过倒排索引对数据进行高性能检索;地图引擎服务器主要实现地图图层加载、路网模型计算;应用服务器主要实现对AI稽核系统的部署和接口的数据交互。
图片
图2 AI稽核网络拓扑
2、AI稽核系统架构
AI稽核系统基于Hadoop框架进行开发,利用Hadoop大数据平台的实时流计算能力完成高吞吐量、具备容错机制的实时流数据处理,利用HDFS、HBASE、HIVE组件完成关联性数据存储,存储方式为以车牌为中心,图片、流水、车牌颜色、门架、出入口等相关属性数据组合,数据流向如图3所示。其中,HBASE中主要按照车牌、时间等设计主键来实现分区的均匀分布和快速检索,并通过HBASE的触发插件在数据插入过程中,将以车牌为中心的属性异步发送到分布式倒排索引模块。分布式倒排索引模块负责按需要业务查询的属性进行索引倒排处理,把数据导入到ES中。
图片
图3 AI稽核数据流向示意
同时,鉴于数据存储介质、数据存储类型和数据传输方式的差异,通过不同工具实现异源、异构数据的导入。其中,对实时性要求较高的监测数据以分布式消息队列的形式由Kafka分发;关系型数据库由Sqoop等工具直接将数据导入HDFS;非实时性数据选择MapReduce计算引擎,实时性要求较高的数据选择Spark或Storm计算框架。
3、AI稽核系统流程
AI稽核系统流程如图4所示,可分为4个步骤:(1)省中心数据、拆分数据、治超数据、发行数据等接收汇聚至大数据平台,通过稽核模型数据验证,得到疑似偷逃费数据;(2)系统根据疑似偷逃费数据,自动匹配生成稽核工单和证据链,并推送至省中心稽核平台及稽核应用;(3)省中心稽核平台将稽核工单和证据链推送至收费站,一线稽核人员确认后提交追缴工单,工单提交至路段和省中心进行审核;(4)省中心稽核平台审核完毕后,生成追缴名单,并反馈校验结果、稽核结论等至AI稽核系统。
图片
图4 AI稽核系统流程
(三)路径还原
路径还原是开展稽核分析工作的前提,本文通过利用多流水融合路径拟合方法,通过利用ETC门架交易数据和牌识数据、收费站出入口交易数据和牌识数据、治超通行数据和牌识数据、费率数据及路网带权有向图等进行车辆通行路径还原,对通行数据和牌识数据损失严重的通行车辆通过历史通行数据进行路径通行概率预测,实现路径还原。
1、GIS地图标注
地理信息系统(GIS)是开展存储、管理、分析等与空间相关的信息系统,由于收费站、ETC门架是路径还原的关键节点,基于路网基础信息将收费站、ETC门架、费率、隧道、桥梁等高速公路基础设施单元及相关设备标注到GIS地图上,同时将每一个计费单位在GIS进行标注和划分,形成基础信息图层、门架和收费站图层、计费单元图层、带权有向图的节点图层等。
2、路径还原模型
在路径还原之前应先开展路径融合工作,即通过对交易流水(交易凭证)/通行流水、图像流水比对分析,判断车辆路径节点证据链是否完整,具体标记规则如表1所示。

表1 车辆路径节点证据链标记规则

图片
路径节点证据链符合要求后,即可根据车辆类型、出入收费站、途径ETC门架等条件,基于带权有向图进行车辆路径还原(通行路径拟合),如图5所示。路径还原后对合并路径有效性进行判断,对于异常路径,系统自动剔除。
图片
图5 通行路径还原示意
(四)稽核模型建立与准确率验证
本文所述AI稽核系统根据不同逃费类型建立对应模型,目前已实现大车小标、有入无出、屏蔽卡签入省、屏蔽卡签出省、跑长买短、CPC倒卡、CPC入OBU出、一车多卡、一车多签等近10种偷逃费行为稽核。以大车小标偷逃费行为进行举例说明。
改变车型(车种):大车小标是指发行车型跟实际车型不符。通过非法手段办理或套取使用与实际车型不符的车辆标签,达到偷逃费的目的。稽核数据验证方式如下:
(1)通过交易数据中的车牌、车牌颜色和车型与发行数据对比,确定大车小标;
(2)利用入口称重数据,在收费数据中的入口交易数据搜索轴数与车型不符的车辆;
(3)搜索收费数据中的入口交易数据,车型为一型货车,且车牌颜色为黄色的车辆;
(4)筛选车辆通过ETC专道和人工车道的收费车型存在不一致的情况,通过车牌号筛选某个车牌多次出现两个及以上的车型的车辆;
(5)对筛选出的车辆,根据大数据平台图片、交易数据,对特征点进行对比分析,形成初步结论。
通过对稽核模型分析数据与稽核人员核实数据对比分析,进行稽核模型分析筛查准确率验证,稽核模型准确率如表2所示。屏蔽卡签、倒卡通行介质等稽核模型准确率较高,达90%,有入无出(闯关、跟车)、跑长买短(U/J行驶)因系统及计费规则、现场管理和证据获取等多重因素影响,准确率为50%~60%左右,但能够满足稽核业务需求。稽核模型准确率如表2所示。

表2 稽核模型准确率

图片

稽核结果数据分析

利用AI 稽核平台对山西省2020年5月6日至2021年12月31日通行数据进行全量分析,共筛查累计筛查疑似逃费车辆67.3万台、涉及行程约141.5万车次、涉及总金额1.05亿元,根据稽核模型准确率测算,预测逃费车次95.8万车次,预测逃费金额0.75亿元,截至2022年1月底,各高速公路运营公司稽核人员完成全部疑似逃费数据审核,完善证据链,最终确认逃费车次93.5万车次,确认逃费金额0.74亿元,已追缴5500余万元。具体按逃费类型分析如下。
对大车小标、有入无出(闯关、跟车)、屏蔽卡签入省、屏蔽卡签出省、跑长买短(U/J行驶)、CPC 自倒卡、CPC 入 OBU 出等7种逃费类型进行分析,各类型对应涉及行程数、涉及金额及确认逃费金额如表3所示,疑似逃费涉及金额占比如图6所示,确认逃费金额占比如图7所示。

表3 不同逃费类型分析结果

图片
图片
图6 不同逃费类型疑似逃费涉及金额占比
图片
图7 不同逃费类型确认逃费金额占比
分析可得,有入无出(闯关、跟车)、大车小标(丢轴)、屏蔽卡签出省和跑长买短(U/J行驶)等4种逃费类型分别占据涉及行程数的96.87%、疑似损失金额的95.9%,是稽核系统需加大核查力度的逃费类型,特别是屏蔽卡签逃费车次占为11%,逃费金额占比却达25%,以全网联网收费运行模式下出现的新型逃费类型,需要从技术、管理等多方面加强管理。有入无出(闯关、跟车)和跑长买短(U/J行驶)2类逃费类型确认逃费金额占比有所下降,直接原因是稽核模型准确率不高。下一步应持续优化迭代这2类模型,尽可能提高其准确率,从而不断提高可追缴比例。

结束语

本文针对ETC识读率低、牌识流水与抓拍率低、假冒减免车辆、套牌、路径作弊等收费问题,搭建了AI稽核系统平台,实现了多源异构数据的采集、存储、处理与分析。在深度融合ETC门架、收费站等流水和图像信息的基础上,提出了多流水融合路径拟合方法真实还原了通行过程车辆信息,为偷逃漏通行费稽核提供了完整证据链。同时,深度分析了所辖区域2020年5月至2021年12月间数据,结果表明,AI稽核系统模型准确率较高,可有效防范和遏制偷逃漏通行费行为,提升稽核追缴成功率。
参考文献
[1] 王莫凡,吴烈阳. 取消高速公路省界收费站后稽查方案探讨[J]. 中国交通信息化,2020(12).
[2] 李银珍.取消高速公路省界收费站给社会经济带来的积极影响运用[J].内蒙古煤炭经济,2020(19).
[3] 朱彦蓉. 取消省界收费站背景下收费稽查平台研究与设计[J].西部交通科技,2020(5).
[4] 谭峰,李密,曾春江,等. 基于中台技术的取消高速公路省界收费站系统研究[J].中国交通信息化,2021(S1).
[5] 刘春成,吴博,倪悝,等. 基于AI的收费稽核研究与实践[J]. 中国交通信息化,2021(S1).
[6] 王虹. 从人工到大数据+AI:“一张网”稽核加速中[J]. 中国交通信息化,2020(11).
[7] 杨晓寒,彭亚荣. 面向ETC自由流的收费管理探讨[J]. 中国交通信息化,2020(9).

[8] 杨宝静. 取消高速公路省界收费站后的运营变化及管理措施[J]. 中国交通信息化,2020(1).

(原文刊载于2022年第7期《中国交通信息化》)

责任编辑 | 崔雪薇

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多