分享

阿里“安全AI”狙击网络黑产:机器抢茅台?暗语卖假包?不存在的

 AI报道 2019-12-26

2019年天猫双11,天猫超市推出2万瓶原价1499元的飞天茅台,被消费者一秒抢光。然而,据阿里安全风控专家透露,那一瞬间涌入的80多万订单中,风控大脑判定疑似黄牛和真实消费者的比例约为3比1。如果对黄牛的识别拦截能力不够,普通消费者根本就不是使用机器抢货的黄牛的对手。

阿里巴巴集团安全技术总经理钱磊在清华大学举办的AI与安全研讨会上表示,“在2019年天猫双11,99%的黄牛被阿里安全风控大脑拦截,让500亿补贴惠及真正的消费者,也确保正价茅台到了真正的消费者手中。”

0.01秒内百余项安全检测,虐哭黄牛党、羊毛党

酒圈里流传一句话:中国有两种白酒,一种是茅台,一种是其他白酒。

在贵州,每瓶500ml装53度飞天茅台可以用销售指导价1499元买到。然而在外地,消费者买正价茅台极难。2019年9月,茅台酒首次面向综合类电商渠道投放。目前可知的卖原价53度飞天茅台的电商平台只有两个,一个是天猫超市,每晚20点开抢;另一个是苏宁易购,但要预约茅台需要先购买苏宁SUPER会员或PP体育高级会员,还要实名认证、已有单笔订单76元以上的消费等要求。

茅台在电商平台上放货,最大的担心是平台上的货会不会流入到黄牛手上,这样对它的整个价格体系是一个很大的伤害和冲击,因为没有办法控价。

和黄牛一样令平台商家恐惧的还有“黑化”的羊毛党。“羊毛党”原本是一种昵称,指那些把每一分钱花在刀刃上,享受精打细算乐趣的人。这个群体实际是由电商平台和平台商家一手带大的。自从团购的“百团大战”、出行补贴大战之后,以补贴代替广告,直接向消费者让利来精准获客的方式成为一种常规的营销方法,“薅羊毛”的和“被薅羊毛”的双双受益,乐在其中。但是近年来,部分“羊毛党”堕入魔道,衍生出一条“黑灰产业链”,进而反噬平台、搞垮商家的事屡见不鲜。

2019年1月20日凌晨,有网友称拼多多存在重大Bug,“只需支付4毛钱,就可以充值100元话费” ,于是有大批用户开始“薅羊毛”。背后,其实是黑灰产团伙通过非正常途径生成的二维码扫码后获得这种优惠券,再将该二维码流传于社交平台相关黑灰产群,以试图在短时间内转移不当所得,涉案优惠券总额达数千万元。

“商家拿出千万搞营销,一半都被黑产薅走”,成为很多平台极速扩张业务、忽视安全防护的深刻教训。

2015年,阿里推出流量管理系统,从网关、手机端、云端、供应链等各个层面防范恶意流量,并将线索推给公安机关,形成线上和线下的全链路打击。

从2016年开始,平台的营销活动以指数级的速度不断增长,为保障商家和消费者利益,体系化的大促管理系统形成,从制定活动策略到优惠券发放都有全链路防护,不过,“之前大促为保证交易稳定,策略一般都是提前定好就不能修改了,‘羊毛党’就选择在大促前几个小时再行动。”阿里安全高级专家梁樟表示,阿里安全在2017年实现了大促期间实时调整策略,羊毛党的时间差没法打了。

然而,他们也在进化中,薅羊毛黑色产业越来越隐蔽。从虚拟机,到群控式,再到群控+“人肉众包”。

群控方式,黑产通过购置廉价手机组成手机墙,采用改机工具来修改设备信息,如手机型号、MAC地址、IMEI码(手机串码)、GPS定位、甚至手机号,不断伪造生成新设备。也有的直接刷入定制化ROM,同时采用群控软件来操纵手机,模仿真人自动完成相应的操作。进行点击、APP下载、激活甚至使用。同时,会伪造用户的分布、留存情况。

“人肉众包”的方式,是一个由“任务分发-多人点击-获利分配”等环节组成的链条,背后操盘的是“牛头”或“羊头”,他们有专属暗号,下面有大量“肉牛”,由于这些“肉牛”都是真人操控,“肉牛”都是普通羊毛党,只是为了赚取少量佣金,使用真实账号手动下单,将货物发往牛头提供的地址。有的“羊毛党”已经专业化到建立了一个“众包平台”,下单完成后提交订单号、收款账户等信息,还可以查询佣金到账进度。

如何找出“肉牛”却不损伤真实消费者,成为当下电商面对羊毛党等黑灰产的重要难题,对此,阿里安全整合用户注册、登录、下单等全链路环节,将过去分散的数据、风险类型、算法模型打通,沉淀到统一的安全AI体系,运用文本、机器学习、神经网络等算法技术,让不同任务、数据流和模态之间产生连锁反应,进而极大提高平台对商家端的保护效率。

“通过统一的安全AI体系,我们会把多维度的信息进行综合,判断是否为真实订单。”阿里安全高级算法专家施平说。阿里安全提供的数据显示,天猫双11的24小时,阿里安全风控大脑保护了388亿次用户操作,每一笔订单在0.01秒内都要经过百余项安全检测。

阿里巴巴商业操作系统的风控大脑

违规商户只是打算上架假货都能精准“击毙”

智能攻防仅是“安全AI”在具体场景中的应用之一。除此之外,“原创保护”也是阿里“安全AI”的另一重要应用场景。

钱磊表示,除了让商家放心卖,也必须得让消费者放心买。“放心买这个问题就涉及到知识产权问题,因为用户买东西最不放心的不是资金安全,最担忧的就是假货。”打假是个漫长而艰巨的工程,海量的商品种类需要借助AI实现高效率、高准确率的假货鉴别。

近日,美国服装和鞋履协会(AAFA)将一项旨在褒扬全球范围内对创新、社会责任、知识产权保护等问题做出关键贡献的企业和个人的奖项,颁给了阿里巴巴集团、联合国艾滋病规划署国际亲善大使等5个企业及个人。而就在4年前,AAFA还曾公开批评阿里巴巴旗下网站打假不力。

这4年里究竟发生了什么?

据钱磊介绍,以往,打假采取的“敌动我跟”的单点对抗策略,比如,是出现了假货,收集假货特征,被动跟随打击;现在是主动寻找假货特征,以及整个黑产的情况,综合多方面信息“摸底打击”,甚至在违规商户只是打算上架假货时都能精准“击毙”。

根据阿里公布的数据来看,过去3年,阿里还利用知产保护科技大脑协助全国31个省份、227个区县的警方抓获制售假嫌疑人4439人,捣毁制售假窝点4289个。仅以上海为例,今年上海警方借助这项技术,破获了涉案18亿元的全球最大跨国假LV案。

阿里人工智能打假核心技术“知产保护科技大脑”

2019年天猫双11期间,一个主播用暗语介绍、售卖假包,其在淘宝直播画面中未能“存活”超过20秒。被平台发现疑似售卖假货,这名主播的淘宝店和所售商品在直播中被当场处理。女主播也没想明白,自己刚拿到镜头前的假包在没有人举报的情况下是怎么被发现的。还有某假货商家,表面上是在淘宝卖一款蜗牛玩具,实际则通过卖玩具引流到社交软件平台,偷偷卖假冒名牌口红,不露痕迹,而仅仅一条“颜色特别美,不干不显唇纹”的好评却被“知脑”察觉,很快商家被清出平台。

这就是AI打假的强大之处。在主动使用多模态融合识别技术下,阿里将商品的图像、文本、SKU,用户行为、关系等用表征学习融合在一起进行综合判断;也使用图神经网络进行关系推理,会从更加全局的视角,也就是图的视角,去看待商品风险,在这种超大规模、高度异构、多模态的海量商品之上构建图神经网络。

打个比方,如果人工查看1张图片的信息需要10秒钟,那么5万人同时工作的效率才能勉强赶上“知产保护科技大脑”扫描甄别图片的速度。淘宝天猫平台每日新发商品量以千万计,如果人工巡查,138889人工作1天才能把这项工作完成。

阿里安全图灵实验室负责人薛晖透露,“知脑”系统的样本数据总量相当于186个中国国家图书馆藏量,仅累积的打假图片样本量就超过137亿张,用0.3毫米的标准相纸打印叠加后高达4110千米,是世界最高建筑迪拜塔的4964倍,约等于464个珠穆朗玛峰。

如此海量的数据对于AI而言,正是它所擅长的事。这套系统24小时自动运转,96%的疑似侵权链接在发布的时候就会被清除。在修改的过程中不断检测和控制,最后能达到每一万笔中,只有1.1笔被消费者怀疑为假货。

不止是图片,阿里巴巴推出的原创短视频保护方案也保护了商家的原创信心。通过“视频指纹”和AI技术,商家的原创短视频可以在系统“盖戳”存证,在遭遇侵权时实现一键维权。

“‘视频指纹’的特征跟人的DNA特征很像。我们对视频中的每一帧做视觉特征提取、编码、压缩,这样每一段视频都有了自己的唯一特征。”阿里安全图灵实验室高级算法专家析策说,视频指纹能从海量的视频中检测到同源的视频,即使做加字幕、加logo、加边框等修改,都改变不了它的特征。

对视频提取“指纹”,形成现首发备案认证后,平台将自动监测全网短视频,利用AI技术进行比对,发现有重合度的短视频,会将相关链接推送给商家,由商家进行投诉等相关处理,减少盗用等侵权行为发生。

在过去一年,通过知识产权保护大脑,阿里原创保护平台已累计保护5亿张图片、91万条短视频、6.3万张设计手稿。超过100万商家使用图片保护功能,基本解决一直以来困扰商家的图片盗用和侵权问题。值得一提的是,商家的创意作品商业化更容易,以服饰行业为例,入驻原创保护平台的商家,GMV增速是普通商家的2倍。

假货和“假”图片及视频可以被AI快速识别,那么,“假”评论能被识别吗?

阿里安全方面表示,商家通过作弊,进行不符合实际地鼓吹,以影响消费者的观点及消费行为的炒作好评,可以采用NLP算法、深度学习、图算法等进行识别。另外,对于恶意的负面好评(比如买家恶意通过这种方式敲诈卖家,或者同行攻击对手),则通过评价内容的情感识别加上评价者的行为、关系等进行综合识别。

再怎么刷评论及伪装,假买家就是假的,从其个人的成交记录评价记录都有迹可循。只要坚定“像治理酒驾一样治理假货”的信心,依靠AI技术手段打假,才让造假者在阳光下无处藏身。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多