文 | 观韬中茂上海办公室 王渝伟 陈坤 背景 网络爬虫(Web Crawler)也称为蜘蛛爬虫(Web Spider)、网络机器人(Web Robot),其在本质上是一套实现高效下载的程序,可按照指定规则,通过遍历网络内容的方式,搜集、提取所需的网页数据,并下载到本地形成互联网网页镜像备份。[1]网络爬虫技术能够帮助企业或个人更便捷和更具针对性地获取所需的网络数据信息,目前已被广泛而成熟地应用于各种互联网商业模式和应用场景,同时也在逐步向传统行业渗透。作为搜索引擎公司的百度、谷歌同时也是最大的爬虫公司;金融企业特别是互联网金融企业,利用网络爬虫技术,设置相应抓取条件,从网上采集企业信用信息、涉诉执行信息、社交软件信息、招聘信息、电商数据等,经过数据分析模型的加工处理,形成风险分析报告,最终可用于公司对产品或服务的风控;零售企业使用网络爬虫技术收集线上产品的电商定价、销量等信息用于综合分析,以研究销售策略和产品定位;聚合信息平台,如今日头条等,其部分新闻内容就是来源于爬取的网络信息;舆情分析与数据挖掘领域,比如百度、搜狗、微博等的排行榜或者舆情分析产品也是利用了网络爬虫技术;其他如天眼查、企查查、启信宝等企业信息聚合公司,导购、价格监测等横向数据聚合的公司,围绕微信、微博等社交媒体的广告公司都是利用爬虫技术来构建各自的业务场景。在信息爆炸时代,网络爬虫技术渗透在工作生活的方方面面,以各种不易察觉的形式向我们提供着便利服务。 但不论是何种行为,皆有法律界限。随着互联网经济的迅猛发展,互联网技术的不断推陈出新,网络数据如同一座蕴含极为丰富且无尽的矿藏,正在一点点被开采使用。网络爬虫技术正是一把用于开采矿藏的利器,虽然爬虫技术本身“中立”,但不当的使用行为,却可能在为个人带来便利、为企业带来经济效益的同时,招致相应法律风险,其中的法律问题值得行业从业者关注。 洛克在《政府论》说:“在一切能够接受法律支配的人类的状态中,哪里没有法律,那里就没有自由。”为了解网络爬虫技术使用的“法律”与“自由”,本文在总结团队既往项目工作心得的基础上,参考同业人员的经验分享,并结合现有案例数据库提供的法院裁判文书,总结归纳出六种与网络爬虫技术使用有关的典型民事、刑事法律风险,并通过案例介绍与解析形式与读者共同探讨网络爬虫技术的法律界限。 正文 百度与大众点评不正当竞争纠纷案(上海市第一中级人民法院(2016)沪73民终242号) 法律规定 在本案审理过程中,法院将《反不正当竞争法》第二条作为主要裁判依据,并最终认定百度公司构成不正当竞争。
分析解读 通过我们对网络爬虫技术相关不正当竞争案件的研读、分析和归纳,在此类案件中,法院主要从以下方面认定爬虫企业构成不正当竞争: 第一,主体层面,抓取信息的企业(“爬虫企业”)与被抓取信息的企业(“被爬企业”)之间存在竞争关系; 第二,行为层面,爬虫企业的行为构成不正当竞争,其中又需要关注三个方面:(1)被爬企业有合法权益可诉诸法律保护;(2)爬虫企业有不正当竞争行为(网络爬虫行为相关案例中一般指违背公认的商业道德和诚实信用原则);(3)被爬企业有实际损害; 第三,因果关系层面,不正当竞争行为与损害结果之间存在因果关系。 结合以上要点对照本案进行分析解读如下:
合规建议 尽管目前“数据权属”在我国及至世界各国都是一个有待讨论的问题,但企业对于数据信息享有合法权益并应受到保护的观点,在我国的司法实践中已经越来越多地被认可:比较典型的淘宝VS.美景案件中,法院认定淘宝公司对数据产品享有竞争性财产权益。鉴于此,企业通过《反不正当竞争法》第二条来维护自身在市场竞争中的合法权益是保护数据信息所带来利益的重要方式。 在业务实践中,我们发现企业经常会使用网络爬虫技术抓取企业信息聚合平台上提供的公开或者半公开的企业信息,并可能将抓取的信息应用于新的业务场景中,比如业务风控。但企业往往没有意识到其行为可能涉及的不正当竞争法律风险,对于如何规避更是不甚了解。对此,我们认为,企业需要关注以下方面:
大众点评与爱帮网著作权侵权纠纷案(北京市海淀区人民法院(2010)海民初字第4253号) 该案中,汉涛公司向用户提供以商户基本信息及点评信息为主要内容的生活服务APP——大众点评。汉涛公司通过《大众点评网服务条款》与网络用户约定,对于用户在大众点评上发布的受著作权法保护的作品,其著作权归属于汉涛公司。爱帮聚信(北京)科技有限公司(“爱帮公司”)未经汉涛公司许可,利用技术手段大量抓取大众点评的商户基本信息和点评内容数据,并刊登在爱帮公司所运营的爱帮网上。汉涛公司以爱帮公司的行为构成侵犯信息网络传播权向法院提起诉讼。爱帮公司在本案中的抗辩理由有二:一是认为涉案点评内容不构成著作权法保护的作品;二是爱帮网提供的是搜索引擎服务,抓取数据并进行分析是程序自动完成的,且爱帮网在汉涛公司通知后对相关内容进行了删除。 法律规定 与本案相关的法律法规的主要内容为:
分析解读 通过我们对与网络爬虫技术相关的侵犯信息网络传播权案件的研读、分析和归纳,在此类案件中,法院主要从以下方面认定爬虫企业构成侵犯信息网络传播权: 第三,爬虫企业的信息网络传播行为不具有合法性(未落入“避风港”原则等范畴)。 结合以上要点对照本案进行分析解读如下:
合规建议 互联网企业在使用网络爬虫技术抓取数据信息并进行使用时,需要注意 “作品+信息网络传播”这一特定模式的形成,以避免此类法律风险。在业务实践中我们发现,一些企业在网站上爬取新闻报道、文章等用于风险分析、决策支持或内部学习,在这一过程中所获取的数据信息大多属于著作权法保护的作品,对此我们建议企业:
另有提供链接服务的搜索引擎企业从公开网络上抓取文章或视频等作品,通过提供链接的形式使用户可在跳转后获取相应文章或视频等作品,对于此类情形我们建议:
典型风险三:构成侵犯公民个人信息罪 彭某等侵犯公民个人信息案(成都高新技术产业开发区人民法院(2018)川0191刑初94号) 该案中,知数公司主要通过大数据信息为客户提供数据分析并收取费用,如给信贷系统的审批人员提供查询服务,通过大数据分析对用户进行征信调查。知数公司通过开发的爬虫程序,在互联网各大网站上自动采集信息,采集的数据类型有微博、新闻、招聘信息、电商数据(含店铺信息、商品信息、商品评价)、最高法执行信息、在第三方提供用户登录授权后采集淘宝平台信息,采集后的数据交由知数公司研发中心对数据进行整理、加工、存储。彭某在知数公司从事技术工作,负责数据处理、清洗、入库、算法。本案中,彭某通过工作账号远程登录公司的服务器数据库,从服务器上窃取数据到电脑并发送至手机,并结合在网页上公开爬取的数据,将二者加工、组合,运用算法推算出个人信息。彭某后将非法获取的个人信息用于出售,获利50万余元。 法律规定 与本案相关的法律法规的主要内容为:
分析解读 通过我们对与网络爬虫技术相关的侵犯公民个人信息罪案件的研读、分析和归纳,在此类案件中,法院主要从以下方面认定相关主体构成侵犯公民个人信息罪: 第三,非法获取公民个人信息达到“情节严重”或“情节特别严重”的标准。 结合以上要点对照本案进行分析解读如下:
合规建议 从上述案例中法院观点以及要点分析可知,通过网络爬虫技术抓取个人信息的,也有违反法律、行政法规、部门规章有关公民个人信息保护的规定,从而落入“非法获取”公民个人信息范畴的风险。在此,还需要考虑的问题是,在公民个人信息已经合法公开的情况下,利用爬虫技术对其进行抓取是否构成非法获取。《民法典人格权编》(草案二次审议稿,“《草案》”)对该问题持有的观点是行为人不承担责任——《草案》第八百一十六条,行为人使用自然人自行公开的或者其他已合法公开的信息不承担民事责任,但是使用该信息侵害该自然人重大利益或者自然人明确拒绝他人使用的除外。[9]根据目前司法实践,没有检索到对收集已合法公开的个人信息按照侵犯公民个人信息罪来认定的案例。另,在广东省深圳市中院发回重审的侵犯公民个人信息罪的案件(本案相关裁判文书尚未公开)中,深圳中院不认可深圳罗湖区法院将“企业根据法律法规规定或为经营所需而公开的企业信息(即使包含个人姓名、联系方式)”认定为刑法意义上的公民个人信息,因此以事实不清、适用法律错误为由撤销原判,发回重审。虽然立法走向和司法实践向我们传递的观点是收集已合法公开的个人信息不违法,但是仍然建议企业按照《网络安全法》等法律法规的规定,谨慎使用网络爬虫技术抓取公开的个人信息。 在业务实践中,我们了解到有个别企业将获取的数据信息通过与其他渠道获取的数据信息“融合”的方式整合出公民个人信息,再将整合出的个人信息用于精准营销,更有甚者进行公民个人信息的买卖,对此,我们建议企业:
对网络爬虫技术法律风险问题感兴趣或者存在疑问的朋友欢迎通过邮件方式与我们沟通。 [1] 李慧敏、孙佳亮:《论爬虫抓取数据行为的法律边界》,载《电子知识产权》2018年第12期,第59页。 [2]《著作权法》第十条 著作权包括下列人身权和财产权: (一)发表权,即决定作品是否公之于众的权利; (二)署名权,即表明作者身份,在作品上署名的权利; (三)修改权,即修改或者授权他人修改作品的权利; (四)保护作品完整权,即保护作品不受歪曲、篡改的权利; (五)复制权,即以印刷、复印、拓印、录音、录像、翻录、翻拍等方式将作品制作一份或者多份的权利; (六)发行权,即以出售或者赠与方式向公众提供作品的原件或者复制件的权利; (七)出租权,即有偿许可他人临时使用电影作品和以类似摄制电影的方法创作的作品、计算机软件的权利,计算机软件不是出租的主要标的的除外; (八)展览权,即公开陈列美术作品、摄影作品的原件或者复制件的权利; (九)表演权,即公开表演作品,以及用各种手段公开播送作品的表演的权利; (十)放映权,即通过放映机、幻灯机等技术设备公开再现美术、摄影、电影和以类似摄制电影的方法创作的作品等的权利; (十一)广播权,即以无线方式公开广播或者传播作品,以有线传播或者转播的方式向公众传播广播的作品,以及通过扩音器或者其他传送符号、声音、图像的类似工具向公众传播广播的作品的权利; (十二)信息网络传播权,即以有线或者无线方式向公众提供作品,使公众可以在其个人选定的时间和地点获得作品的权利; (十三)摄制权,即以摄制电影或者以类似摄制电影的方法将作品固定在载体上的权利; (十四)改编权,即改变作品,创作出具有独创性的新作品的权利; (十五)翻译权,即将作品从一种语言文字转换成另一种语言文字的权利; (十六)汇编权,即将作品或者作品的片段通过选择或者编排,汇集成新作品的权利; (十七)应当由著作权人享有的其他权利。 著作权人可以许可他人行使前款第(五)项至第(十七)项规定的权利,并依照约定或者本法有关规定获得报酬。 著作权人可以全部或者部分转让本条第一款第(五)项至第(十七)项规定的权利,并依照约定或者本法有关规定获得报酬。 [3]《信息网络传播权保护条例》第二条 权利人享有的信息网络传播权受著作权法和本条例保护。除法律、行政法规另有规定的外,任何组织或者个人将他人的作品、表演、录音录像制品通过信息网络向公众提供,应当取得权利人许可,并支付报酬。 [4]《刑法》第二百五十三条之一 【侵犯公民个人信息罪】违反国家有关规定,向他人出售或者提供公民个人信息,情节严重的,处三年以下有期徒刑或者拘役,并处或者单处罚金;情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。 违反国家有关规定,将在履行职责或者提供服务过程中获得的公民个人信息,出售或者提供给他人的,依照前款的规定从重处罚。 窃取或者以其他方法非法获取公民个人信息的,依照第一款的规定处罚。 单位犯前三款罪的,对单位判处罚金,并对其直接负责的主管人员和其他直接责任人员,依照各该款的规定处罚。 [5]《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》第五条 非法获取、出售或者提供公民个人信息,具有下列情形之一的,应当认定为刑法第二百五十三条之一规定的“情节严重”: (一)出售或者提供行踪轨迹信息,被他人用于犯罪的; (二)知道或者应当知道他人利用公民个人信息实施犯罪,向其出售或者提供的; (三)非法获取、出售或者提供行踪轨迹信息、通信内容、征信信息、财产信息五十条以上的; (四)非法获取、出售或者提供住宿信息、通信记录、健康生理信息、交易信息等其他可能影响人身、财产安全的公民个人信息五百条以上的; (五)非法获取、出售或者提供第三项、第四项规定以外的公民个人信息五千条以上的; (六)数量未达到第三项至第五项规定标准,但是按相应比例合计达到有关数量标准的; (七)违法所得五千元以上的; (八)将在履行职责或者提供服务过程中获得的公民个人信息出售或者提供给他人,数量或者数额达到第三项至第七项规定标准一半以上的; (九)曾因侵犯公民个人信息受过刑事处罚或者二年内受过行政处罚,又非法获取、出售或者提供公民个人信息的; (十)其他情节严重的情形。 实施前款规定的行为,具有下列情形之一的,应当认定为刑法第二百五十三条之一第一款规定的“情节特别严重”: (一)造成被害人死亡、重伤、精神失常或者被绑架等严重后果的; (二)造成重大经济损失或者恶劣社会影响的; (三)数量或者数额达到前款第三项至第八项规定标准十倍以上的; (四)其他情节特别严重的情形。 [6]《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》第一条刑法第二百五十三条之一规定的“公民个人信息”,是指以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息,包括姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等。 [7]《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》第四条 违反国家有关规定,通过购买、收受、交换等方式获取公民个人信息,或者在履行职责、提供服务过程中收集公民个人信息的,属于刑法第二百五十三条之一第三款规定的“以其他方法非法获取公民个人信息”。 [8]《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》第二条 违反法律、行政法规、部门规章有关公民个人信息保护的规定的,应当认定为刑法第二百五十三条之一规定的“违反国家有关规定”。 [9]《民法典人格权编(草案二次审议稿)》第八百一十六条 收集、使用或者公开自然人个人信息,有下列情形之一的,行为人不承担民事责任: (一)在该自然人同意的范围内实施的行为; (二)使用该自然人自行公开的或者其他已合法公开的信息,但是使用该信息侵害该自然人重大利益或者自然人明确拒绝他人使用的除外; (三)为维护公共利益或者该自然人合法权益,合理实施的其他行为。 作者简介:王渝伟律师是观韬中茂上海办公室合伙人,主要执业领域为网络安全、数据合规及数据竞争法,风险投资与私募股权,证券市场的争议解决。王律师常年担任首席数据官联盟等国内大数据行业联盟的首席律师及专家组成员,为互联网、银行、基因、大数据、零售领域的上市公司提供数据合规的解决方案及咨询,同时为大数据、区块链、人工智能、网络安全、金融科技、云计算等领域的国内外科技公司提供该领域的法律服务。 |
|
来自: www_119_119 > 《待分类》