分享

李勇坚:从经济学角度看数据要素

 潘海露 2022-07-03 发布于江苏

本文由阿里研究院产业研究中心根据中国社会科学院财经战略研究院研究员,中国社会科学院大学商学院教授、博士生导师李勇坚在《江西社会科学》2022年第3期发表的《数据要素的经济学含义及相关政策建议》提炼整理

数据已前所未有地改变人类工作和生活方式,“数据是石油”等各种比喻也帮助公众接受已经发生的现象、信服数据的价值,但产业界的营销宣言并不能解释数据发挥作用的机制,此类类比也不能让数据直接沿用自然资源的管理思路和制度。我们需要回到学术框架,从经济学视角严谨定义数据、描述数据的特征,才能走出当前数据安全保护与经济价值释放的两难困境。

怎样从经济学的角度定义数据?

让我们看一个例子。自动驾驶汽车根据来自各种传感器(包括摄像头、激光雷达、GPS等)的数据来决定汽车怎样行动,形成一种机器学习算法。基于成功算法的自动驾驶汽车是一个想法(Idea)。数据和算法、想法截然不同:算法实现未来自动驾驶汽车想法的途径; 数据则是用于产生这个想法的基础要素输入。

从经济学意义上看,数据是一种具有现代意义的生产要素。数据是实现想法的原材料,在生产中发挥作用,但不是制造商品的说明。想法是生产函数,数据是生产要素。

文章图片1

另外,想法和数据的区别还在于排他程度。一方面,从技术上讲,传输数据似乎比传输想法更容易。另一方面,数据可以加密,在技术上可以实现排他性使用。区分数据与想法对经济长期增长具有重要意义。假设数据非竞争、可自由复制和高效利用,数据的功能就像Solow的新古典增长模型中的资本一样,增加了产出但不能独自维持无限增长。只有想法持续改进,才能实现经济长期增长。因此,数据在其经济学本质上是罗默内生增长模型中的知识,是一种具有非竞争性和部分可排他性的、需要与其他资源协同发挥生产力促进作用、规模收益不确定的生产要素。

数据作为生产要素有什么特质

数据具有不同于资本、劳动、技术等生产要素的重要特征:

(一)非竞争性与部分可排他性

数据的使用具有公共性,其使用可重复,使用主体不唯一。相同数据可被多人同时使用而不会被耗尽,这意味着积累数据更有可能提高生产力、促进经济长期增长。另外,数据还可以被反复收集,一个数据被某主体收集后,并不妨碍其他主体收集同样数据。

不过,数据的公共性并不一定意味着数据完全排他,而不能成为“私人物品”。在数据成为“私人物品”后,数据所有者倾向于囤积数据,以获得相对于竞争对手的优势,并避免新进者竞争。这将大大降低数据的增长效益,使经济实际增长率低于潜在增长率。这就需要引入可靠的监管制度。

(二)数据要素具有强协同性

数据要素本质上是一种协同要素,通过与资本、劳动、人力资本、技术等深度融合,才能更好发挥其促进生产率提升的作用。大数据从根本上讲是一种创新。数据单独存在的价值是有限的,必须与技术等其他要素协同。从本质上看,数据、数据分析以及由此产生的内容和服务创新,共同发挥作用,为数字经济的参与者创造了价值。因此数据最多的公司不一定必然在市场竞争中获胜。

数据的价值与其处理技术联系在一起,能够成为一种竞争手段。结构化数据越庞大、越复杂,竞争对手就越难复制。如果数据组合是唯一的,并且竞争对手无法复制并从中提取信息,甚至可能形成市场壁垒,产生反竞争的效果。

(三)数据要素的收益递增与收益递减

很多研究者认为,数据要素使用的规模收益会递增。Jones & Tonetti认为,即使考虑到数据积累本身表现出规模回报递减,数据的非竞争性及协同性也保证了长期增长的可能性。当数据与其他要素相结合时,每个数据单元都可以同时被其他要素使用。资本和劳动力越多,就能使每个数据单元得到越好的利用,提高数据平均生产率,推动经济持续增长。

数据正反馈循环的另一个实现路径是“干中学”网络效应。该理论认为,产品或服务质量的改进是一个试错过程。在这个过程中,主动或被动贡献数据的人越多,公司改善其产品质量的程度就越高,该产品对其他用户也越有吸引力。因此数据多的公司改进产品的能力更强,对潜在用户更具吸引力。Agrawal等提出了一种非线性的递增收益。在某些人工智能应用程序中使用数据可以表现出越来越大的规模回报,特别是在更复杂的预测问题中。

然而,无论是在理论上还是实证研究中,数据要素收益递减也频频得到证实。从数据来源看,是否存在数据生产的正反馈也值得怀疑。数据要素具有动态性,很容易过时。从本质上看,数据只是生产率提升的一个原材料,要将其作用发挥出来,还需要算法等要素的协同。数据要素在使用过程中,由于其能够在多个维度使用,从而对数据的访问转化为竞争优势的机会越多,出现自我强化的“反馈环”的可能性就越大。换句话说,对数据的更好访问可能会带来竞争优势,并使公司能够收集更多的数据,这将给公司带来更多和更大的优势。

(四)数据要素具有外部性

数据要素在使用过程中,会对系统内第三方造成影响,从而产生外部性。数据要素外部性也带来了关于隐私保护的争论。

数据要素外部性的存在,对数据要素发挥作用有着巨大的影响。信息的价值对交易的一方可能是正的,对另一方可能是零,甚至是负的。事实上,定制交易条件的能力显然使卖家更加受益,因为他们可以接触到更多客户,并以更接近他们支付意愿的价格为提供量身定制的产品。相比之下,额外数据对消费者的影响不那么明显。

文章图片2

如何释放数据驱动经济增长的作用?

从经济学的视角看,数据的定义应与信息、想法等进行区分,才能将数据生产要素的作用更好发挥出来。根据数据要素的特征,要对数据要素的体制机制进行更全面的创新,才能使数据要素推动经济社会发展的作用充分发挥出来。

一是建立科学合理的数据共享机制。数据使用具有非竞争性,这意味着现有企业有囤积数据的动机,可能会扼杀竞争,并减少可能从更广泛的数据应用中获得的社会效益。因此,建立科学合理的数据共享规则有利于社会福利最大化。共享数据降低创新成本。数据作为一种创新的核心投入,在共享后,使市场参与者都能够获得,从而使创新前期投入大幅度降低。还有研究指出,数据的价值既来自单个数据点,也来自大数据的聚集和分析,这意味着共享数据将使数据之间的协同作用进一步发挥出来,从而提升经济效率。

Capgemini Invent Study曾发布一份报告,在保守的增长情景下,欧盟开放数据市场规模将在2025年达到1995.1亿欧元;在乐观的情况下,到2025年将达到3342亿欧元,可增加88.4万个就业岗位。数据共享的核心是要建立公益性的、共享的数据交换机制。与生产者数据共享相关的还一种模式是强制共享。当今的许多数字创新都与数据的存储、编辑和分析相关联,正是这些东西构成了许多数字时代的商业模型。

二是推动数据相关的核心技术研发。数据要素具有协同性,其应用过程中,需要有相应的技术系统与其协同,才能将其生产率效应发挥出来。数据驱动型创新是数字经济时代创新的重要特色。当今社会正在向数据驱动的社会经济模式转变,数据是一项核心资产,可以创造巨大的竞争优势并推动创新、可持续增长和发展。据Brynjolfsson等估计,采用数据驱动型决策的公司的产出和生产率比其对信息技术的其他投资和使用的预期要高5%至6%。而数据要素的协同性,使其必须提供更为先进的技术,才能实现生产率的提升。

三是建立更科学的数据保护规则,避免数据要素的负外部性。立足数据要素理论,跳出“隐私权保护”的框架,基于个人隐私权利、经济发展和社会安全平衡的视角,建立起数据保护规则。推动企业应用数据的透明化,提高算法透明度,避免企业在数据应用过程中损害个人隐私。建立防止数据过度收集的机制,建立并落实数据收集“最小”“可用”原则,可借鉴美国确立最小数据集(MDS)的经验,建立数据收集的标准,防止平台以提供服务为名,过度收集用户的数据与信息。同时,对将信息收集与提供服务进行捆绑的商业模式进行必要的规制。

四是建立数据交易、数据共享和数据安全相平衡的数据流动机制。数据的流通性和可获取性是发展数字经济的基础。欧盟在2018年生效的《一般数据保护条例》中提出了数据可携带性的制度设计,我国可参照欧盟的数据可携带性规定,再结合各行业数据的敏感程度、数据脱敏与否、数据可用性要求等对数据资产分级分类指导,建立健全数据流通方面的立法,规范数据流通行为。另外,可以采取建立数据流通负面清单制度的方式,禁止危害国家安全、侵犯个人信息及企业商业秘密等数据的流通。通过行业自治的方式,形成行业标准,建立数据交易机构资质审核和准入机制。要细化《数据安全法》《个人信息保护法》等相关法律的规定,细化数据流通负面清单制度,禁止危害国家安全、侵犯个人信息及企业商业秘密等数据的流通,从而在促进产业发展的同时,确保数据安全。

心得与点评

(阿里研究院数据经济研究中心主任 袁媛):

数据如何成为生产要素,一直缺乏经济学视角的严谨论证。有研究把数据简单类比于资源,把数据的价值来源视为无限次、近于零成本的复用。但在微观视角上,难以解释一些“数据富矿”企业并没有获得显著受益。在宏观视角上,难以回答政策制定者的疑问,为何有数据交易所却没有缺乏供需入场?

本文在非常扎实的文献基础上,概括提炼了数据要素的基础特征。其中:

  • 数据要素的收益递增与收益递减,把数据价值与数据量解耦,并提出“数据只是生产率提升的一个原材料”,而不应该忽视算法的作用,以及数据和算法应该作用于企业产品服务改进,生成竞争优势的正循环。

  • 数据要素具有强的协同性,更进一步指出了数据与技术、资本、管理其他生产要素的的紧密关系,“数据对数据驱动行业的公司绩效并不重要,相反,重要的是算法和基础工程团队的质量”。

这两点可以部分解释国内数据交易市场当前发展的滞后:当企业没有建构起数据积累与自身产品服务改进的正循环,那么数据难以产生收益;如果企业本身对技术的应用不足,数据“消化不良”,也就不会去市场“收购”“储存”数据。

同时,本文还通过数据的非竞争性和部分非排他性来解释如何建构激励相容的数据竞争模式,通过数据的负外部性强调数据安全和个人隐私保护的重要性,从数据价值的释放,过渡到数据治理策略。但数据的排他性并非只存在于“加密技术”和“法律”,还存在于数据是企业产品/服务另一种形态的表现,共享和复用数据,必然要尊重企业对自身商业秘密(产品服务)的主张,以及对自身在数据使用过程中积累的算法、基础工程团队等各项技术资产的保护。

所以,从经济学角度看数据要素,本文是一项具有深远意义的开始,但是这项研究还远远不够,这条产出丰富的道路,会留给具备经济学、法学研究能力,理解产业实践、具备技术视野的专家共同开拓。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多