分享

数字经济中的数据从哪来?

 十丈红尘客 2022-07-21 发布于广东

前些日子,谈了谈数字经济中的核心问题是“数据”的想法,顺着这个思路向下去想,可能就会遇到另外一个问题:“数据从哪来”?

我们对于“数据”可能已经熟视无睹,认为它就在我们的生活中,我们的生活已经离不开“数据”。

数据影响和改变着我们的生活,并且这种影响还将更加剧烈。我们今天在这里探讨一下,这些纷繁复杂的数据的出处吧。

底层数据(一手数据):数据是从“行为”中产生的,归结为人的行为和物的行为。比如:人的购物、移动、劳动等等;机械设备的运行、监测等等。在比如:电表、水表产生的数据都是最原始的底层数据,我们称之为“一手数据”。获得一手数据的方法可总结为两种:“采集”和“感知”。前一个,可以直接通过软件收集,后一个需要进行模电转化感知之后转化为“可采集”。

中层数据(二手数据):有了一手数据,就必然有二手数据,我们假定名之为中层数据。此时的数据主要是给“系统”提供的原材料,是需要经过加工之后才能够使用的,这样的数据通常就是通过“打包”、“装配”、“结构化”之后的数据,通常会有一个处理底层数据的软件或硬件系统来完成。传统的计算机体现结构中的BIOS系统处理完之后再输出的就是二手数据。以此“分层结构”为启发,所以支撑了所谓中层数据的定义。

高层数据(三手数据):非常简单的说,这类数据就是可以存到数据库中的数据了,在存储的过程中是经过了“算法”、“程序”的改造了,在数据库中按照预先的数据之间的实体关系进行了组织化、结构化、可视化,成为可以读取的数据了。数据可保持、可保存、可交换、可使用是三手数据的主要特征。达到了这个层次之后,数据就有更狭义的名词了——信息。所以,此时的数据为支撑的系统通常名为各类信息管理系统了。

知识数据(四手数据):实际上数据以什么方式存储、结构化、组织化会影响到数据的含义——信息的内容,而变幻这种组织结构化方式,就会得到“新数据”,这是以数据库系统为支撑的处理。再往深了说,如果这种处理是在一种预设的规则下,目的是为了得到未知的事实和规律,这样得出来的数据就叫“知识”。很显然,知识数据必须是通过深加工之后才能得到的。方法上,简单的操作是统计分析、复杂的操作就是人工智能。

再生数据(活化数据):数据的可再生性是导致信息爆炸的主要原因,也是当今如何去理解“大数据”生成的重要机制。在达到三手、四手数据形态之后,如何使用这些数据成为其他可用,也就是活化,产生了无穷无尽的变数。例如:“一个人买了保险”,这是一个“三手数据”。银行可能关注它的财富状况,汽车公司可能关注它买了什么车要不要保养、培训机构可能关注它是什么工作背景,卖房子的也会主动打来电话推销房子,等等。这条数据就会产生很多再生的——重构的数据信息。

数据资源(共享数据):所有人共同产生、共同拥有的数据。如果自然资源中的空气、水源、矿石、石油等等,也有一类具有同样资源属性的数据,比如:人口数据、经济数据、货币数据、产业数据、政策数据,等等。这些都是应该充分共享或有机制共享的,因为,从数字社会的角度,这些数据资源是大家共同创造的,理应共享。从数字经济的角度,这些数据资源是经济运行、企业发展离不开的公共品。

私人数据(隐私数据):只有一个人产生、一个人拥有的数据。我们发现,不论是一手收据到四手数据,以至于后来的纸上数据、资源数据,一旦可标识和分辨出一个具体实在的人,就涉及到了隐私,这就是隐私数据。而个人产生、个人拥有是隐私数据的本质属性。在采集、传输、加工、深加工、资源化的过程中都会遇到这样的数据,余下的问题就是如何在诸多环节予以保护。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多