分享

数据应用第一步:认识流通中的数据

 昵称16619343 2019-02-24

数据是一种资产,通过在不同组织间的流通,可参与到业务流程中实现其价值。一般情况下,关联的数据越多,对人群或事物的描述就会越全面,价值也就越大。因此,大数据市场中,需要数据不断的在不同企业与组织间流通,才能更大的发挥数据资产的价值。那么,一般情况下,数据是怎样在各企业间流通的呢?

首先,从业务应用角度 ,第三方数据获取可表现为个体查询、人群筛选、群体统计等。

实体信息查询

实体信息查询,是数据流通中最为普遍的应用方式,主要用于查询某个实体的描述性信息,如终端设备的偏好标签信息、位置点周边的POI信息、应用的属性信息(名称、分类、描述、图标等)。

人群筛选

基于营销、服务等目标,按照一定条件筛选具备某种特征的群体,主要的筛选目标一般是代表人的ID,如设备串号。用于筛选的条件在不同的场景及数据背景下可以具备不同的特征,如某针对高校学生的信用卡营销活动,可根据位置信息筛选在选定高校范围内长期出现的人群,或根据app筛选使用与四六级、考研相关的app的人群。

群体统计

群体特征统计,主要应用于对已有客户群进行特征描述,了解客户分布规律,指导运营决策。群体特征统计可根据分析目标和数据基础设计统计的内容。

另外还有一种特殊的基于群体特征统计的应用方式,即人群扩展(Lookalike):根据已有人群分析其特征,并将同质特征进行扩展以找到和指定人群最相似的人群,是“拉新”类营销常用的有效方法。

其次,从数据交互的表现形式看,第三方数据获取可通过数据文件、实时API接口、异步批量接口等方式实现。

数据文件

以文件形式保存数据,在供需双方间进行传输。实际传输渠道可以多种多样,邮件、实时通讯工具、ftp、http、HDFS等都可以作为实现手段,正因为应用灵活多样,数据文件是目前来看最方便、最常用的数据传输方式。

但是文件传输也有其不尽人意之处,如传输过程中的安全性无法保证、扩散无法控制、受文件大小限制、无法实现更新及标准化等。因此数据文件较适合更新周期、安全性要求不高,数据量在一定范围内的数据。

实时API接口

实时API接口,可实现实时查询,“立等可取”的获取数据,因为其各方面的优点成为数据流通过程中的主要接口形式:

可以在需要时实时查询,满足了对数据更新的要求;

采用标准协议,对接方便,可方便的实现各家企业的统一;

可以在传输过程中加入权限验证、报文加密等机制,保证传输安全,满足了对数据流通安全性的要求;

可通过高并发的查询来完成查询大批量数据的场景需求,用时间获取数据量,摆脱了传输通路对于数据量的限制。

但实时API接口也存在一定的局限性:因为其本身无状态维护机制,要求处理过程必须在一次请求中完成,无法支持较复杂的、需要一定计算周期的场景。

异步批量接口

异步批量接口,是实时API与数据文件相结合的一种方式,用于需要一次性完成大容量文件传输、复杂逻辑计算等过程的需求场景。

由于其对处理时延的超高容忍度,异步批量接口天生适用于人群筛选、lookalike等场景,也与数学模型、机器学习等更复杂的计算过程有更多的结合空间。

用统一的平台承载数据流通的不同表现形式

TalkingData智能数据服务商城(SDMK),基于数据流通中的业务场景和技术实现方式抽象平台能力,支持数据文件、实时API接口、异步批量接口等多种形式,可完成单条查询、人群筛选、群体统计等场景的数据获取。

关于TalkingData

TalkingData(北京腾云天下科技有限公司)成立于2011年,是国内领先的独立第三方移动数据服务平台。TalkingData一直致力于数据的深耕与数据价值的挖掘,从数据的采集、处理到数据的分析,再到数据的应用与咨询,TalkingData已经形成了一套以“智能数据平台(SmartDP)”为主的完整数据应用体系;构筑了一套以数据商业化平台、数据服务平台,及数据合作平台为核心的数据生态。目前,TalkingData的平均月活跃用户为7亿,为超过12万款移动应用,以及10万应用开发者提供服务。覆盖的客户主要为金融、地产、快消、零售、出行、政府等行业中的领军企业,连续三年实现业务的三倍快速增长。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多