数据是一种资产,通过在不同组织间的流通,可参与到业务流程中实现其价值。一般情况下,关联的数据越多,对人群或事物的描述就会越全面,价值也就越大。因此,大数据市场中,需要数据不断的在不同企业与组织间流通,才能更大的发挥数据资产的价值。那么,一般情况下,数据是怎样在各企业间流通的呢? 首先,从业务应用角度 ,第三方数据获取可表现为个体查询、人群筛选、群体统计等。 实体信息查询 实体信息查询,是数据流通中最为普遍的应用方式,主要用于查询某个实体的描述性信息,如终端设备的偏好标签信息、位置点周边的POI信息、应用的属性信息(名称、分类、描述、图标等)。 人群筛选 基于营销、服务等目标,按照一定条件筛选具备某种特征的群体,主要的筛选目标一般是代表人的ID,如设备串号。用于筛选的条件在不同的场景及数据背景下可以具备不同的特征,如某针对高校学生的信用卡营销活动,可根据位置信息筛选在选定高校范围内长期出现的人群,或根据app筛选使用与四六级、考研相关的app的人群。 群体统计 群体特征统计,主要应用于对已有客户群进行特征描述,了解客户分布规律,指导运营决策。群体特征统计可根据分析目标和数据基础设计统计的内容。 另外还有一种特殊的基于群体特征统计的应用方式,即人群扩展(Lookalike):根据已有人群分析其特征,并将同质特征进行扩展以找到和指定人群最相似的人群,是“拉新”类营销常用的有效方法。 其次,从数据交互的表现形式看,第三方数据获取可通过数据文件、实时API接口、异步批量接口等方式实现。 数据文件 以文件形式保存数据,在供需双方间进行传输。实际传输渠道可以多种多样,邮件、实时通讯工具、ftp、http、HDFS等都可以作为实现手段,正因为应用灵活多样,数据文件是目前来看最方便、最常用的数据传输方式。 但是文件传输也有其不尽人意之处,如传输过程中的安全性无法保证、扩散无法控制、受文件大小限制、无法实现更新及标准化等。因此数据文件较适合更新周期、安全性要求不高,数据量在一定范围内的数据。 实时API接口 实时API接口,可实现实时查询,“立等可取”的获取数据,因为其各方面的优点成为数据流通过程中的主要接口形式: 可以在需要时实时查询,满足了对数据更新的要求; 采用标准协议,对接方便,可方便的实现各家企业的统一; 可以在传输过程中加入权限验证、报文加密等机制,保证传输安全,满足了对数据流通安全性的要求; 可通过高并发的查询来完成查询大批量数据的场景需求,用时间获取数据量,摆脱了传输通路对于数据量的限制。 但实时API接口也存在一定的局限性:因为其本身无状态维护机制,要求处理过程必须在一次请求中完成,无法支持较复杂的、需要一定计算周期的场景。 异步批量接口 异步批量接口,是实时API与数据文件相结合的一种方式,用于需要一次性完成大容量文件传输、复杂逻辑计算等过程的需求场景。 由于其对处理时延的超高容忍度,异步批量接口天生适用于人群筛选、lookalike等场景,也与数学模型、机器学习等更复杂的计算过程有更多的结合空间。 用统一的平台承载数据流通的不同表现形式 TalkingData智能数据服务商城(SDMK),基于数据流通中的业务场景和技术实现方式抽象平台能力,支持数据文件、实时API接口、异步批量接口等多种形式,可完成单条查询、人群筛选、群体统计等场景的数据获取。 关于TalkingData TalkingData(北京腾云天下科技有限公司)成立于2011年,是国内领先的独立第三方移动数据服务平台。TalkingData一直致力于数据的深耕与数据价值的挖掘,从数据的采集、处理到数据的分析,再到数据的应用与咨询,TalkingData已经形成了一套以“智能数据平台(SmartDP)”为主的完整数据应用体系;构筑了一套以数据商业化平台、数据服务平台,及数据合作平台为核心的数据生态。目前,TalkingData的平均月活跃用户为7亿,为超过12万款移动应用,以及10万应用开发者提供服务。覆盖的客户主要为金融、地产、快消、零售、出行、政府等行业中的领军企业,连续三年实现业务的三倍快速增长。 |
|
来自: 昵称16619343 > 《科学技术》