分享

数据科技发展的破局之法 | 甲子光年

 甲子光年 2021-04-22

为了最稳地竖起一枚硬币,最好的办法可能是建造一个地基。



作者 | 小谢耳朵
编辑 | 杨杨

理想中的数据科技目前面临三个难点:

数据科技应用是结果导向,而非过程导向:数据科技必须包装成实际产品,以“数据可视化”“提供解决方案”呈现,并且较传统方法体现出足够多的优势,例如“降本增效”;

数据科技应用要专业也要通用:出于竞争力考虑,数据科技应用必须足够专业,但考虑到收入来源和稳定性,又需要应用本身能够广泛应用;

数据科技产品化的过程本质是探索:数据科技公司的需求来自于客户,但在数据能干什么这件事上又要先于客户。

而实际面临的困难远远不止这些。难道数据科技的发展真的没有破局之法?有没有公司已经实现了比较理想化的数据科技应用?理想化的数据科技能够发挥出怎样的威力,产生多大的商业价值?

带着一系列的疑问,「甲子光年」与聚焦金融及产业领域深耕多年的数据科技公司数库科技进行了深入对话后,得到了以下几个结论:

1、脱离了数据科技本身的探索和发展,只包装商业模式和IT能力,会对数据科技公司的发展形成限制,也更容易陷入行业竞争。

2、数据科技公司最大的难题与最坚固的壁垒都是“时间”:数据科技的应用从需求出发跑通整个过程形成最终价值,往往需要数年的时间。这期间必然会考验整个公司团队包括创始人的韧性与坚持。但成功之后,时间成本也会成为公司最坚固的壁垒。

1.数据科技该用来干什么?


针对这个问题,数库科技给出的答案是


“从商业本质及制造业量产思路出发,将核心人工智能技术注入数据生产、解析及组装三大基本功,打造数据引擎。基于统一的数据引擎输出高度标准化、可灵活组装的数据服务形成功能模块及解决方案,进而低成本高效地解决数字化决策领域难以避免的客户定制化需求”。

用数库科技创始人、总裁沈鑫的话来说:“金融和企业这一块过往的数据并不缺乏,这些数据就好像各种食材,尽管有一些人已经尝试着做了整理分类的工作,但是如果客户没有米其林三星级的手艺,这些食材就没有办法加工成米其林三星级的菜肴。”

而数库科技想要做的,实际上是一个高度标准化、庞大的“中央厨房配送体系”。数据在中央厨房配送体系的处理下,只需要极少步骤就能直接做出顶级厨师水准的菜来。想法很美好,具体的产品又要如何展开呢?数库团队选择从实际场景需求的“重合处”下手。

目前,银行对公业务营销及风控、供应链金融(银行将核心企业和上下游企业联系在一起,提供灵活运用的金融产品和服务的一种融资模式)等场景的基础,是对于企业的长期跟踪,围绕企业各种外围维度的信息来判断企业的发展方向。

政府做产业决策、园区做招商引资、投资银行寻找标的、一级市场做风险投融资等场景,也存在类似企业和产业发展的分析判断需求。例如在遴选招商引资企业的过程中,政府往往会考核企业能够创造多少就业、带来多少税收;而投行需要在了解企业发展状态的同时,再结合一部分产业发展的态势。

公开信息和市场价值的“交汇点”,还是在于“企业”。但与传统企业做法不同的是,数库科技希望还能对“企业”实现判断,为客户直接提供结果,因此必须引入产业的信息。

总结下来,数库科技所需要做的就是:制定高标准的、完整的“中国产业画像+企业画像”。在形成了整体画像之后,就能根据企业客户的实际需求,从中提取需要的决策信息,在核心场景中快速形成产品及解决方案。

2."智能决策体系"如何实现?


数库科技一开始的选择在当时的时代背景下显得过于理想化。但金融+数据科技领域长期的浸润,让数库科技找到了自信。

从流程上看, 如果要构建中国完整的产业画像和企业画像,关键的有三步:

  • 对能够获取的数据进行深度加工,形成高度结构化可连接的数据,也就是高纯度“原料”;

  • 打造一个能够高效处理这些结构化数据,并产生智能决策结果的“引擎”;

  • 针对用户的场景需求,快速输出能够用于最终产品的成品数据流及功能模块,也就是“结果”。

传统金融数据公司基本只涵盖了第一步,它们早早地定下各种数据标准,然后长期通过数百上千的员工来手动更新。

时过境迁,金融数据大环境的改变还是给传统金融数据服务商带来了冲击。首当其冲的是日益增加的数据量。当大环境中的数据每年以指数级的速度增长时,传统金融数据服务商以人为核心的思路必然会“跟不上”。所以,建立一套取代人工、同时确保效率和数据效果的生产线,就成为必然趋势。

数库科技在2012年就开始打造自己的DAS(Data Automation System)数据自动化生产工厂。其核心是适应各行各业宽泛的数据类型,生产出高度标准化的元数据,实现数据的规模化生产。

系统在建设初期的方法并无特别之处,由于已经具备多年人工处理数据的全流程基础,数库科技将人工处理数据的流程进行全量拆解,将其中可以通过技术实现自动化的流程进行自动化,并保持高度的人机无缝衔接。而多年处理数据沉淀下来的数据集也在数据生产自动化的进程中起到了极大的作用。

而对于数据的连接问题,数库科技在2012年就开始主导设计属于自己的产业链图谱。由于产业关系是市场中唯一可以连接所有企业的关系,因此,设计此图谱的目的是为了搭建可以承载全部数据的骨干框架。为此,数库科技在产品设计阶段请来了18位资深行业专家,开始逐一对每个行业进行知识积累及沉淀,建立基于产业的数据架构。

循环反馈升级的结果也非常明显,以数库科技目前最新升级到4.0版本的DAS系统为例,其自动化程度已经超过90%,整体的数据生产效率提升了10倍以上。这不仅可以作为一个单独的产品服务客户,同时也确保了数库科技有能力以最快的速度把握客户的数据新需求,持续占领市场先机。到现在,数库产业链数据框架已承载超过30万个细分产品结点、5000+个可对接数据的标准产品结点、70000+条产业上下游关系,覆盖中国超过4000万家上市及非上市企业。

接下来就是“解析”。这一部分的需求,数库科技选择用NLP(Natural Language Processing,自然语言处理)来完成。

依托前面量产的大量数据,以及前期行业专家整理的知识框架,数库科技的NLP引擎能够从实时资讯中解析出大量结果:资讯的智能摘要(核心内容)、资讯的对应主体(公司/人)、整篇资讯的情绪(正面/负面,百分比)、主体当前整体的情绪(正面/负面,百分比)、资讯归属的行业、资讯对应的事件类型、资讯对应的相关知识图谱等等。这些信息并不是只停留在企业层面,而是会顺着产业的视角,沿着企业之间的产业链关系扩展。

沈鑫给「甲子光年」举了一个例子:数库刚开始给银行提供风控服务的时候,银行的风控官经常会收到一些不是自己客户的公司资讯提醒,当时客户以为出错了。但点开图谱关系后发现,发生负面新闻的企业实际是银行客户的客户的关联担保方。“这些平时不一定清晰的风险传导关系,都可以在数库基于产业的数据框架中得以快速发掘。”

数库科技的“数据生产工厂”、“NLP实际新闻资讯解析”两个核心能力并非独立能力,而是相辅相成、相互结合,实现了"前端采集+后端处理"的整体相互反哺和自我进化。

数据工厂可以低成本、高效率源源不断的生产图谱型数据并形成知识体系。该知识体系即被应用于前端NLP对实时信息的抓取与解析,大幅提高了解析精准度。

而NLP端则可以第一时间获取市场最新的事件、概念、动态、产业关系,并将其中与价值关联较强的因素反哺回知识体系中,并进一步提升数据工厂的生产精度,在中间形成一个可以自我进化的完善金融及产业知识体系。

该体系不断高频率自我迭代,为数库科技在数据生产质量及高频资讯解析精准度层面形成了极深的护城河,后来者难以在数据质量及精准度层面追赶或超越。

3.十一年才盈利,值得吗?


由此,数库科技避开了一系列“天花板”:传统数据商人工智能技术薄弱,数据积累优势无法在实时高频资讯解析等创新场景中得以体现。并且数据生产由传统人工方式主导,在高频资讯解析中获取的知识更新及算法进化无法向后端数据生产场景输送。

而新型NLP科技企业虽然人工智能技术及算法能力超群,但知识的精准解析并不是单纯靠算法就能够解决的问题。由于数据提取后的标准化归一、容错等环节中缺乏专业词库积累,造成提取后的数据在场景落地及实际运用中困难重重。最终导致业务进程中积累的数据及知识难以体系化,无法形成系统化的知识沉淀及留存,对前端算法的支撑及反哺亦难以实现。

依托这样一个通过时间和数据积累打造而成的金融领域知识体系,数库科技也得以最终接近自己的目标——构建中国整体的产业画像和企业画像。

由于从数据生产工厂,到实时资讯解析,再到帮助客户实现数据的进一步整理汇总都是数库科技自己一手操办,所以在数据产品的标准和节点上完全可以互通、对接,进而形成高度拟合实体经济的产业链数据体系,通过分析产业上下游,产业间或产业网络中任何链接路径上的数据变化追踪风险及价值的传导效应,并以此为基础形成更加智能的产业数据应用。

最终,这三大核心能力与拟合实体经济发展规律的思路相结合,便形成了“产业智慧大脑”,也就是数库科技今天的核心数据引擎。这个大脑不仅有数据,有算法,而且是由真实的产业数据逻辑整合形成具有“产业+企业全景画像”的大脑。最终基于此引擎生成客户所需要的各种政策规划、投资、经营管理及其他决策。

为了实现最终产品,更是要优先投入人力物力去构建数据采集、NLP体系等一系列“基础能力”。

为了实现最终产品,更是要优先投入人力物力去构建数据采集、NLP体系等一系列“基础能力”。数库科技总裁沈鑫说道:“数库科技从一开始就想成为武林高手,要成为高手就必须先从基本功练起。于是,数库科技踏踏实实地在庙里蹲马步,腿上绑着铅块挑水上下山。这期间,有很多人学了几个套路就去街上杂耍,也挣了不少钱,我们看着也有点羡慕。但我们还是从本质层面进行了思考,不被外界所干扰,继续练好自己的基本功。”结果是,现在的数库科技不仅基本功扎实,而且所有套路基本一学就会,打得更漂亮、更潇洒。

这样的发展模式对管理者、企业员工的决心提出了额外的要求:心智的终极考验!

数库科技之所以能“熬”下来,除了创始团队对于金融数据科技美好前景的憧憬之外,也有团队内部互相打气的因素。沈鑫自己也说,“我和刘彦中途有无数次想过放弃。不过w我们两个从来没有同时间想过放弃,互相扶持走到了今天。

“熬出来”的成果也非常喜人,数库科技的一系列产品已经获得了众多金融机构与相关企业的采用,整体的服务净现金留存率更是超过了160%。同时,为客户提供产品服务的过程也变得异常简单,每次与客户的交付实际上主要是前台功能版面的设计开发与后台数据的对接。因此客户层面再复杂的“定制化”需求,对于数库科技来说都不是问题。

目前,数库科技的产品服务主要采用“开发费用+数据费用”的方式收取,比例大概为3:7。数据需要每年付费,由于落地效果好、部署周期短,该模式获得了客户的高度认可。

数库科技也在商业拓展中总结出了自己的“客户价值创造三大铁律”:

1、以更低的价格为客户提供更好的方案(性价比)

2、以更快的速度帮助客户落地方案(及时性)

3、以最简单的方法解决复杂的问题(延续性)

对于2021年,沈鑫也分享了公司的“小目标”——把收入做到1.5~2亿元。这个小目标并不遥远,截至一季度,数库科技就完成了2020年全年合同额的过半数。这个市场远比数库科技想象的要大得多,而且需求爆发地也更加迅猛。

"Think Bigger to Achieve Bigger Success",这是数库科技的写照。


END.

| 活动推荐:【甲子引力X大湾区】科技创新高峰论坛 |

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多