分享

信息到数据到认知,结构化到知识图谱

 AI量化实验室 2023-10-12 发布于北京

从古至今,人类观察世界,认知世界并改造世界。

通过不断升级观察世界的工具,技术,获得对世界不同层次的认知。

知难行易,还是知易行难,或者知行合一。

行动是检验真理的唯一标准。

认知都有局限,相对论的颠覆,不影响牛顿绝对时空的伟大; 与量子力学的不统一,同样不妨碍爱因斯坦当之无愧的成就。因为就算是近似,都帮助我们理解了世界,并改造得更好。

但凡自恰必有边界。

地心说固然不对,日心说难道就正确了么?太阳只是太阳系中心,太阳系只是宇宙里的一粒尘埃,卑微到泥土里。

信息无处不在,无所不是; 

从观察到测量。丈量世界,得到它的大小,密度,这是数据; 

人类进入信息时代,更容易被观察,被量化,被统计,这是大数据; 

啤酒放在超市里,有自己的销售情况,尿布也是; 

观察、分析啤酒与尿布的销售情况,二者有正相关性,这是知识。然后有意识将二者放在一起,这是认知指导行动。

数据不是知识,数据并不能指导我们更好改造世界,不同人对于数据有不同解读。认知取决于先验积累,知识结构等。数据是客观存在,认知是主观判断,人与人的差距正缘于此。

积累结构化的数据,从宏观视角的GDP/CPI到行业指数,到公司财报。

积累非结构化数据,从图片,语音,视频,更重要是文本,抽取结构化数据。

结构化数据计算可以查询,检索,处理。但仍然还只是数据,客观存在的数据。计算机可以自动处理,并不能有效认知。

如果把人类的知识,历史积累,沉淀进去?结构化数据还不够,还需要有图谱。数据库里的父亲,儿子只是两个普通字段。在结构化的基础上赋予真实世界的关系,我们的知识。

这样才可以推理,关联,联想,甚至自我进化。

深度学习代表的联结学派,有强大的分布式的统计力; 

强化学习有对环境的感知与自适应力; 

迁移学习,对关联与联想的能力; 

GAN能够将分布式的学习成果,具象表达; 

而知识图谱,则将人类知识量化成图,融入到上述过程中。

孩童学语,包括了深度学习,强化学习,迁移学习,母语基本是这样学会的。但孩子还要去上学,我们会教他名动形数量代,会教他主谓宾定状补这样的语法。这是我们对语言的总结,这是知识。知识要量化给机器,这是机器得以智能的基础。

关于作者:魏佳斌,互联网产品/技术总监,北京大学光华管理学院(MBA),特许金融分析师(CFA),资深产品经理/码农。偏爱python,深度关注互联网趋势,人工智能,AI金融量化。致力于使用最前沿的认知技术去理解这个复杂的世界。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多