智能时代从基于明确规则与特定领域的“计算智能”,到语音、图像、视频识别预处理的“感知智能”,再到具备理解、推理和解释的“认知智能”,难度价值越来越大。而随着数据红利消耗殆尽,以深度学习为代表的感知智能遇到天花板,认知智能将是未来一段时期内AI发展的焦点,是进一步释放AI产能的关键。认知智能应用需求广泛多样:精准分析、智慧搜索、智能推荐、智能解释、自然人机交互、深层关系推理等,需要对传统信息化手段的全面而彻底的革新,以解放人类脑力,显著提高机器生产力。知识图谱是实现认知智能的关键技术, 是实现机器认知智能的使能器 知识图谱知识图谱,作为一种语义网络,是大数据时代知识表示的重要方式之一;作为一种技术体系,是大数据时代知识工程的代表性进展 机器理解数据的本质是建立从数据到知识库中实体、概念、关系的映射;机器解释现象的本质是利用知识库中实体、概念、关系解释现象的过程 知识是人类在认识和改造客观世界的过程中总结出的客观事实、概 念、定理和公理的集合 起源与发展 知识图谱始于20世纪50年代,至今大致分为三个发展阶段
知识图谱发展历史 知识图谱主要技术 知识图谱技术架构图
知识获取示意图 通过知识抽取技术从不同来源、不同结构(结构化、半结构化和非结构化)的数据中提取计算机可理解和计算的结构化数据,形成知识存储到知识图谱中。当前,获取知识主要针对文本数据进行,按照抽取对象的不同可分为:实体抽取、关系抽取、属性抽取和事件抽取。通常有以下四种方式:众包法、爬虫、机器学习、专家法
知识是人类在认识和改造客观世界的过程中总结出的客观事实、概念、定理和公理的集合。知识表示是将现实世界中存在的知识转换成计算机可识别和处理的内容,是一种描述知识的数据结构,用于对知识的一种描述或约定,也是知识图谱研究中知识获取、融合、建模、计算与应用的基础。知识表示方法主要分为
针对知识图谱的知识表示形式设计底层存储方式,完成各类知识的存储,以支持对大规模图数据的有效管理和计算。知识存储党的对象包括:基本属性知识、关联知识、事件知识、时序知识和资源知识等。知识存储方式的质量直接影响到知识图谱中知识查询、知识计算及知识更新的效率 知识存储方式 知识存储方式和工具
知识建模是指建立知识图谱的数据模型,即采用什么样的方式来表达知识,构建一个本体模型对知识进行描述。在本体模型中需要构建本体的概念,属性以及概念之间的关系。一般有自顶向下和自底向上两种途径 建模方法
手工建模方式 2.半自动建模方式 半自动建模方式先通过自动方式获取知识图谱,然后进行大量的人工干预过程。运用自然语言处理技术先自动建模的方法可以分为三大类:基于结构化数据的知识建模方法,基于半结构化数据的知识建模方法和基于非结构化数据的知识建模方法 半自动建模方式
知识融合是知识组织与信息融合的交叉学科,它面向需求和创新,通过对众多分散、异构资源上知识的获取、匹配、集成、挖掘等处理,获取隐含的或有价值的新知识,同时优化知识的结构和内涵,提供知识服务 知识融合概念分解
知识计算概念
知识运维是指在知识图谱初次构建完成之后,根据用户的使用反馈、不断出现的同类型知识以及增加的新的知识来源进行全量行业知识图谱的演化和完善的过程,运维过程中需要保证知识图谱的质量可控及逐步的丰富衍化。知识图谱的运维过程是个工程化的体系,覆盖了知识图谱的从知识获取至知识计算等的整个生命周期。知识图谱的运维包括两个方面的关注点: 一个是从数据源方面的基于增量数据的知识图谱的构建过程监控,另一个是通过知识图谱的应用层发现的知识错误和新的业务需求 知识运维 知识图谱存在的挑战1.数据相关的挑战 数据是知识图谱的基石,其数据来源主要有两种:自有数据(自身采集或拥有)和外源数据(网络爬虫、开放共享或从数据交易所获取)。在实际应用中,多源数据的歧义、噪声大、数据关联性不明确等缺陷 2.算法相关的挑战 知识图谱系统从获取、建模、融合、计算等各个环节均涉及不同的算法,目前个步骤所用到的算法根据现状和需求不同存在不同挑战。主要体现在:算法泛化能力差、算法鲁棒性差、算法多样化,缺乏统一的评测指标、算法可解释性、基础知识库融合挑战、垂直领域知识库构建挑战、基础知识库不愿开放的挑战、贯穿知识图谱全生命周期的平台缺失、基于文本的知识图谱构建工具性能弱、隐私安全和伦理相关的挑战、测试评估及商业模式等方面的挑战 小结从感知到认知,是个必然事件,而知识图谱相当于计算机的大脑,是认知计算的关键组成部分。智能认知领域是下一个待突破的方向,前景可期 参考文献《知识图谱标准化白皮书2019》 |
|