搜索

分享

QQ空间 QQ好友新浪微博微信

知识图谱自动构建在线云平台-web protege汉语版

mastereye 2016-05-21

展开全文

protege汉化版

Protege软件是斯坦福大学医学院生物信息研究中心基于Java语言开发的本体编辑和知识获取软件。这个软件主要用于语义网中本体的构建，是语义网中本体构建的核心开发工具。相比与其他的本体构建工具而言，Protégé最大的好处在于支持中文，在插件上，用Graphviz可实现中文关系的显示。为了方便大家，在北理工张华平博士的带领下，对protege汉化后又对webprotege进行了汉化，并成功上线，使大家可以在线进行知识图谱语义本体的自动构建。

webprotege汉化版

知识图谱语义本体的构建流程图：

知识图谱包括实体与关系
节点代表实体连边代表关系事实可以用三元组表示(head, relation, tail)

概念发现

1．格式解析

对PDF、Word、XML等主流文档，抽取出结构化的文本信息。

2．分词标注

NLPIR-ICTCLAS分词系统可以融合已有本体库，实现专业领域的分词标注。3．概念发现

(1).NLPIR-ICTCLAS新词发现可直接从原始语料中直接发现新词、新概念。

(2).采用基于规则与统计相结合的方法实现从新词中过滤筛选本体概念。

关联计算

使用POS-CBOW模型对数据进行训练，然后对数据完成关联关系分析。

POS-CBOW方法综合了词性、词的分布特点，采用word2vector改进模型，通过训练，自动提取出了语义关联关系。如果训练文本为专业领域的生语料，该模型可以产生专业领域的本体关联关系。

依存句法分析

关系抽取

实际上是实体与关系的抽取，一般是通过上面提到的三元组方法不断迭代实现。

例：

1、通过“X是Y的首都”模板抽取出(中国，首都，北京)、(美国，首都，华盛顿)等三元组实例；

2、根据这些三元组中的实体对“中国-北京”和“美国-华盛顿”可以发现更多的匹配模板，如“Y的首都是X”、“X是Y的政治中心”等等；

新发现的模板抽取更多新的三元组实例，通过反复迭代不断抽取新的实例与模板。

集成验证

构建工具---- Protégé

1.OWL:W3C开发的一种网络本体语言，用于对本体进行语义描述。

类(Class)、个体(Individual)、属性(Property)

2. Protégé: 斯坦福大学基于Java语言开发的本体编辑和知识获取软件，是语义网中本体构建的核心开发工具。

效果展示：

知识图谱自动构建在线云平台

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： mastereye > 《管理》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

mastereye

关注对话

TA的最新馆藏

一辆车价 30万的车主，每年需要付出哪些养车成本，每年合计是多少？
宝贝女儿，下个月你就要迎来你人生的第二个本命年
美的业绩新高，但靠的不是家电
1月光伏逆变器排行榜！央国企58.73GW逆变器招中标！华为、阳光、株洲变流、固德威、首航、特变、禾望、锦浪、爱士惟等领先！
投资中的系统学习有多么重要！前几日跟几个朋友吃饭，聊起一股评家转型做私募后清盘一事，谁也没想到如此优秀的股评家，做起实战居然会亏的如此之惨，我们还聊...
[转] 赵孟頫书《与山巨源绝交书》（附释文）

喜欢该文的人也喜欢更多

热门阅读换一换