知识图谱 02:概念、类别、实例与层级结构

张开发
2026/4/17 7:19:11 15 分钟阅读

分享文章

知识图谱 02:概念、类别、实例与层级结构
继续沿用前一篇的任务。我们要做一个科技史知识服务系统并希望它能回答詹姆斯·瓦特James Watt属于哪一类人物蒸汽机steam engine属于哪一类技术对象格拉斯哥大学University of Glasgow属于哪一类机构工程师engineer与发明家inventor是什么关系要回答这些问题只知道若干实体名称还不够。系统还需要一套更基础的分类框架哪些是概念哪些是类别哪些是实例类别之间怎样形成层级。知识图谱中的很多结构正是建立在这一层基础之上的。一、分类基础与知识组织如果系统只记录 James Watt、steam engine、University of Glasgow、Industrial Revolution 这些实体名称那么它只是保存了一组实体标识还没有说明这些实体分别属于什么类别也没有说明类别之间存在怎样的结构关系。但用户真正关心的往往不只是“有哪些实体”而是“这些实体分别属于什么类别”“这些类别之间如何联系”。例如James Watt 属于 person、engineer 还是 inventorsteam engine 属于 machine 还是 inventionUniversity of Glasgow 属于 institution 还是 university这说明知识图谱不仅要表示实体还要表示实体在分类体系中的位置。没有分类图谱中的实体就容易停留在零散罗列的状态很难形成稳定、可扩展的知识结构。二、概念与类别概念是人们对一类对象共同特征的抽象认识类别则是这种概念在知识组织中的表达形式。换句话说概念偏重“认识上的抽象”类别偏重“组织上的归类”。例如在当前任务中可以形成这样一些类别• person• engineer• inventor• institution• university• machine• historical period这些类别一旦进入知识图谱就不再只是普通词语而会成为组织实体的结构节点。它们帮助系统回答“这一类是什么”“哪些实体可以归入这一类”这样的问题。因此知识图谱中的分类并不是对实体进行随意标注而是要把实体放入一套相对稳定的概念体系中。延伸阅读《概念、内涵、外延知识组织的基础》三、实例及其知识地位实例是某个类别下的具体对象。如果说类别回答“这一类是什么”那么实例回答“这一类中有哪些具体对象”。在这个任务里可以作如下理解• James Watt 是 person 的实例• University of Glasgow 是 university 的实例• steam engine 是 machine 的实例• Industrial Revolution 在这里可以近似看作某一历史时期historical period中的具体历史阶段这里最重要的一点是类别不是实例实例也不是类别。“engineer”是类别“James Watt”是实例。“university”是类别“University of Glasgow”是实例。“machine”是类别“steam engine”是实例。如果把类别和实例混在一起图谱中的层次就会混乱后面的关系建模、查询和简单推导也会变得不稳定。延伸阅读《类、实例、成员与子类四个最容易混淆的基础概念》四、类别层级与结构关系知识图谱中的类别并不是平铺罗列的。很多类别之间存在从一般到具体的层级关系也就是上下位关系。例如• person• engineer• inventor• institution• university• technical object• machine这类关系说明更具体的类别通常保留上层类别的一般特征同时增加更具体的限定条件。例如engineer 和 inventor 都可以看作 person 的下位类别university 可以看作 institution 的下位类别。这一层级关系及实例归属关系可以概括为下面的示意图在科技史知识服务系统中还需要进一步区分两类基础关系• 类别与类别之间的关系是层级关系• 实例与类别之间的关系是归属关系例如• engineer 是 person 的下位类别• University of Glasgow 属于 university• steam engine 属于 machine因此知识图谱中的“分类”不是简单分组而是带有层级结构的组织。延伸阅读《集合、元素、隶属与包含知识分类的数学基础》五、类—实例—层级结构的建模意义现在回到最初任务。如果没有类别和层级系统可能只能保存“James Watt — improved — steam engine”这样的事实。但有了类—实例—层级结构之后系统就可以进一步支持更有意义的问题例如• 哪些 engineer 改进了 machine• 哪些 university 与 engineer 有关联• James Watt 既然属于 engineer那么他是否也属于 person这说明类—实例—层级结构至少有三方面作用。1、帮助实体归类实体不再只是孤立节点而是被放入明确的类别中。2、帮助知识组织图谱可以从零散事实提升为有层次的知识结构。3、支持简单推导如果系统知道 engineer 是 person 的下位类别而 James Watt 属于 engineer那么基于层级关系系统就可以进一步判断 James Watt 也属于 person。六、从概念基础到知识图谱建模知识图谱不仅要表示实体和关系还要把实体放进类别体系把类别组织成层级结构。在实际建模中这意味着至少要先回答四个问题• 哪些是类别• 哪些是实例• 哪些类别之间有上下位关系• 哪些实例属于哪些类别只有这些基础关系清楚了后面的实体、关系、属性建模才会更稳定进一步使用 RDF、RDFS、OWL 等形式化知识表示工具时也才有明确依托。延伸阅读《RDF、RDFS、OWL 三者是什么关系》 小结知识图谱的概念基础核心是概念、类别、实例与层级结构。类别用来组织实体实例用来连接具体对象层级结构用来组织类别体系。没有这一层基础知识图谱就很难形成稳定、可扩展的知识结构。“点赞有美意赞赏是鼓励”

更多文章