知识图谱

使用图结构存储实体信息与关系的知识库
知识图谱(Knowledge Graph)[1]又称为科学知识图谱,是一种拥有极强的表达能力和建模灵活性的语义网络,可以对现实世界中的实体、概念、属性以及它们之间的关系进行建模。[1]常见的知识图谱根据内容分为文本、视觉和多模态三类,此外还有通用和领域知识图谱,其逻辑结构基本上都是由模式层和数据层所构成。其数据类型多样,包括结构化数据、半结构化数据和非结构化数据,常见的来源有百科全书、数据库、网页内容、出版物等。知识图谱的构建是一个系统化的过程,分为自顶向下和自底向上两种方法。通过提取数据源中的知识,融合并构建实体关系来构建知识图谱,加工知识以增强其价值,持续更新以确保知识的时效性和准确性。[2]
知识图谱的起源与发展经历了从语义网络到现代知识表示学习的转变。20世纪中叶,语义网络为知识图谱奠定了基础,70年代知识工程推动了专家系统和知识库的发展。随着知识库规模扩大,自动化知识获取和标准化表示成为关键,RDF和OWL等语言应运而生。2010年代,知识表示学习成为热点,Google于2012年推出知识图谱,引领了智能化搜索引擎的发展。随后,深度学习技术的进步为知识图谱的构建和应用带来新机遇,知识图谱补全和动态更新技术不断涌现,多模态知识图谱整合不同信息源,标志着知识图谱研究的成熟和应用的广泛性。迄今为止,其实际应用在发达国家已经逐步拓展并取得了较好的效果,但它在我国仍属研究的起步阶段。[4]
知识图谱的构建并非一蹴而就,它是一个不断改进、优化、以及更新的过程。通过知识图谱,不仅可以将互联网的信息表达成更接近人类认知世界的形式,还提供了一种更好的组织、管理和利用海量信息的方式。[2]知识图谱技术的主要应用领域有语义检索、知识问答、金融经济、医疗健康等方面。[3]

概述

知识图谱是一个精细化的语义知识库,它以符号形式描绘了现实世界中的各种概念及其相互之间的关系。其基本构成要素是“实体-关系-实体”三元组。实体间通过各种关系相互连接,形成了一个网络状的知识结构。[2]