元数据(Metadata)最抽象的定义是一种用来描述数据的数据,不同领域时元数据的细化定义存在差异。它提高了针对数据对象的定位、管理、检索、评估、选择和交互的能力,是数据治理的重要基础。通过元数据管理,可以准确展现一个组织数据资产的整体视图。[1][3]元数据具有描述性、动态性、多样性、多层次性以及支撑性等特点。[7][8] 元数据的产生原因是与因特网的发展密切相关的,其主要是为了对网络信息进行有效管理。[9]元数据最早出现于美国NASA美国航空与宇宙航行局(National Aeronautics and Space Administration,NASA)的《目录交换格式》手册中,成为支持互通性的数据描述所取得一致的准则。[10]20世纪60年代,杰克·迈耶斯(Jack Myers)定义了元数据的概念,将它称为“描述数据” [11]20世纪90年代中期以后,随着WWW方式和HTML在网站的普及,网络资源的检索也遇到了困难,元数据便拓展到了因特网世界。[12]2008年,中国标准化管理委员会在《标准文献元数据》给出的定义为“元数据定义和描述其他数据的数据”。[13]随着技术的发展,元数据的安全方面也愈发引起人们的注意,2015年10月,澳大利亚联邦政府通过了一项有争议的《强制保留元数据法》,要求电信公司在两年内保留客户的元数据。[14]2021年,Gartner发布《主动元数据管理市场指南》,首次出现主动元数据的概念,其是指一组能够持续访问和处理元数据的功能。[15] 元数据有多种类型,如可以按用途、功能、复杂程度进行分类。其中按元数据的用途,元数据可被分为描述性元数据、结构性元数据、存取控制性元数据和管理性元数据。[4][5]元数据的结构包括语义结构、内容结构和句法结构。[16]其在管理平台上又包括包括元数据采集服务、应用开发支持服务、元数据访问服务、元数据管理服务和元数据分析服务。[17][18]在应用方面,元数据可以应用于数据治理、数据仓库、应用系统开发过程、地理遥控数据分析、教育资源以及电子政务组织等方面。[2][19][20] 基本定义
元数据是指数据之数据或者代表性的数据,是数据的属性,有利于信息检索。[21]在不同的领域中,元数据的定义也存在一定的差异,在软件构造领域,通常被定义为通过元数据值得改变来改变进程得数据,不同的位置输入不同的数值的元数据,将得到与原来相同的行为;[21]在图书馆与信息领域,元数据的定义是描述结构化的信息资源,提供图书等信息资源的一种结构化的数据;[21]在数据仓库领域,元数据用于描述数据仓库中数据及其环境的数据,是在建设数据仓库的过程中所产生的关键数据,例如数据源定义、目标定义、变换规则等。[21]