细粒度预警装备领域知识图谱本体构建*
源自:细粒度预警装备领域知识图谱本体构建
作者:杨丽萍 方其庆 胡亚慧 谷成刚、
摘 要
针对预警装备领域知识图谱构建中数据组织非结构化、实体关系刻画不够细致、知识表示缺乏规范化表达等问题,基于Protégé本体构建工具,首先,将预警装备体系自上而下分为装备原理知识类、管理保障资源类和装备操作运用类等,并进行细化梳理,定义概念类并划分层次关系,提取出具体装备信息中的实体、属性、关系等知识单元;然后,对预警装备领域知识进行建模,探索出科学完整的细粒度预警装备知识表示框架,并以“远程预警相控阵雷达”为例,进行本体实例填充和可视化;最后,基于本体描述语言对预警装备本体进行了形式化表示。该本体为构建基于多源高质量数据的领域知识图谱奠定了语义基础,对实现大数据背景下装备能力画像、发展态势分析、装备故障诊断与健康状态管理等装备智能化管理保障和作战运用具有一定的实践指导价值。
关键词
预警装备; 本体构建; 知识图谱; 细粒度
知识图谱作为结构化的语义知识库,能够以网络图模型结构表示领域知识的概念和属性,为信息检索、智能问答、决策分析等高层次认知活动提供了强大支撑。应用知识图谱对预警装备领域海量不同类型数据进行整合利用和归纳更新,可以科学反映装备体系的总体结构,有效提高装备信息完整、实时、动态管理水平。构建预警装备领域知识图谱的首要任务是存储多源异构的信息并以结构化、统一化的方式进行表达,以便理解一致、规范存储和快速传递信息。本体是通过描述、获取领域知识,确定领域内共同认可的概念和概念间的关系,用于领域内的不同主体之间交流与知识共享的形式化规范说明[1]。作为知识描述框架和标准规范,本体可以为已知领域提供标准和结构化语义表达,是异构系统之间知识共享的通用语义基础,目前已广泛应用于构建大型领域知识图谱。
在军事及装备领域,部分学者对本体的构建做了不少有益的探索。刘梦超等[2]提出了基于需求的螺旋反馈法,用以解决知识建模过程中需求更改或增加的问题,并应用该方法构建简单的军事装备知识模型。郝瑞哲[3]从本体建模的角度阐述了如何自上而下构建一个雷达及关联装备情报知识图谱的模式层,内容包括雷达本体构建、雷达属性构建和关联装备及相关信息构建。李肖等[4]对武器装备类属的描述构建了装备个体描述模型,并结合装备运用模式构建了装备间的关系描述模型,形成了武器装备体系本体库。赵颜利等[5]提出了一种面向领域知识图谱的工程化本体构建方法,构建了战例领域本体模型,建立了战例本体与实体的映射机制。谢腾[6]采用七步法,利用现有的电磁数据,扩充了本体的覆盖范围,构建出面向电磁情报的信息装备领域本体。胡伟涛[7]以巡逻反潜涉及的装备知识为例,梳理了相关知识,构建了反潜装备知识图谱本体。池庆玺等[8]为解决雷达电子对抗面临辐射源信息表征困难的问题,构建出了辐射源知识图谱三元组和表征模型。顾丹阳等[9]基于领域知识构建领域本体,对数据进行抽取和融合,并采用三元组形式对得到的实体、关系、属性等数据进行表示,最后构建出主战武器装备知识图谱。
上述研究成果为本体的构建提供了思路和借鉴,但在复杂应用环境下构建高质量的预警装备领域知识图谱本体仍然面临较多的困难,如数据组织非结构化、实体关系刻画不够细致、知识表示缺乏结构化组织及规范化表达等。针对上述问题,本文提出一种具有细粒度知识组织结构的预警装备本体构建方法,细化定义了概念实体与关系表达,构建出细粒度预警装备本体概念模型。基于Protégé本体构建工具,用描述规范、数据连通的知识表示框架将典型非结构化文本资料进行可视化,并以OWL本体描述语言建立预警装备本体与异构系统之间知识共享的通用语义基础,从而构建出预警装备领域本体库。相较于其他装备领域本体库,该本体共计划分了6个层级,247个基础概念类,11种实体类别和27种关系类别,知识组织结构更为细化,知识粒度更加详细精确,知识面覆盖更加广泛,拟为本领域相关研究提供参考。
本文的组织结构如下:第1节详细介绍了预警装备本体模型的构建目标及流程;第2节重点阐述了模型构建过程中定义概念类及划分层次关系、定义核心属性、创建实例等关键步骤;第3节基于OWL本体描述语言对预警装备本体进行了形式化表示;第4节总结了本文工作并列出后续工作。
1 本体构建目标及流程
当前,武器装备知识图谱构建大多通过互联网百度百科、环球网——兵器栏目、武器大全等获取数据,均是面向通用武器装备领域,知识图谱的研究对于本体定义和知识组织结构的粒度较为粗糙,实体与关系之间刻画不够细致,难以满足机器问答、知识检索、故障诊断与健康状态管理等预警装备领域深度应用需求。预警装备本体的构建目标是以典型非结构化文本资料为主要研究对象,梳理预警装备领域相关理论与专业知识,自上而下细化定义概念类与核心属性,构建出一种具有细粒度知识组织体系的预警装备本体概念模型,实现基于语义层面的结构化信息描述与关系表达,从而探索出科学完整、动态立体、数据互通的细粒度预警装备知识本体库,为构建基于多源高质量数据的预警装备领域知识图谱奠定基础。
本文采用由斯坦福大学开发的“七步法”来构建本体,相较于其他方法而言,其步骤清晰明确、成熟度高、实用性强,技术实践难度也相对较小。该方法存在的不足之处是缺乏本体评估体系,不利于后续领域本体的改进与更新,因此,本文在使用七步法合并定义类的属性及属性的分面的基础上,增加了对本体的评估与改进,优化了领域本体的构建方法,使之更适应预警装备领域。
本文面向预警装备管理与保障垂直领域应用,结合领域专家知识,分析预警装备数据特征和应用需求,遵循本体构建原则,采用自上而下的方法,构建了预警装备知识领域本体,如图1所示。
图1 预警装备本体构建流程
具体流程如下:
1) 确定专业领域和范畴。通过对预警装备领域海量数据的整合分析,本文构建的预警装备领域本体的范围覆盖以下数据:① 基础数据,包括装备型号、基本属性、指标参数、技术体制、配套设施设备等;② 作战数据,包括装备操作使用、阵地优化、编配部署、全功能运用情况等;③ 业务数据,包括装备研制论证、保养维护、故障损伤维修、管理保障资源等;④ 其他数据,包括装备的原理知识以及装备研发生产的国家、企业等。
2) 考察复用现有本体的可能性。相比于全领域知识本体来说,预警装备领域本体构建范围较小,目前并无成熟本体可以复用,因此需要尽可能准确全面地采集领域内的数据信息,以充分掌握装备知识体系架构,从而建立本体概要模型,形成预警装备本体的框架。
3) 列举领域的概念术语。在明确预警装备领域知识范围的基础上,依据军事领域和装备专业文献资料对数据进行整理分析,确定该信息域本体所涉及的概念、语义、属性、示例等,并列举出该领域相关术语,为后续建立概念分类体系奠定基础。
4) 定义概念类及划分层次关系。概念层次是本体的框架,本文采用自上而下的方法建立概念分类层次结构,先定义领域中最核心的概念,然后进行细化,得到预警装备领域的概念类。
5) 定义核心属性。本体概念的两个核心属性是描述其结构信息的数据属性和描述概念之间关系的对象属性。在定义属性时,要根据预警装备领域的需求尽可能为这些属性陈述一般且尽可能窄的定义域和值域,这样可以有效检测出潜在的不一致性和偏差。本文选择Protégé作为本体建模工具来定义类和创建属性,本体模型的表达以对象属性为核心,通过对象属性来对预警装备中涉及的各方面进行描述。
6) 本体评估及改进。本体评估是基于各种评价指标和科学评价方法,对影响本体质量的各种因素进行综合评价的过程。预警装备领域本体初步构建后,可以通过专家检验等方式进行本体评估,内容包括检查需求分析阶段设定的目标是否得到满足,验证构建的本体是否正确。如果评估未合格,则需要改进或者重新定义概念类与核心属性。
7) 创建实例。本体模型基本搭建完毕后,将预警装备领域中的一个类涉及的实例进行创建并填充属性值,形成完整的本体库。
概念间的关系是本体的骨架,同类概念间的归属关系与不同概念之间的属性关系等关系获取的研究是本体构建研究的重点和难点。结合本文的研究,在以上步骤中,较为重要的是定义概念类及划分层次关系,定义核心属性,创建实例,所以本文接下来会重点阐述。
2 预警装备本体构建
2.1 定义概念类及划分层次关系
细粒度预警装备知识本体的概念层次构建从两个方面考虑。一是预警装备本身所具备的基本功能、特征属性、原理技术等,需包含在装备本体的概念设计之中。另一方面是要考虑装备的管理保障、功能运用以及遂行作战情况,将装备的保障资源、操作使用、阵地优化等因素考虑在内。
预警装备特指利用先进的探测、监视和通信技术手段,搜索、发现、识别、跟踪和监视来袭或威胁的战略性目标,为己方及时、有效地实施抗击、反击或防护行动提供情报支援的武器系统的统称,是预警系统遂行作战任务的物质基础[10]。预警装备体系是由主战装备和各种保障装备组成的多层次系统,其专业性高,涉及雷达、红外、光电、航空航天、网络通信、信息处理、自动控制、大气科学等多个技术领域,按主要功能可分为4种类型:反导预警装备、防空预警装备、空间目标监视装备和信息传输处理装备。其中常规探测体制装备和特种探测体制装备主要用于防空预警,对空中动力目标进行搜索与跟踪,确定目标位置与属性;大型相控阵体制装备主要用于反导预警,也兼用于临近空间、空间目标监视;红外探测体制装备主要用于反导预警,信息传输与处理系统分别用于防空预警、反导预警,空间目标监视系统对搜集的空中、临近空间、弹道导弹、空间目标预警情报信息进行传递、综合处理和分发。
基于此,本文定义顶层核心概念预警装备1个,二级概念5个:装备体系、装备系统、装备原理与技术、装备操作与运用以及装备管理与保障。针对每一层级,分别按照工作平台、部分组成、任务类型、采用方法等又进行细分,再根据类的不同分面进行第4层级的划分,不同的装备按照使用的技术角度、装载平台、技术体制、分系统等再进一步细化,以此类推,反复细化分类,得到预警装备领域的概念层次结构,共计6个层级,247个概念类,相较于其他装备领域本体库,该本体库粒度更加详细精确、知识面覆盖更加广泛。如图2所示。
图2 预警装备本体概念层次结构图
本文选择的本体建模工具为Protégé,是目前应用最广泛的本体论编辑器之一,采用图形化界面,模块划分清晰[11]。用于创建、可视化、操纵各种表现形式的本体,可以定义语义、解答询问以及定义逻辑行为,具有很强的可扩展性。由于篇幅限制,本文选取部分类与类的层级通过“Class hierarchy”界面进行展示,见图3。
图3 Protégé类层级图
2.2 定义核心属性
构建本体时,仅仅定义类不足以确切描述专业领域的知识体系,还要使用属性进一步描述类的内部结构。其中,对象属性描述的是类与类之间、类与实例之间的语义关系,数据属性描述的是类自身的特点,通常使用具体的数据类型进行表示,不同数据属性的取值类型可能有所差异,一般包括数值、日期、字符等多种类型。
在预警装备领域,概念体系涉及的通用语义关系为:上下级父子关系,指概念之间的从属关系,如“气球载雷达”是“空基预警装备”的子类,一般用“is…a”来构建层次关系;部分与整体关系,主要指装备的组成,如雷达与分系统、配套设备之间的关系;概念与实例关系,指本体概念与具体实例的关系;属性关系,指概念与属性之间的关系,例如装备编号是装备的一个特有属性。除上述通用关系外,根据预警装备领域特点与本体构建需求自定义语义关系如下:同义关系,指多个实例或概念具有相同的含义,如“表面波雷达”与“高频地波超视距雷达”为同义;支援保障关系,指器材设备与装备之间、不同装备之间提供弹药武器、情报信息等;协同关系,指不同雷达之间互为备份、补盲,雷达与电子对抗、光电侦察等手段之间的紧密结合等;指挥隶属关系,指编配部署装备的部队、单位与装备之间的关系;以及其他如保管检修、研制生产、操作使用、阵地优化等关系。表1为本研究定义的对象属性,包含了对象属性的定义域、值域的取值范围。
表1 核心概念类属性关系
对象属性 | 描述 | 定义域(Domains) | 值域(Ranges) |
---|---|---|---|
上下级父子关系 | 概念类之间的从属关系 | 装备 | 装备 |
部分与整体 | 装备的组成、分系统 | 装备 | 配套设备 分系统 |
属性关系 | 概念与属性之间的关系 | 特征功能 | 装备 |
概念与实体关系 | 本体概念与具体实例的关系 | 概念 | 实例 |
同义关系 | 多个实例或概念具有相同的含义 | 装备 | 装备 |
保障 | 器材给装备提供资源保障 | 器材 | 装备 |
支援 | 不同装备间提供支援 | 装备 | 装备 |
协同 | 不同雷达之间互为备份、补盲等 | 装备 | 装备 |
指挥 | 指挥决策的单位或部门 | 指挥管理单位 | 装备 |
隶属 | 编配部署装备的部队、部门、机构 | 装备 | 使用单位 |
保管 | 管理装备的负责人 | 装备管理人员 | 装备 |
检修 | 检查维修装备的人员 | 装备保障人员 | 装备 |
维护 | 维护装备人员 | 装备保障人员 | 装备 |
维修 | 装备出现故障的部位 | 装备 | 故障部位 |
包含 | 装备所含基础知识 | 装备 | 基础知识 |
采用 | 装备采用的装备技术 | 装备 | 装备技术 |
导致 | 装备出现故障原因、现象等 | 故障原因 | 故障现象 |
研制生产 | 制造装备的单位 | 研制生产单位 | 装备 |
经费支出 | 装备购置、使用维修、研制论证等费用 | 经费 | 装备 |
操作使用 | 操作使用装备的人员,如标记员等 | 装备操作人员 | 装备 |
功能运用 | 装备的全功能运用 | 装备 | 处置情况 |
阵地优化 | 装备在各类环境下的阵地优化 | 装备 | 优化措施 |
定义本体语义关系后,为描述类自身的特征,构建类的数据属性。依据《装备条例》《军用雷达术语》以及《预警体系概论》、装备技术说明书等专业著作和技术文献,归纳总结了以下预警装备数据属性:装备型号、代别、名称,装备结构外形尺寸、口径大小,主要性能指标包括工作频段、探测距离范围、探测方位扇区、探测高度、探测主要目标、距离方位分辨力、目标跟踪容量及其他战技指标,机动性如车载、机载、船载、固定情况,时间属性包括开机时间、平均无故障时间、平均恢复时间等,以及装备技术、器材设备、保障资源等类的相应属性。表2给出了部分类的数据属性。
表2 数据属性
类 | 属性名称 | 描述 | 属性类型 |
---|---|---|---|
装备 | 装备型号 | 用于区别的名称 | xsd:name |
工作频段 | 电磁波频率范围 | xsd:int | |
探测距离范围 | 发现目标最远距离 | xsd:int | |
脉冲峰值功率 | 发射脉冲时单位时间所耗电量最大值 | xsd:int | |
工作带宽 | 电磁波频率范围 | xsd:int | |
目标跟踪容量 | 跟踪处理目标最大值 | xsd:int | |
点迹处理容量 | 处理点迹最大值 | xsd:int | |
机动性 | 改变位置的能力 | xsd:string | |
MTBF | 基本可靠性 | xsd:string | |
MTTR | 平均故障修复时间 | xsd:int | |
… | |||
设备器材 | 设备器材名称 | 用于区分不同的设备器材 | xsd:name |
规格型号 | 长宽高等尺寸信息 | xsd:string | |
装机部件数量 | 设备组成的多少 | xsd:int | |
… | |||
人员 | 姓名 | 如张三 | xsd:name |
证件号码 | 身份证或其他证件 | xsd:int | |
人员类别 | 军官、文职或战士 | xsd:string | |
职务 | 如雷达技师 | xsd:string | |
工种 | 制配修理工、汽车修理工等 | xsd:string | |
… | |||
机构 | 机构名称 | 单位全称 | xsd:name |
机构地址 | 单位通讯地址 | xsd:string | |
联系电话 | 军线或地方线电话 | xsd:int | |
机构类型 | 指机关、基层、修理所、仓库等 | xsd:string | |
… | |||
装备维护 | 维护起始时间 | 年月日时分 | xsd:dateTime |
维护结束时间 | 年月日时分 | xsd:dateTime | |
维护内容 | 清洁、润滑、紧固、参数测试、排除一般故障等 | xsd:string | |
… | |||
脉冲压缩技术 | 脉压比 | 脉冲压缩的程度 | xsd:int |
距离旁瓣比 | 压缩后信号的主瓣峰值与第一副瓣峰值之比 | xsd:int | |
多普勒容限 | 可被接受的多普勒频移范围 | xsd:int | |
… | |||
杂波抑制技术 | 改善因子 | 杂波滤波器输出信杂比减输入信杂比,并对所关心的全部目标径向速度取平均 | xsd:int |
杂波衰减CA | 针对同一杂波,处理器输入信杂比与输出信杂比之差 | xsd:int | |
信杂比改善 | 多普勒滤波器组输出信杂比与输入信杂比之差,作为目标多普勒频率的函数计算 | xsd:int | |
… | |||
… | … | … | … |
2.3 创建实例
在概念类层次关系和核心属性关系研究的基础上,将预警装备知识本体中涉及的类、属性、个体和对应与描述逻辑的实体、属性、实例关系逐一列出,以“装备”类为核心,其余类均具有指向“装备”类与自身的关系“归属”,如资源与装备之间的保障关系、维修要素的上下从属关系、概念与实例之间的从属关系等,自定义的属性层级节点与域本体中的对应节点相关联,每个节点彼此之间都有关联的关系,因此每个节点相互连接,预警装备知识实体形成网状结构,从而构建出对预警装备知识多维度解构后的本体模型,共包含11种实体类别和27种关系类别。如图4所示。
图4 预警装备知识本体模型 |
本文研究以“远程预警相控阵雷达”为例,对预警装备本体进行实例填充,并通过Protégé5.5.0软件“Onto Graf”界面进行可视化。首先,对远程预警相控阵雷达这个类别以rdfs:comment进行Annotations备注,显示该装备主要是一部L波段远程引导兼警戒雷达。然后,对装备的分系统、配套设备、关键技术、保障资源和作战任务等类进行属性定义:雷达与分系统、配套设备之间有部分与整体关系属性,与基础知识之间有包含属性,与保障资源之间有研制生产、指挥隶属、维护使用、保管检修等关系属性。由于这些属性都不是唯一的,因此使用owl:someValuesFrom约束,例如一部雷达可以采用多个关键技术。最后,通过Data property assertions进行实例的数据属性对应。此外,由于远程预警相控阵雷达是预警装备的子类,因此,Sub-classOf预警装备其余的类也通过同样的方式进行定义。图5展示了以“远程预警相控阵雷达”为核心的预警装备领域语义网络,说明了装备的组成信息,唯一标识的型号、属性特征,以及与其他概念类之间的关系。
图5 添加实例图 |
3 形式化表达
本体作为一种共享的、对概念的形式化描述,需要用标准化的方式和规范化的语言对其概念内涵及层级结构进行表示[1],进而实现预警装备知识的共享和互操作。OWL语言对领域知识的定义较为完备,并且能够与多种本体描述语言进行兼容和交互,具有较强的表达能力和逻辑推理能力[12]。本文采用OWL-DL作为预警装备知识本体描述语言,主要对本体中概念类、核心属性和实例的形式化表达进行说明。
1)类的表示示例:
<owl:Class rdf:ID="反导预警装备"/>
<owl:Class rdf:ID="防空预警装备"/>
<owl:Class rdf:ID="临近空间预警装备">
<rdfs:subClassOf rdf:resource=#防空预警装备"/>
</owl:Class>
2)属性的表示示例:
<owl:ObjectProperty rdf:ID="部分与整体">
<rdfs:domain rdf:resource=#装备"/>
<rdfs:range rdf:resource=#分系统"/>
</owl:ObjectProperty>
<owl:DatatypeProperty rdf:ID="装备机动性">
<rdfs:range rdf:resource=" http://www.w3.org/2001/XMLSchema#string"/>
</owl:DatatypeProperty>
3)实例的表示示例:
<中国电科集团XX所rdf:ID="研制生产单位">
</中国电科集团XX所>
<XMW柴油发电机rdf:ID="配套设备"/>
</XMW柴油发电机>
4)对象关系的表示示例:
<!--定义了子类关系-->
<owl:Class rdf:ID="维修方舱">
<rdfs:subClassof rdf:resource="配套设备"/>
</owl:Class>
<!--不相容关系-->
<owl:Class rdf:about="#基础知识">
<owl:disjointWith rdf:resource="#信号理论"/>
<owl:disjointWith rdf:resource="#信号检测理论"/>
</owl:Class>
<!--并的关系定义-->
<owl:Class rdf:ID="杂波抑制技术">
<owl:unionOf rdf:parseType="Collection">
<owl:Class rdf:about="#MTI技术"/>
<owl:Class rdf:about="#MTD技术"/>
</owl:unionOf>
</owl:Class>
5)属性约束示例:
<!--所有远程预警相控阵雷达都至少采用一项关键技术-->
<owl:Class rdf:about="#远程预警相控阵雷达">
<rdfs:subClassOf>
<owl:Restriction>
<owl:onProperty rdf:resource="#采用"/>
<owl:someValuesFrom rdf:resource="#装备技术"/>
</owl:Restriction>
</rdfs:subClassOf>
</owl:Class>
4 结束语
为解决预警装备领域数据组织非结构化、实体关系刻画不够细致、知识表示缺乏结构化组织及规范化表达的问题,本文结合领域专家知识,针对预警装备领域的特点阐述了本体的构建目标与流程,详细介绍了本体构建流程中的重点步骤,运用Protégé系统工具完成了核心类及属性的定义,并以“远程预警相控阵雷达”为例进行本体实例填充和可视化,最后基于本体描述语言对预警装备本体进行了形式化表示,为将知识图谱理论与技术应用于预警装备领域提供了一种细粒度的科学知识组织框架。未来,在应用层面,基于本文所构建的细粒度预警装备领域本体,可结合深度学习算法应用于领域知识图谱构建中的实体识别、关系抽取、知识融合等任务,为预警装备信息智能搜索、辅助分析、指挥决策、知识推理、智能问答等应用提供有力支撑。
声明:公众号转载的文章及图片出于非商业性的教育和科研目的供大家参考和探讨,并不意味着支持其观点或证实其内容的真实性。版权归原作者所有,如转载稿涉及版权等问题,请立即联系我们删除。