9月23日,Digital Twin发表了第一篇论文“数字孪生数据-方法与关键技术”。这篇文章由中国、澳大利亚、法国、瑞典、新加坡等5个国家学者合作完成,针对数字孪生理论与应用不断拓展与升级过程中出现的数据全面获取、深度挖掘、充分融合、实时交互、迭代优化、通用普适及按需使用新需求,探索建立了一套数字孪生数据构建与处理准则,在相关准则指导下研究了数字孪生数据“获取-存储-交互-关联-融合-演化-服务化”理论方法,并建立了面向数字孪生数据的关键技术体系。相关工作为数字孪生数据研究与应用提供理论与方法参考。 论文来源 文章发表于《Digital Twin》期刊,2021年9月23日 DOI:10.12688/digitaltwin.17467.1 论文链接: https:///articles/1-2/v1 文章导读 以下视频来源于TandF学术,时长01:47 数字孪生国际期刊 今年7月28日,Taylor & Francis 出版集团携旗下品牌F1000,联合北京航空航天大学共同推出国际英文期刊Digital Twin(数字孪生) (ISSN: 2752 – 5783; https:///) 其为全球首个专注于数字孪生领域的国际期刊,主要发表与数字孪生研究有关的高质量原创科研论文、综述、案例、软件工具、数据注释、简报及评论等。Digital Twin 采取开放获取的形式发表研究成果,论文投稿达到期刊要求之后,将在14个工作日内完成首轮评审,评审通过后即分配DOI号上线发表。之后期刊提供公开透明的同行评审流程,并完全实施FAIR数据开放分享政策,以确保读者对研究结果及源数据的便捷访问和再利用。 译 文 摘要 数字孪生作为践行数字化转型和智能化升级的关键使能技术,以及传统行业与数字经济融合发展的驱动助力,近年受到国内外学术界与工业界的高度关注和研究实践。数据是数字孪生的核心要素之一,是实现数字孪生模型构建、实体与模型连接交互、智能服务运行优化等的重要基石。当前,随着相关理论技术与应用的不断拓展与升级,数字孪生对数据提出了一系列新要求。在此背景下,本文首先对全面获取、深度挖掘、充分融合、实时联动、迭代优化、通用普适及按需使用的数据新需求进行了分析,接着基于作者团队前期提出的数字孪生数据(Digital Twin Data, DTD)概念,探索建立了一套面向数字孪生理论发展与实际应用的数字孪生数据构建与处理准则,在相关准则指导下进一步研究了数字孪生数据“获取-存储-交互-关联-融合-演化-服务化”理论方法,并建立了一套数字孪生数据关键技术体系。期望相关工作能为数字孪生数据理论研究与应用实践提供参考。 关键词:数字孪生、数字孪生数据、准则、理论方法、关键技术 1 从数据到数字孪生数据 随着移动互联网、物联网、云计算、大数据、人工智能、区块链等信息技术的不断升级,全球数字经济蓬勃发展。数字孪生(Digital Twin)作为实现传统产业数字化转型与智能化升级的有效手段[1],近年来受到航空航天[2-3]、车辆[4-5]、船舶[6]、智能电网[7-8]、智能城市[9]等行业的极大关注。特别是在智能制造领域,数字孪生已被应用于车间智能管控[10-11]、个性化产线快速配置[12]、产品全生命周期管理[13]、智能物流[14]、动态调度[15-16]、机器人运行优化[17]、产品质量保障[18-19]、数控设备维修[20]及人机交互[21-22]等问题中。数字孪生实践主要依赖以下几方面关键技术[23]:物理实体智能感知与实时控制,多维虚拟模型构建、组装、融合、校正、验证及管理,信息系统服务全生命周期管理与增值增效,模型-服务-实体实时交互与动态演化,多维数据关联与融合处理等。虽然这些技术服务于数字孪生的不同功能应用,但支持其实现的基本要素均为数据,因此保证高质量的数据资源是实现数字孪生的关键核心之一。 早期的数据采集往往通过传统的人工方式实现(如直接观察、抽样检测、手动统计等),这种方式效率低、成本高,且获得的数据类型单一、规模小、实时性差,仅能对物理实体在某一阶段或周期内的属性、能力、现象等进行描述。近年来,得益于新一代信息技术的发展,越来越多的数据能够被实时采集、存储及处理,它们来自智能装备、可穿戴设备、物联网、信息系统等多种数据源,数据体量大、实时性强,能够连续记录并分析物理实体在整个生命周期的变化过程。然而,随着数字孪生相关技术研究与应用的不断拓展与升级,对数据发展提出了以下新需求。 (1)数据全面获取需求 实现基于数字孪生的设备关键参数预测、生产过程优化、维修决策等服务需小概率事件数据、多尺度数据、复杂时变数据等的全面支持,目的是提高服务准确性、对极端情况的适应性及决策均衡性。当前基于数据的相关研究通常采用来自设备、环境、人员等物理实体的属性、状态及行为等实况数据,或利用基于虚拟模型、智能算法、规律规则等生成的仿真数据,然而这些数据均不能实现对数据的全面覆盖[24-25]。例如,①就物理实况数据而言,受环境、技术及成本限制,难以获得设备故障、极端工况等小概率事件数据,多尺度温度场、应力场、流场数据,以及高温高压等极端环境下传感器难以采集的数据。②就仿真数据而言,受建模能力、计算能力及实践环境复杂程度的影响,难以准确模拟突发性扰动数据、高维动态数据等复杂时变数据。 (2)数据深度挖掘需求 为了提高对物理世界的洞察力,需对物理实体的运动规则、故障机理、性能变化趋势、演化规律等知识进行提取与归纳,在此基础上形成能够真实刻画物理实体行为属性的数字孪生多维虚拟模型。当前,尽管物联网等技术的发展使数据体量大大提升,但如何实现对海量物理实体数据、虚拟模型数据、服务数据等的深度挖掘从而实现对知识的提取仍是重要难题之一。一方面由于无关数据、异常数据、冗余数据等占比较大,数据本身的可挖掘性较弱;另一方面难以充分提取数据间的隐性关联关系(例如因果关系、相似关系和互补关系),以进一步支持深入的知识挖掘。 (3)数据充分融合需求 由于支持数字孪生技术研究的数据来自物理实体、虚拟模型、ERP和MES系统等多种数据源,存在数据干扰因素多、不同来源数据相互矛盾、数据整合程度低等问题,这造成数据价值密度偏低。例如,①受传感设备故障、环境波动、人为干扰等扰动因素影响,采集的物理实体数据具备一定的不确定性、随机性及模糊性,导致数据信息量损失;②模型与服务数据缺乏与物理实体数据的实时交互与相互验证,导致其偏离物理实际;③物理实体数据、虚拟模型数据及服务数据孤立且承载的信息视角单一,造成数据不全面。为了解决相关问题,需实现物理实体数据、虚拟模型数据、服务数据等的充分融合,通过数据的相互修正、补充及增强,保证信息的准确性、一致性及全面性。 (4)数据实时交互需求 为了保证数字孪生的物理实体、虚拟模型、服务等不同组成部分动态更新与及时响应,需实现数据实时交互。①为了保证虚拟模型实时更新、仿真及时准确、以及实现基于仿真的物理实体行为实时调整,要求虚拟模型数据与物理实体数据实时联动。②为了基于模型仿真数据验证服务可用、可靠及准确性,并基于校正服务及时优化虚拟模型参数,要求实现虚拟模型数据与服务数据实时联动。③为了及时向物理实体提供故障诊断、维修决策、控制参数优化等服务,并基于物理实况数据提高服务对实际环境变化与扰动因素的适应性,需实现物理实体数据与服务数据实时联动。 (5)数据迭代优化需求 数据是构建虚拟模型与服务的核心驱动之一,为了支持数字孪生虚拟模型自主进化与服务功能不断增强,要求实现基于“数据增加-数据融合-信息增加”循环的数据迭代优化。数据迭代优化能够随着数据增加实现有价值信息的持续增长,从而使存在于数据之上的模型与服务不断更新和进化。实现数据迭代优化面临的问题包括:①由于数据融合对技术人员有较强的依赖,缺乏自主性和连续性,导致很难进行持续有效的迭代;②即使迭代优化过程得以持续进行,由于连续的数据融合可能导致信息损失,造成难以保证信息持续增长。 (6)数据通用普适需求 数据通用普适性低是数字孪生落地应用的主要阻碍之一,主要体现在以下方面:①面向不同应用条件时,由于数据获取能力、数据基础设施水平、数据历史积累量不同,导致构建的数字孪生难以迁移复用;②面向不同应用对象时,由于数据具有不同的类型、结构、接口及通讯方式,增大了不同对象数字孪生间的数据交换与解析难度;③面向不同应用场景时,数据格式、分类、封装等各异,造成不同场景下构建的数字孪生难以实现数据集成共享。为了解决上述问题,需实现数据统一转换与建模,从而保证数据具有通用普适性。 (7)数据按需使用需求 数字孪生面向的用户往往具备不同应用需求、知识结构及专业水平,因此用户对数据需求有较大差异,如现场操作人员需工艺路线、装配序列及维修计划等现场操作指导数据,专业技术人员需生产设备性能评估、实时状态监测及生产分析结果等专业化数据,高层管理决策人员需产销数据、需求分析及产品竞争力等市场数据[26]。然而,由于当前数据服务化程度普遍较低,数据搜索、匹配、调用、可视化等通常要求用户具备较强的专业技能,这导致数据易用性差的问题。因此,面向不同层次的数字孪生用户,需满足以用户为中心的数据按需使用需求。 针对数字孪生技术发展中出现的数据新需求,北航数字孪生研究组在前期工作中提出了数字孪生数据(Digital Twin Data, DTD)的概念[26],它是数字孪生五维模型(包括物理实体、虚拟模型、服务、数字孪生数据及两两间的连接)的重要组成部分。为了充分利用数据孪生数据优势、满足数据发展需求,本文在前期研究基础上进一步建立了数字孪生数据构建与处理准则,研究了数字孪生数据“获取-存储-交互-关联-融合-演化-服务化”理论方法,建立了数字孪生数据关键技术体系,以期为数字孪生数据理论研究与应用实践提供参考。 2 数字孪生数据构成 本节首先对数字孪生数据构成进行介绍。根据前期研究[26],将数字孪生数据分为物理实体相关数据、虚拟模型相关数据、服务相关数据、融合数据、连接数据及领域知识六个部分,如图1所示。 图1 数字孪生数据构成 物理实体指在物理空间客观存在且具有一定结构、功能及行为特点的对象实体[26]。物理实体相关数据包括设备、产品、人员、物料、工具等实体的尺寸、结构、属性、能力等静态数据,以及实体状态、突发扰动及环境参数等动态数据。物理实体相关数据是构建数字孪生数据的事实基础。 虚拟模型从几何、物理、行为及规则多个维度对物理实体进行真实刻画[26]。相关数据是在物理实体数据基础上,利用模型仿真生成的与物理实体数据具有相似、互补、因果等依存关系的数据。它主要包括刻画物理实体几何参数、物理属性、动态行为及规则的多维模型相关数据,如模型参数数据、仿真条件数据、仿真过程数据、仿真结果数据、模型验证数据等。 数字孪生服务包括支持数字孪生运行的基本功能性服务与面向具体应用需求的业务性服务[27]。服务相关数据一方面指功能性服务(如模型管理服务、数据处理服务、连接服务)相关数据,如模型配置数据、算法配置数据、服务封装数据等;另一方面指在物理实体数据与虚拟模型数据基础上构建的业务性服务(如设备关键参数预测服务、生产调度优化服务、生产实时控制服务)相关数据,如设备性能评估数据、生产排程数据、工艺参数配置数据等。 领域知识指面向不同行业的专业经验、系统规则、标准规范等[26]。此外,它也包括基于数字孪生数据不断挖掘产生的规律规则等新增知识,它们是指导数字孪生模型构建与管理、服务运行优化、数字孪生数据处理等的参考和指导。 融合数据是通过相似或互补数据时空配准、多维关联、全面融合等多层次、多方面综合作用,对物理实体相关数据、虚拟模型相关数据、服务相关数据及领域知识等多源数据进行融合处理,形成的针对某一属性、特征或行为的统一、全面、准确描述[26]。与来自单一数据源的数据相比,融合数据对数字孪生多源多模态数据进行综合与整合,能够体现更丰富的信息。 连接数据是指在物理实体相关数据、虚拟模型相关数据、服务相关数据、融合数据及领域知识间进行双向传输的数据[26]。连接数据来源于上述五类数据,但与其原始数据不同的是,连接数据通常需通过数据处理算法进行压缩,以达到缩减数据量、提高数据传输效率的目的。连接数据通过统一的数据接口与通讯协议实现实时交互,目的是保持各部分数字孪生数据的一致性与联动性。 3 数字孪生数据标准 为了满足数字孪生对数据全面获取、深度挖掘、充分融合、实时交互、迭代优化、通用普适及按需使用需求,本节提出了一套数字孪生数据构建与处理准则,如图2所示。 图2 数字孪生数据准则 (1)互补准则互补准则强调对信息与物理空间数据的全面获取,一方面利用物理实体数据能够真实反映动态实况变化的优势,补充虚拟模型仿真数据缺乏的不确定性复杂时变数据等;另一方面利用虚拟模型仿真数据不受时间、空间及成本限制的优势,补充物理空间缺乏的设备故障等小概率事件数据、多尺度物理场数据、难以直接测量的极端环境数据等。该准则是为了满足数字孪生数据全面获取需求。 (2)标准化准则标准化准则是指将不同应用对象、条件及场景下获取的数字孪生数据转换为具有统一数据结构、格式、类型、接口等的标准化数据。该准则的目的是满足数字孪生数据通用普适性需求,以支持不同应用对象间数字孪生数据的交换、不同应用条件下数字孪生数据的迁移复用、以及不同应用场景下数字孪生数据的集成共享。 (3)及时性准则及时性准则是指需实现数字孪生数据不同组成部分两两间连接数据的实时传递与及时校正,从而满足数字孪生数据实时交互需求。为此,一方面需有效压缩连接数据,提高数据传输效率;另一方面当两类数据间的连接数据出现冲突时(数据差值超出设定阈值),需及时调整模型、服务及物理实体相关参数,使连接数据重新归为一致。 (4)关联准则关联准则是为了满足数据深度挖掘需求,该准则指最大程度地挖掘物理实体数据、虚拟模型数据、服务数据、领域知识、融合数据间的因果、相似、互补等关联关系,在此基础上提取隐含在数据中的信息(如物理实体行为模式、虚拟模型仿真机制、数字孪生不同组成部分的行为-性能映射关系),并通过归纳总结实现对更深层规律规则等隐性知识的深度挖掘。 (5)融合准则融合准则强调通过融合具备不同关联关系的数字孪生数据,满足数据充分融合需求。例如,通过融合具有相似关联关系的物理实体数据、虚拟模型数据及服务数据,可降低物理实体数据的不确定性、随机性及模糊性,或提高信息空间虚拟模型数据与服务数据的准确性与可靠性;通过融合多源互补数据,有利于增强融合数据承载信息的多样性。 (6)信息增长准则信息增长准则是指在数据动态积累过程中,首先需实现新增数据与历史数据的自主融合,接着通过评估融合数据信息量的增损情况决定是否接受本次融合;在多次融合的基础上挖掘信息增损规则,并在相关规则指导下持续优化后续数据融合过程。该准则目的是满足信息持续增长需求。 (7)服务化准则服务化准则是指将数字孪生数据相关资源(如数据、数据模型、数据处理算法、数据可视化方法)封装成具有标准输入、输出、功能等的服务,根据用户的不同应用需求对服务进行按需搜索、匹配、调用、组合及可视化等,最终提供用户所需数据。该准则是为了满足数据按需使用需求,从而降低对用户专业技能的要求。 4. 数字孪生数据理论方法 基于上述准则,本文提出了一套数字孪生数据“获取-存储-交互-关联-融合-演化-服务化”理论方法,如图3所示。其中,根据准则(1),在数据获取步骤同时获取物理实体数据与信息空间仿真数据以提高数据全面性。根据准则(2),在数据存储步骤通过对不同对象、条件、场景获取的数据进行标准化统一转换增强数据通用性。根据准则(3),在数据交互步骤实现连接数据的实时传输与一致性评估。根据准则(4),在数据关联步骤深入提取数据间的多样化关联关系以增加知识深度。根据准则(5),数据融合步骤通过充分融合物理实体、虚拟模型、服务、领域知识的相似数据与互补数据,实现数据的相互验证与补充。根据准则(6),在数据演化步骤实现基于迭代优化的数据融合,保证信息持续增长。根据准则(7),数据服务化步骤实现对数字孪生数据、算法、模型等资源的服务化,支持数字孪生数据按需使用。 图3 数字孪生数据理论方法 4.1 数字孪生数据获取 数字孪生数据获取包括物理实体相关数据、虚拟模型相关数据、服务相关数据及领域知识的获取。连接数据与融合数据可视为这四类数据的衍生数据。①物理实体状态、环境及扰动等动态数据可通过传感装置、嵌入式系统、数据采集卡等实时采集,物理实体属性、能力、功能等静态数据可通过人工测量、抽样检验等方式获取。②虚拟模型相关数据主要在各类模型的构建、仿真及验证过程中生成,相关数据可通过查询建模手册、记录仿真日志、监测仿真实时输出等方式获取。其中,物理机理模型对物理实体内部物理场、因果关系、物质/能量流的传递机理等进行分析,是仿真数据生成的主要方法之一。为了提高物理机理模型仿真数据生成效率与准确性,本文作者团队设计了机理模型与数据双驱动的仿真数据生成方法[19]。③服务相关数据一方面通过设备故障预测、设备动态调度、工艺参数优化决策等业务性服务生成;另一方面通过数据处理、模型管理、工具组件等功能性服务产生。④领域知识一方面可通过分析专家经验、历史大数据、行业标准及手册等提炼获取;另一方面通过对数字孪生数据关联关系的挖掘与归纳不断产生新知识。 4.2 数字孪生数据存储 对数字孪生在不同应用对象、应用条件及应用场景下获取的物理实体、虚拟模型、服务及领域知识等相关数据进行统一建模与存储,使数据结构、格式、类型、接口等标准化。①定义数字孪生数据的规范化描述方式,包括对数据格式(如数值型数据、文本型数据、图像、视频)、结构(如结构化、非结构化、半结构化)、数据接口类型、采样频率、历史数据积累量、通讯协议等的描述。②针对历史数据积累量、数据种类、数据采样频率等属性定义必要约束,明确数字孪生应用对数据的基本要求;针对来自不同应用场景且具有不同格式、分类、封装等的数据,需定义标准化的数据表达方式,通过建立原始数据与标准数据的映射规则实现数据的统一转换;针对来自不同应用对象的数据(如不同热压罐设备的温度数据),将数据单位、采样间隔、空间坐标等进行配准,数据接口与通讯方式进行统一转换。③对转换后的数据进行统一建模,常用的建模语言包括统一建模语言(UML)[28]、系统建模语言(SysML)[29]、本体语言[30]等。此外,基于范畴理论的数学方法[31]可支持数据建模、互操作及集成。在此基础上,对数据模型进行存储,并实现数据归档、复制、索引、访问、加密、共享等功能。 4.3 数字孪生数据交互 构建数字孪生数据的连接数据,目的是支持数字孪生各部分的实时交互,包括:①定义数字孪生数据两两间的连接数据以支持信息的有效传递,以生产设备为例,可将传感器采集的设备实际状态数据与虚拟模型生成的设备预期状态数据作为物理实体相关数据和虚拟模型相关数据的连接数据;②通过数据清洗、筛选、降维、压缩等操作去除数据噪声、冗余数据等,将处理后的连接数据封装成符合指定规范的数据包,并基于通用的传感器、软件及数据库接口实现连接数据实时交互;③构建不同数据源两两间连接数据一致性判断方法,包括连接数据时空配准、基于欧式距离的数据一致性计算、一致性判断阈值设定等;④对连接数据进行实时对比,若连接数据出现不一致,则根据冲突特征定位原因,并实施相应的虚拟模型参数校正、服务数据更新以及物理实体行为调整等,使两两间的连接数据重新归为一致,保证数字孪生各部分的协调运行。 4.4 数字孪生数据关联 挖掘物理实体数据、虚拟模型数据、服务数据、领域知识等多样化数据间的关联关系,支持对更深层知识的提取。①对来自物理实体、虚拟模型、服务、领域知识的数据进行预处理,包括数据滤波、异常数据与无关数据剔除、数据特征提取等。②将处理后的数据进行时空配准,如利用最小二乘配准法使数据在时间维度同步、在空间处于同一坐标系。③基于皮尔逊相关性分析方法[32]、K-means[33]、Apriori算法[34]等最大程度地挖掘配准后数据间的时空关联性。基于复杂网络模型建立数据关系网络,在该网络中将单个数据变量(如设备温度、振动、转速等)视为网络节点,数据关联关系视为网络边。④在此基础上,通过统计法、聚类法、分类法等进一步实现知识推理,并将得到的知识以知识图谱的形式表示。为了支持数据融合,这里特别指出两种数据关联关系,分别是相似关联与互补关联。其中,前者指具有相似属性、相似数值或相似增减趋势等的数据间关联关系,后者指来自多个数据源且从不同角度对同一属性或行为进行描述的多模态数据间的关联关系。 4.5 数字孪生数据融合 数据融合是对物理实体、虚拟模型、服务、领域知识数据的认知、分析及综合处理过程,目的是提高数据确定性、准确性、多视角性。当前数据融合研究主要集中在对物理实体数据的综合处理与分析上(如基于多传感器数据融合的设备状态评估、预测及优化)[35-37],对物理实体数据、虚拟模型数据、服务数据、领域知识等的融合关注较少。数字孪生数据融合是通过选择合理的融合数据、融合方法等实现物理实体、虚拟模型、服务、领域知识数据的最优融合,支持数据的相互修正与补充。例如,①当物理实体数据受实际环境噪声干扰时,采用加权法[38]、证据理论法[39]、卡尔曼滤波[40]等融合具有相似关联关系的物理实体数据、模型数据、服务数据等,降低数据的不确定性;②类似地,当模型数据、服务数据偏离物理实际时,采用贝叶斯估计[41]、神经网络[42]等方法融合与其具有相似关联关系的物理实体数据,保证融合数据准确性与可靠性;③针对从不同角度对同一属性或行为进行描述的互补性多模态数据,采用加权法[38]、神经网络[42]等对其进行融合处理,增强融合数据承载信息的多样性。 4.6 数字孪生数据演化 由于数据演化可视为多次数据融合的叠加,只着眼于单次融合不足以完整刻画数据演化规律,因此采用基于复杂网络模型建立的数据关系网络对数据演化过程进行动态描述。当新增数据加入网络时,通过新增数据预处理、新增数据与历史数据配准、以及配准数据关联关系挖掘实现新增数据与历史数据的关联。接着,构建自主融合框架(支持对融合数据、融合方法、融合机制的自主选择)实现具备相似或互补关联关系的新增数据与历史数据融合,支持对数据的修正或补充。结合信息熵概念[43]与复杂网络特征[44]对数据融合的有效性进行评估,例如,基于信息熵可对网络节点信息量进行量化测量,通过比较数据融合前后网络节点的信息熵实现对信息增损的评估;根据复杂网络特征(如度分布、介数、聚类系数)可对数据融合前后网络结构的变化进行评估,从而分析信息分布与网络结构的关联关系等。基于多次融合和评估结果挖掘信息增损规律,并在此基础上持续优化自主融合框架,目的是实现对后续数据融合过程的不断优化、保证信息持续增长。 4.7 数字孪生数据服务化 该步骤是通过服务化达到物理实体相关数据、虚拟模型相关数据、服务相关数据、连接数据、融合数据、领域知识等数字孪生数据按需使用的目的,使其满足不同层次用户的应用需求,具体步骤阐述如下[45]。首先,将数据、算法、模型、可视化方法等封装成服务,对其输入(如数据类型、数据量、数据特征)、输出(如结果数据、可视化图表)、功能(如数据提取、处理、可视化)、性能(如时间、成本、可靠性)等进行服务化描述。接着,根据用户的数据需求(如对设备状态融合数据、零部件剩余寿命预测结果数据、设备维修操作指导数据的需求),匹配相应的服务实现数据提取、处理及可视化等功能。综合考虑时间、成本、可靠性等多个优化目标,对上述服务进行组合优化,形成的组合服务能够在满足多个优化目标的前提下,将结果数据按需提供给用户,相关技术包括需求分解、相似性匹配、多目标组合优化等。在数据可视化方面,除传统的图表可视化外,可基于虚拟现实(Virtual Reality,VR)[46]、增强现实技术(Augmented Reality,AR)[47]将数据和与其级联的虚拟模型、物理实体进行融合,融合后的结果能够更深入地展示数据-模型-实体的映射关系。 5 数字孪生数据关键技术体系 在本文作者团队前期提出的数字孪生使能技术[23]和数字孪生车间关键技术[48]基础上,本文进一步总结了数字孪生数据关键技术体系,如图4所示。 (1)数字孪生数据获取步骤需获取小概率事件数据、极端环境数据、多物理场耦合数据等,而这些数据往往需基于模型仿真生成,相关技术包括多维模型构建技术、仿真数据验证技术、迁移学习技术、高效仿真技术等。其中,多维模型构建技术支持几何、物理、行为、规则模型的构建;高效仿真技术(如元模型[49])可提高仿真数据生成效率;迁移学习技术可解决建模数据不足问题,实现基于小样本数据的建模。 图4 数字孪生数据关键技术 (2)数据存储需面向具有不同结构、格式、类型、封装及接口等的数据,相关技术包括数据统一建模技术、数据库管理技术、数据空间扩展技术、数据集成技术、数据安全技术等。其中,数据统一建模技术实现对各类数据的统一转换与描述;数据库管理技术支持基本数据操作;数据空间扩展技术能够适应不断增长的数字孪生数据;数据集成技术可消除数据孤岛,保证数字孪生数据的全面共享。 (3)在数据交互方面,相关技术包括数据采集技术、数据降维技术、数据压缩技术、数据中间件技术、数据一致性评估技术等。其中,数据采集技术可通过传感器、数据爬虫、软件接口等多种方式从各部分数字孪生数据中提取连接数据;数据降维技术可减少无关数据、冗余数据;数据中间件技术[50]实现数据格式、接口及通信协议的转换,保证数据统一传输;数据一致性评估技术实现数据距离计算、一致性评估阈值设定等。 (4)在数据关联方面,相关技术包括数据时空配准、数据关联关系挖掘、知识推理、知识表示等。时空配准技术使数字孪生数据在时间上同步、在空间上属于同一坐标系;数据关联关系挖掘算法支持对数据分类、关系及相关性的分析;知识推理技术进一步从数据分类、关系、相关性中提取知识;知识表示可直观地描述知识、载体及知识间的相互联系。 (5)在数据融合方面,相关技术包括异常数据检测技术、粒度转换技术、异构数据融合技术、数据融合容错机制、数据融合算法等[51]。异常数据检测技术在数据融合前去除异常数据;粒度转换技术可将不同粒度的数据(例如稀疏数据和密集数据、原始数据和数据特征、抽象符号和具有实际意义的数据)[51]转换到相同粒度;异构数据融合技术融合具有不同类型、结构、采样频率的数据;容错机制可增强数据融合的鲁棒性。 (6)在数据演化方面,复杂网络建模技术支持数据关联关系网络的构建;基于信息测量技术可评估网络节点信息量、信息分布、信息累积量;传播动力学建模技术[44]可分析从单个数据到融合数据的信息传递,动态描述信息传播过程;此外,可从信息增长、变化、传递过程中挖掘数据进化规则,优化对融合数据类型、方法、机制的选择。 (7)在数据服务化方面,相关技术包括资源封装、用户需求分解、多目标组合优化、基于VR和AR的数据可视化等。资源封装技术将数字孪生数据相关资源转化为可用元组描述的服务;用户需求分解技术将复杂的用户需求分解为多个子需求,便于实现对特定服务的搜索匹配;多目标组合优化技术可通过权衡考虑相互冲突的目标(如时间、成本、可靠性)形成组合服务;基于VR和AR的可视化技术以更直观的方式呈现数据、虚拟模型和物理实体间的关系。 6 结束语 数据是数字孪生的核心驱动之一。为了满足数字孪生技术研究与落地应用对数据提出的全面获取、深度挖掘、充分融合、实时交互、迭代优化、通用普适、及按需使用新要求,本文基于作者团队前期提出的数字孪生数据概念,进一步研究了数字孪生数据准则、方法及关键技术,为数字孪生数据的进一步推广和应用提供了理论基础,这将有助于获取更全面、一致的数据,更丰富、深入的信息,以及支持更便捷、标准的数据使用。 本文是在团队前期相关研究基础上对数字孪生数据理论方法的初步探讨,后续将结合企业需求对数字孪生数据获取、存储、交互、关联、融合、演化、服务化等方法应用效果进行进一步验证与优化。由于数字孪生数据理论与技术体系庞大,文章内容细节难免有不足之处,恳请国内外专家和同行批评指正。 |
|