数字设计与数字孪生:关键技术与发展趋势
源自:数字孪生研习社
作者:谭建荣院士
各位领导,各位专家,大家上午好:
今天很高兴来到苏州跟大家谈谈关于数字孪生技术研究的一些体会,向到会的各位领导各位专家做一个交流汇报。我汇报的题目是新一代信息技术下的数字设计与数字孪生:关键技术与发展趋势。我在浙江大学工作,主要从事数据建模与虚拟现实,数字设计和智能制造方面的研究。
现在搞人工智能大模型最热门的词就是大模型,大模型来自哪里?大模型来自小模型,小模型来自哪里?来自数据建模。所以我这个团队也是国内最早从事数据建模方向的研究。我们30多年前,90年代就提出数据建模,而且我指导了几十个博士生,我的博士生包括年轻的教师,他们的博士论文的题目和申请国家自然科学基金项目的题目,70~80%就是跟建模有关。没有建模,模型从哪里来的?模型先要建立起来才有大模型,大模型不是从天上掉下来的,需要我们从数据里面一个个建模建起来,所以建模工作也是我们人工智能数字孪生的一个非常重要的事,对数字孪生来说最关键也是要从建模开始。
1 新一代信息技术
第一个特点是由互联网技术发展成物联网技术。
第二个特点是由虚拟现实技术发展到增强现实技术,最近又发展到数字孪生元宇宙技术。
第三个特点是由网格计算技术发展到云计算技术。
第四个特点是由机器学习技术发展到深度学习机制,形成了几个典型的综合交叉领域,其中包括智能制造、元宇宙、大数据、人工智能,特别是人工智能技术最近发展得非常快,形成了生成式人工智能。
我们现在搞得轰轰烈烈,从南到北,从东到西到处搞人工智能,但是到底什么是人工智能,每个人的理解不完全一样。我个人理解人工智能最简洁的表述,图灵在1950年这篇文章的题目就是计算机能思维吗?人工智能就是计算机思维,或者说计算机模拟人的思维,这个叫人工智能。当然这个计算机有没有思维能力,能不能模拟人的思维,这个不是我说了算。图灵提出一个著名的图灵测试。图灵测试进行人跟计算机、人跟机器人,机器人也是计算机控制的,所以进行人跟计算机的人机对话,他们在旁边一个房间里对话,把他们对话的内容放出来,当我们分不清楚哪句话是人说的,哪句话是计算机说的,这个时候我们就认为计算机有思维的能力。过去我们搞了很多人工智能的应用场景,但是基本上都通不过图灵测试,为什么通不过?我举个例子来说,包括我们苏州在内,不少大城市的高级饭店都推出了一个服务项目,叫机器人送菜到包厢,机器人把菜送到包厢里,在技术上完全没有问题,但是机器人送菜还没有进包厢,只要他一说话,我就知道这个菜不是服务员送来的,是机器人送来的,所以他通不过图灵测试。
2 三大颠覆性技术
2022年11月份,美国open AI推出了生成式人工智能,应用ChatGPT不仅能够轻易通过图灵测试,而且利用生成式人工智能写的文章比一般的人、一般的秘书还要写得好,不仅能够轻易通过,而且还写得好。那么为什么他比一般的人、一般的秘书还写得好,生成式人工智能可以生成文本,生成视频,生成数字化的模型,生成各种音乐、画面,甚至可以生成各个领域的解决方案。为什么真正的人工智能写的文章比一般的人、比一般的秘书还要写得好,因为一般的人,一般的秘书头脑里的知识有限,数据有限,而真正的人工智能是利用大数据,不仅运用大数据,而且运用大模型。
大数据、大模型现在成了人工智能最显著的两个技术特点,也是我们数字孪生最新的两个驱动力。数字孪生要靠什么?要靠大数据,不仅要靠大数据,而且要靠大模型。那么我们要问数据和模型到底什么关系?
大数据
大数据是个好东西,但是是不是任何场合都要用大数据,小数据行不行?小数据是行的。我们讲大数据的时候千万不要忽略小数据。什么情况下小数据就行了,确定对应关系下小数据就行。什么叫确定对应关系?就是用数学的元素,当可以表征为 y=f(x) 有这个函数关系的时候,小数据就行。一个x对应了一个y这个时候你千万不要来大数据,这个时候你来了大数据,反而干扰了它的对应关系,反而造成了数据的冗余、计算的浪费。那么什么东西要用大数据呢?就在不确定情况下寻找确定关系,这个时候要用大数据。什么叫不确定对应关系有三种,
第一种随机的情况,
第二种是模糊的情况,
第三种混沌的情况。
这三种不确定的关系,我们要寻找确定的关系,那就要用大数据。那么到底什么叫大数据?非常遗憾,这个大数据到目前为止还没有统一的公认的定义,有一个不是定义的定义,什么叫不是定义?它不是定义,但是相对来说公认度比较高一点。什么叫大数据?用常规的技术,常规的手段,常规的软件,常规的数据库,难以处理的数据叫大数据,后面还要补充的状语,一般是TB数量级的。这句话一来我们现在很多人讲的大数据,其实都还不是严格意义上的大数据。
那么不确定关系下为什么数据一定要大。大数据真还没有专门的处理方法,我们只能借助统计学的方法。当然也有学者认为现在讲的人工智能,讲到生成式的人工智能,从某个角度说这是高级统计学的方法。统计学上有个大数定律,大数定律说什么,将当样本趋向无穷大的时候,样本的期望值就等于它的平均值,所以这个时候是样本趋向无穷的时候,所以大数据就跟无穷大结下了不解之缘。那么这个无穷大,有一个数学家说无穷大这个概念是人类无能的表现,是认知无能的表现。大数据也有点类似是无能的表现,你认为很多很多,但是无穷大这个概念200年以前被两个人搞清楚了,哪两个人?一个就是牛顿,一个就是莱布尼茨,我们理工科的大学生都学过微积分,微积分就是牛顿和莱布尼茨分别提出来的,微积分的英文名字叫什么?叫无穷小序列分析方法。老外的思维确实比我们要开拓,什么把无穷大做分母就变了无穷小,把无穷小搞清楚了你无穷大就搞清楚了。确实是这样,无穷小微积分的思想怎么搞清楚,无穷小数列分析方法,英文的名字叫这个。我们中文把它翻成微积分了。那么牛顿和莱布尼茨提出了微积分的思想,解决了无穷小三个问题,
第一个问题,无穷小序列是收敛的还是发散的?先要确定是收敛的还是有些是收敛的,有些是发散的,永远不收敛。
第二个问题,收敛值是多少,收敛到哪里去了,要把它的收敛值找出来。
第三个问题更重要,对我们大数据更有借鉴意义。同样是收敛的,有个收敛速度问题,有些收敛迭代没几下就收敛了,有些要迭代很久很久,甚至于无限缓慢,要无限多项才能收敛。所以我们大数据只能用数据挖掘的方法,统计学的方法来研究它。
大模型
数据和模型到底什么关系,数据还是一盘散沙,我们的任务就要把数据的联系找出来,把数据隐含的规律找出来,把数据隐藏的价值挖掘出来,挖掘出来的东西叫什么?就叫知识。所以人工智能主要的途径就叫知识工程。人为什么有智能的?因为人是有知识的,小孩子的智力要差一点,为什么差一点?他知识比较少,很多知识他还没学到,年纪大的人智力要衰退,为什么会衰退?很多知识他忘记掉了。所以人工智能主要途径就是知识工程,从数据挖掘出知识就是人工智能。知识工程的理论和方法是谁比较系统的提出来的?是1977年美国斯坦福大学一个叫费根鲍姆教授,他提出了知识工程的理论和方法,由此他获得了计算机领域的最高奖,图灵奖。图灵奖也被称为计算机领域的诺贝尔奖。那么有没有我们中国人获得?有一个人就是现任的清华大学人工智能学院院长姚期智院士,他是图灵奖的获得者。
我们要用大数据进行知识工程,知识的凝练、知识的挖掘。知识可以分为两类,一类是定性的知识,另一类就定量的知识,我个人理解,定量的知识我们就叫模型,大模型就大量定性的知识、定量的知识。大模型一般都需要几百亿个参数的训练它,训练什么内容,训练各种场合的定量关系,所以大模型管用就管用在这里,它是定量的关系。当然我们要寻找定量关系,那就要用到大的战略,没有大的战略也不行。
大算力
要用大的战略,所以战略成了一个国家一个地区的核心竞争力。我们苏州要建立科技中心,现在听说全国有6个科技中心,当然北京、上海、深圳,这3个城市肯定是,还有3个城市,1个是武汉,1个是合肥,还有个什么地方全国有6个科技城,科技中心必定是战略中心,也必定是大模型大数据的中心。我们很多企业要争这个行业的领头羊,你要成为行业的领头羊,那就必须成为行业的大数据中心,行业的大模型中心,行业的大战略中心,那么生成式人工智能功能这么强,人工智能的尽头是什么?有人说生成式人工智能发展的前景就是有人把它提升了一下叫尽头,人工智能的尽头是什么?
人工智能的尽头,有人认为就是元宇宙数字空间,也就是我们今天说的数字孪生。这个数字孪生做得好不好,我们怎么评价还是用图灵,我个人认为还是用图灵测试的方法,图灵测试的原则来判断我们数字孪生做的好不好。数字孪生就是双胞胎,当我们分不清楚哪个是物理产品,哪个是数字产品,哪个是真实的人,哪个是虚拟人、数字人。当我们分不清楚时候,我们就认为元宇宙这个数字空间打造得非常完美,人工智能的尽头就是元宇宙。这句话我到很赞成,为什么在元宇宙世界里运用生成式人工智能,我们就分不清楚哪个是真人,哪个是假人。
我举个例子来说,新冠病毒前面我们杭州滨江有个小公司,小公司他就做了个邓丽君的模型,杭州的戏院电影院都没人看戏,没人看电影,那么这个戏院就包给他了,包给这个小公司。小公司利用戏院就召开了几次邓丽君演唱会,非常震撼,灯光全部暗下来,邓丽君徐徐走上舞台,说亲爱的歌友,我们好久不见面了。2021年中国中央电视台,大家知道中央电视台是很严肃的是吧,上中央台的节目都要经过严格审查的。2021年中央电视台春节元宵文艺晚会推出了一档节目,它是什么节目?青年歌手周深跟邓丽君对唱。当然我们知道历史的人就知道邓丽君死掉30多年了,邓丽君死掉的时候周深可能还没有出生,即使出生了可能他还在穿开裆裤。现在邓丽君跟周深对唱,不了解历史人就分不清楚哪个是真人,哪个是假人,也可能两个都是假人,也可能两个都是真人,也可能是周深是真的,邓丽君是假的,也可能邓丽君是真的,周深是假的是吧?所以就图灵测试的推广到元宇宙数字空间,人工智能加上元宇宙,现在已经构成了人工智能安全防范的一个主要方面,安全防范人工智能而产生很多安全问题再加上元宇宙安全问题更加突出。
那么还有一项技术就拟人化机器人,把机器人做得和人一样拟人化,现在叫人形机器人。上面很多文件,很多公司喜欢用人形机器人,我个人比较喜欢用拟人化,为什么?不仅形状要像,而且要形似,而且要神似,就把人工智能、元宇宙和拟人化机器人三者真正结合起来,那么就产生真正的颠覆性技术。元宇宙数字化设计,数字化制造,数字化孪生,那就是人工智能、元宇宙和拟人化机器人的一个比较好的利用。
3 应用平台
这个是我们开发的我们提出的数字孪生和数字空间打造的十大关键技术,因为时间关系我就不展开了。那么我们浙江大学还跟杭州有个叫炽橙科技公司,联合打造了一个工业智能交互的元宇宙底层平台,推动工业技术,面向中国工业体系,新型软件系统,开放平台服务。
在这个平台下也为构建数字孪生城市,数字城市提供能力的支撑、基础的引擎和数字孪生体的构建。
那么我们这里也做了很多面向机电装备的数字孪生的仿真,仿真大家都在做的很多,但是我们第一做的最早,第二我们也是做的最好,零件数量最多,而且最主要真实感最强。20多年前,南京航天航空大学的校长朱建英批评搞仿真的人没有仿到真,而把假仿出来了,真实度不够。我们现在技术发达了,我们数字孪生技术要仿的更真,那么对汽车发动机不仅要装得起来,而且要动得起来,不仅要动得起来,而且要把它的引力能够实时显示出来。这个活塞气缸连杆引力如何交变可以实时反映出来,而且这个喷油过程引力的变化跟喷油有关,我们开车油门一踩,曲度的引力就要变大等等。
那么我们还开发了很多数字化的数字孪生的机电产品,因为时间关系我就不一一在这展示,我的报告就到此结束,谢谢大家。