概论:ChatGPT在互联网各大社交媒体上持续大热,舆论普遍认为,生成式AI的技术跃进将是第四次工业革命的开始,也必定对数字孪生技术发展产生较大的推动作用。为此,美象科技的程序员小伙伴专门研究了GPT的代码逻辑及训练过程,并发现GPT和数字孪生具备一定的同构特征。
ChatGPT的进步无疑是飞速的,一年前它还是一个词不达意的软件,一年以后就能成段成段输出使用者想要的结果,条理清晰,脉络严谨,虽然时而创造不存在的事实,时而信口开河,但是按照这个发展速度,不用十年,它就会以一个全知全能的神的姿态出现,解答人们的问题。
技术的发展有其自身的规律,目前大语言模型技术的第一个奇点已经产生,即通过自然语言的输入,形成多样化内容输出。这一输出结果可以在一定程度上匹配使用者的预期,从而令使用者觉得像是在与真人进行交谈。从ChatGPT的基本过程和表现状态来看,业界普遍认为它通过图灵测试应该不成问题。
基于AI技术是数字孪生核心技术之一的事实,我们去研究了ChatGPT的代码以及训练过程,以求仔细研判该技术在操作层面对数字孪生目前的工艺流程和业务方向有什么帮助,以及对于数字孪生行业发展的实际意义。
ChatGPT是如何聪明又准确地输出用户期许答案的呢?
GPT(Generative Pre-training Transformer)即通用预训练转换器,ChatGPT通过将不同语料库语言模型的无监督预训练,和对每个特定任务进行区分性有监督微调两者相结合的语言理解任务方法,并在微调期间使用任务感知输入转换,保证有效传输的同时最小化更改模型架构,这是GPT表现优于以往生成式AI的一方面原因。
其训练过程的框架通俗来讲可以看作一个自动连续补全的输入法软件,GPT以现有的字为基础,来预测下一个字的概率,得到新的字之后把它整合到输入中,继续预测下一个字的概率,直到终止符出现。通过不断向它成对地输入输出,数量达到十万级甚至百万级来规训它形成一个目标概率,所形成的概率机制就是GPT智能输出用户期许答案,通过不断对新输出结果继续打分来继续训练它。
通过对GPT技术的演绎,我们整理出了GPT技术的一个大概过程,为了跟数字孪生更接近,我们把语言的本质也整理到过程中:
那么数字孪生是什么呢?
通过对比,我们发现一个惊人的事实,GPT和数字孪生在一定程度上是同构的。
对于可以同态替换的东西,在程序员眼中相当于同样的事物,如何在数字孪生领域高效应用GPT,答案已经显而易见。通过把孪生世界的规则抽象成一套语言,跟现有的语言融合,让孪生世界更加智能,更加简便。那些存在繁重劳动力的过程,诸如建模、美术、数据、算法、设计,通过用一套完整的语言进行同构,定义他们的驱动方式,连缀方式,以及进行概率模型的驱动,人们只需要去评价它们,它就能对世界进行拟合,然后产生反作用。
ChatGPT+CIM&BIM
AIGC(AI Generated Content)即人工智能自动生成内容已经不是新概念,ChatGPT只是AIGC中智能写作的成功案例之一,AI作图、底层建模等生产式AIGC发展方向在市场早已持续商业化落地。CIM&BIM是打造数字孪生底座的关键技术,以ChatGPT为代表的生成式AI有希望使城市底座模型搭建工作事半功倍。我们认为,通过对应的训练,GPT可以根据文字描述快速、准确生成目标3D模型,还可以将倾斜测绘、卫星地图等低精度二三维场景进行分辨率优化,从而进一步提升数字孪生物理模型生成效率、降低建设成本。
ChatGPT+场景美术
视觉真实是数字孪生的基础特征,打造一款以假乱真、虚实融合的孪生应用,优秀的场景美术设计方案不可或缺。MxDATA数字孪生应用平台内置有大量植物、人物、车、图表、图标等辅助美术素材,但通过借助ChatGPT美术创作的潜在能力,数字孪生美术设计库将进一步充实。借助其内容自动生成、内容质量优化、个性化内容学习等美工能力,根据不同行业特征生成对应的特色设计风格,在增加内容多样性的同时降低了制作成本和制作时间。
ChatGPT+数据算法
作为数字原生人工智能,ChatGPT不仅仅是拥有强大文本数据处理能力的聊天机器人,还可以处理、分析、生成各种类型的数据,可根据给定数据集快速分析对应规律,也可以生成指定程序算法,ChatGPT优秀的数据处理和分析能力正是数字孪生技术的核心能力之一。
数字孪生应用搭建过程涉及多源异构数据接入、处理、分析问题,需要实时获取跨行业系统数据,并集成到统一数字孪生系统中进行数据处理分析。相比人类有限的编程学习储备能力,ChatGPT在数据处理和算法开发方面拥有无限潜能,基于其生成式AI的身份本质,可以辅助代码开发,包括代码补全、自然语言指令生成代码、代码翻译、bug修复等,以及对于当前数据处理模块技术进行算法优化升级,提升数据综合治理能力。
路遥知马力,数字孪生是伟大的征途,只有从底层进行思考、设计,才能对行业进行正向推动。我们可以思考GPT的语言能力能够在行业中替换多少个轮子、提高多少效率,也可以去思考GPT的出现意味着什么,古典的经验主义正在加速回归,因果律看似又要隐匿在时代的洪流中。但无论如何,数字孪生是人定义的世界,是服务人的工具,是人看待世界的方式,通过合理应用,ChatGPT也应当成为服务数字孪生行业以及全人类的有力工具。
从以VR/AR行业为入局切口,到率先推动数字孪生技术创新及智慧城市应用,再到如今加快布局生成式AI产业探索,美象科技始终坚守“以数字科技升级人类体验与效率”的使命,以前沿科技驱动企业自我革新。
为获得领先的AI技术加持,美象科技同百度进行深度合作交流,并且形成文心一言的项目合作,这也标志着美象科技即将成为百度文心一言(英文名:ERNIE Bot)核心生态合作伙伴。后续,我们将通过百度智能云全面体验并接入文心一言的能力,将百度领先的智能对话技术成果应用在公司数字孪生应用领域。此举标志着对话式语言模型技术将在国内数字孪生场景正式着陆。美象科技将依托智慧互联、创新互联,引领数字孪生产业变革与升级。
AI&数字孪生的更多碰撞,敬请期待!
美象科技成立于2015年11月,是国内领先探索智慧城市数字孪生技术创新,并成功商业化的国家级高新技术企业。
公司围绕“MxDATA数字孪生应用平台”;内核由“EVR孪生底座编辑器”、“EDT无代码数据模块”2大自主研发的核心产品驱动;聚焦数字孪生技术研发与应用,拓展泛园区、大交通、水利/水务等多元业务领域;更直观便捷及高效协同地解决项目前期规划、中期建设和后期运营3个阶段中的成本高、不好管、难预料等问题;发挥数据价值,最终通过AI为决策未来提供科学支撑。
公司依托宁波、杭州、深圳三地研发+运营中心,正通过不断加快技术创新和发展步伐,努力成为国内全面领先的数字孪生综合服务商。