👆关注元境科技,了解更多精彩内容
最近AI圈子不可不谓热闹,被称为大模型“奠基研究”的 《Attention is All You Need》论文的八位作者已全部从Google离职,投身AI创业,并且都收获了资本市场认可,获得巨额投资。当下最火热的OpenAI的GPT模型、谷歌的Bard模型也都不约而同地借鉴了《Attention is All You Need》论文中的Transformer架构进行设计,这就让人不禁好奇:这个改变了AI发展进程,使AI真正变得“智能”的Transformer究竟是何方神圣呢?
(图 Attention Is All You Need)
解密Transformer:探索大语言模型核心
从过去拘泥于规则的程序,到如今能够自我学习、自我进化的智能体,现如今的AI是如何做到飞速进步?早期的循环神经网(Recurrent Neural Network,RNN)到长短时记忆(Long Short Term Memory,LSTM),从卷积神经网络(Convolutional Neural Network, CNN)到Transformer模型,这些拗口难念的英文单词,背后却是人工智能领域的一波又一波革命。
(图 搭载LLM大模型的元享智能云平台)
但在ChatGPT横空出世前,自然语言处理领域的AI大语言模型应用似乎都离我们还很遥远。以往的对话型AI,就像是个充满预设台词的机器人,不管你说什么,它都是那一套机械式的“if x; then a; else if y; then b…… ”,只会选择内容,而不会创造内容。但是,随着Transformer模型的崭露头角,大语言模型似乎找到了新的方向。
那么Transformer是依靠什么机制或者说是原理,让原本不能理解人类语言的AI,变的能够理解并生成相应内容的呢?其核心在于《Attention is All You Need》论文中提到的自注意力机制,这种机制让模型能够在处理文本时更好地捕捉上下文信息,建立词与词之间的联系,仿佛模拟了人类对话的连贯性。Transformer模型通过对输入文本的自我关注,能够在不同位置之间建立关联,从而更好地理解整个文本的语义结构,也让充满创造力的生成式AI(AIGC)成为可能。
(图 搭载AIGC虚拟数字人的元享数字魔盒)
释放模型创造力的多头自注意力机制
Transformer利用注意力机制来模拟人类对上下文的理解。这种机制允许模型在处理文本时,根据不同位置的词汇建立自适应的注意力。换句话说,模型能够理解每个词汇与其他词汇之间的关系,并且不受“距离”的限制。看似复杂的机制,其实原理很简单,就是通过计算每个词汇之间的相似度,来构建注意力权重。并且多头机制的引入增加了模型的并行性,从而更高效地捕捉词汇之间的关联。
不过只有关联性是不够的,为了克服Transformer模型无法捕捉词汇顺序信息的问题,OpenAI在GPT模型中还引入了“位置编码”技术,你可以把“位置编码”理解为一本“地图”,它告诉每个词汇在句子中的位置。这样一来,大语言模型模型不仅能理解词汇的语义,还能感知它们在句子中的脉络。就如同我们在阅读时,会根据文字的位置来推断它们的重要性和关系。
(图 Multi-Headed Attention)
(图 Transformer模型)种种精妙的机制相互结合,造就了如今基于Transformer的各种大语言模型,也让运行大语言模型的AI不再只能够机械式回答,而是成为一个能够深刻理解文本、生成独特回应的智能体。通过自注意力、多头机制和位置编码的共同作用,模型在处理文本时,宛如一位诗人,能够用恰到好处的言辞,构建出精彩纷呈的句子,令人叹为观止。也让人们看到这项技术运用在虚拟数字人身上会产生怎样的技术革命。
(图 GPT-3 到 ChatGPT的心路历程)
大语言模型能够为虚拟数字人赋予“灵魂”吗?
大语言模型造就的生成式AI,让人与机器进行文字对话成为可能,但如何能够突破恐怖谷,让机器人与人的交流像人与人交流一样自然流畅,则又是一个新的难题。
元境科技自研「MetaSurfing-元享智能云平台」,搭载行业领先的虚拟数字人交互系统、大语言模型、多模态感知等技术,为虚拟数字人赋予了视觉、听觉和语言能力,使虚拟数字人能够像人类一样交流、理解和思考。并通过「元享数字魔盒」以3D立体形式呈现出有灵魂、有记忆、多情感、多感知、超写实的全拟真人类个体,让虚拟数字人可以像真人一样进行“面对面”交互,拥有自己的“身体”、“言辞”和“思想”,如人类一般通过语言表达内心的情感和思考。
(图 大语言模型能够为虚拟数字人赋予“灵魂”吗?)
AI元年正如《Attention is All You Need》论文的作者所展示的,科技的进步不断推动着人工智能领域的前沿探索。当下我们正在身处AI时代的浪潮之中,目睹着大语言模型与虚拟数字人这两个领域的碰撞与融合,未来我们或许能够在虚拟世界中与虚拟数字人进行深刻的哲学对话,探讨2023年的这场AI革命,对后世引发的深远影响。