近年来,人工智能领域的发展日新月异,尤其是在自然语言处理方面,各种大模型层出不穷,给人类带来了前所未有的便利和惊喜。其中,最引人注目的就是OpenAI的ChatGPT系列,它是基于GPT-3大模型的聊天机器人,能够与人类进行流畅、自然、有趣的对话,甚至能够编程、写诗、创作等。
然而,ChatGPT并不是唯一的选择,国内也有不少优秀的团队在努力开发自己的大模型。最近,昆仑万维就发布了国产版ChatGPT——“天工”,并宣称其已经非常接近ChatGPT的智能水平。更令人惊讶的是,“天工”竟然能够通过自家公司的程序员面试,展现出了强大的编程能力和逻辑思维。
那么,“天工”究竟是如何做到这一点的呢?它又有哪些其他的特色和优势呢?让我们一起来了解一下吧。
“天工”是昆仑万维在2020年起开始研发的千亿级大语言模型,其目标是实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。为了达到这个目标,“天工”团队投入了巨大的资源和精力,从数据、算法、算力等方面进行了全方位的优化和创新。
首先,在数据方面,“天工”团队凝聚了百位开源社区AI科学家,从数十万亿的数据中清洗、筛选出了近3万亿单词的数据用于训练大模型。这些数据不仅覆盖了多种语言和领域,而且质量高效率高。相比之下,ChatGPT在训练过程中使用的单词数据量也仅3千亿。“天工”拥有如此庞大和优质的数据集,使得它在理解和生成自然语言方面具有很强的能力,尤其是对中文语言更加敏感和流畅。
其次,在算法方面,“天工”团队采用了两个千亿级参数的深度学习模型:一个是预训练基座模型,一个是RLHF模型。预训练基座模型是指至少有一个千亿参数的深度学习模型,可以游刃有余地应对语言生成、文本分类、机器翻译等自然语言处理任务。RLHF模型是指基于“Reinforcement Learning with Human Feedback(RLHF)”强化学习方法的一种模型。RLHF模型可以视为一种特殊的交互式机器学习框架,可以通过人类的反馈来优化模型的性能,由此可以更好地处理不确定性和稀疏性问题。这两个模型的结合使得“天工”在表征能力、泛化能力和交互能力方面都有了显著的提升。
此外,“天工”团队还在算法层面引入了一种创新的方法,即蒙特卡洛搜索树算法。这是一种用于某些决策过程的启发式搜索算法,最引人注目的是在游戏中的使用,例如名震一时的AlphaGo背后就是结合了这一算法。蒙特卡洛搜索树算法的核心思想是通过不断地模拟每一种走法,直至终局,从而估算每一种走法的胜率,并选择最优的走法。这种算法不仅准确、有效、易于实现,而且不需要一个明确的估值函数,只需要实现游戏机制就足够了。“天工”引入蒙特卡洛搜索树算法主要应用在了对话管理这个任务中,使得它能够更好地理解在对话中何时转换话题,并且能够询问更多信息,从而实现更长、更深、更自然的对话。
“天工”作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。为了展示“天工”的表现,“天工”团队在2023年4月17日启动了邀请测试,并在直播中进行了现场实时演示。
在直播中,“天工”展示了它在编程、写诗、创作等方面的能力,并且与主持人和网友进行了有趣的对话。其中最令人惊讶的是,“天工”竟然能够通过自家公司的程序员面试,回答出了一些复杂的算法题,并且给出了详细的解释和代码。这说明“天工”不仅掌握了编程语言的语法和逻辑,而且还具有一定的创造力和推理能力。
除了编程之外,“天工”还展示了它在写诗方面的才华。当主持人要求“天工”写一首五言绝句时,“天工”迅速给出了如下的作品:
春风吹柳絮, 柳絮飞花间。 花间有佳人, 佳人笑春光。
这首诗不仅符合五言绝句的格式和韵律,而且还富有意境和情感,体现出“天工”的文学素养和审美观。
在创作方面,“天工”也有着不俗的表现。当主持人要求“天工”写一个二次元mmorpg游戏广告文案时,“天工”给出了如下的结果:
你对昆仑“天工”有什么看法呢?欢迎在评论区留言分享你的想法。