为什么AGI的起点会是ChatGPT这样的语言模型?未来AGI的世界会是怎样的?中国的大模型跟美国的大模型相比有哪些不足,又有哪些优势?
近日,百川智能创始人、CEO,中欧创业营四期校友王小川做客中欧北京校区发表主题分享。
他认为,用得好的话,AGI相当于给了你一个“数字员工”,又给了你一个24小时在线的“私人助理”。而通过中美大模型上的对比会发现,在技术理想上中国的大模型较之于OpenAI“慢一步”,但中国公司要发挥本土优势,在落地应用上可以“快三步”。
以下内容根据他在中欧北京校区发表的主题演讲整理而成。
01
AGI为什么从语言模型开始?
我想今天大家除了去拥抱和使用模型,还要对技术背后的哲理多一些了解,理解和机器对话这件事,可能会帮助你理解这场大变革。
大家都会兴奋于机器能画图、做视频,但AGI(通用人工智能)的起点依然是ChatGPT这样的语言模型,为什么?
上世纪著名哲学家维特根斯坦说:“语言的边界,就是世界的边界。”边界的英文是limit,也就是说,语言对你的限制,就是你对世界认知的限制,换句话就是——The word model is the world model。
如果一个部落的人只懂200个单词,你会知道它的文明一定不怎么发达。我们每对世界产生一个新的抽象、理解、观点和发现,都会发明新的语言对它进行表达,文明也是靠语言来传承的。
就像心理语言学的奠基人威廉·冯特说:“语言是知识、思考、沟通、文化的载体”。那么一旦语言被机器解构,就意味着背后的知识、思考、沟通、文化,也可以变成一个计算机数学模型,这就会产生巨大的价值。
那么,大模型是如何处理语言的?
AI模型,其实是一种端到端的大数据学习方式。简单来说,我们把事情的因果,以及预测中间变化的大数据放进去,最后会得到一个“黑盒”,也就是一个AI参数模型,它能从数据中找到规律。
Open AI就用这种方法,把内容都放进去,机器通过“把书读薄”,产生对语言内在联系的理解。比如你写“中国的首都是……”,机器就得说“是北京”。于是,就像牛顿用万有引力定律去预测物理运动一样,今天AI模型可以去理解、预测和生成语言。
那大家都会问,AI会取代什么职业和工作?小朋友到底该怎么读书?都会产生切身的焦虑感。其实从大模型的基本原理来看,它的核心是“读万卷书”。而一些非书本记录的、我们在现实世界里“行万里路”的经验,大模型其实还没有学会。
但AGI获得了语言背后的“智力”,就像互联网时代的芯片提供信息化基础一样,它会在社会各个方面起到“点亮智能”的作用,而不是像过去的AlphoGO、AI图像识别等技术,只能在部分领域发挥作用。
以ChatGPT为代表的工具,也就像当初的搜索引擎一样,成为获取知识和智慧的新工具,而且比搜索引擎要强大很多。
王小川对比信息时代和智能时代
由此,我们真正从信息时代走到了一个智能时代。
02
AGI的世界会变成怎样?
在我看来,这个前所未有的新时代,将超越工业革命、电力革命和信息革命所引起的变革的总和。未来的生活方式、社会关系,都将发生巨大的变化。
首先,各行各业都能用大模型去提高生产力。
很多人会问,大模型到底是什么,怎么理解它?
其实,它就是在给你提供一个“数字员工”。现在很多游戏公司已经开始大量用AI去取代美工,以及在线客服、营销、设计等等领域,机器都能够做辅助甚至比人干得更好。
以前地方上招商引资,一般是用地、用楼来吸引企业入驻。但我现在会建议,不要搞地皮了,不如搞点算力,吸引企业的“模型”入驻。要知道“模型即员工”,以后这种“员工”同样会带来各种社会服务。
第二个领域我称之为“助理”,以后我们会有自己的医生助理、法律助理、老师助理……机器是一个与我们共同工作的伙伴,拥有知识和经验,并提供陪伴和服务。
当然,情感陪伴更偏情绪价值,我把它放到第三个赛道“开放世界”,如果换个大家比较熟的词,其实就是元宇宙。
Transformer的发明人创办的Chractor.AI,就是一款由用户创建虚拟聊天机器人并和它互动对话的应用。今天的技术不止能造出新角色,还可以做剧情、建立虚拟空间。所以用我内心喜欢的另一个词来讲这就是“太虚幻境”——来自《红楼梦》所描述的虚幻世界。
总之,今天的大模型已经直接变成一种生产力。
以前产品经理的一个想法要变成现实,需要一个大团队互相去磨合,比如产品经理出产品说明书,程序员来实现,然后还有测试员来测试,不断迭代。
而在智能时代,一个模型可以把整个链条极度压缩。
王小川对比工业革命和智能时代的社会结构
这种端到端的完成,会使得社会未来更加扁平,大公司就会减小,一个人可能就变成一个公司、一个团队。
所以,大家不必焦虑于失业危机,我有两句“鸡汤”:智能时代会出现很多超级个体,你一个人就是一个公司,每个人拥抱这个技术就会强大很多,自我实现会变得更加容易。
未来的年轻人一定要多去用这些模型。比如求职前赶快把ChatGPT、Midjourney、Pika、Runway等等这套大模型相关的技术应用学好,使你在画图、做PPT、做数据分析等方面比其他人都好,老板一看肯定觉得你就是我要的人。
03
百川智能的理想与落地
百川智能是今年4月10日成立的,我们只用半年的时间就发了6款大模型。9月份开始,连续发布了Baichuan2-7B/13B/53B版本模型,这些版本的水平超越了Llama2,虽然还略逊于Open AI,但已经超过了美国的开源水平。
左右滑动查看
我们的策略是开源和闭源并行。我们发现中国市场缺乏开源的大模型。在美国,除了GPT-3.5和4之外,LLama也是开源的,这对美国整个模型生态产生了巨大的影响。所以我们决定开放Baichuan2-7B和Baichuan2-13B两款模型,大家通过申请就能免费商用,现在已经有很多公司在用。
Baichuan2-7B和Baichuan2-13B在多个榜单上都名列前茅,在各开源社区累计下载量已经超过600万次。8月31日,百川大模型已首批获准向公众开放,在通过审批的8家公司里,我们是唯一一个今年成立的公司。
今年三季度,百川已经开放了API接口,开启了闭源模型的商用化。四季度我们将发布千亿规模的大模型。
百川大模型问答图示
在发布第一版百川大模型之后,我就去美国看了很多AI公司。去之前我讲我们是“理想上慢半步,落地上快半步”,回来之后,我想换一个说法,叫做“理想上慢一步,落地上快三步”。
美国在探索未知的好奇心,和追求技术理想上的愿望确实比我们大很多。比如Open AI甚至会想用1000万颗GPU来做超级计算机,而英伟达一年生产的GPU才100万颗。
但反过来自豪的是,中国做应用的能力要更强。我们的互联网科技公司经过二十年的发展,培养了大量产品经理和运营。在技术上,虽然我们处于跟进状态,大体上到今年年底国内一线公司能做到GPT-3.5的水平,到明年年底之前可以追到GPT-4,但不能妄言赶超。而做出超级应用,做到他们做不到的事,是中国土壤的优势。以我们的经验来看,现在的技术能力里就有超级应用可以产生。
百川对标GPT-3.5的产品已经在路上了,到明年一季度就计划发超级应用。我预计到明年,国内会有很多颠覆性的产品出来。
就百川而言,我们在什么领域里去思考未来的应用方向?
我想,要去贴近人最根本的需求,才能拥有未来的广阔前景。效率工具可以帮我们save time,娱乐工具可以帮我们kill time,但我觉得这就太“物化”工具了。
我认为人在根本上所需要的是三件事:创造、健康和快乐。
首先,创造代表一种永恒的、可以改变世界的力量,而生命是追求永恒的。怎样帮助大家更好地去做创造,使每个人成为更好的自己,是大模型应用的重要方向。
第二,我们都需要健康,我想大模型时代对传统的医学范式和整个医疗体系,都会产生颠覆性的影响。
第三是快乐,就像刚才讲的开放世界、太虚幻境,这是快乐的一部分。
王小川引用罗曼·罗兰的话,说明他对人的根本需求的认识。
百川的使命是帮助大众轻松、普惠地获取世界知识和专业服务。围绕创造、健康和快乐这几个方面来开展技术服务,是我对未来趋势的判断,也是构建百川技术路径的基础。
本文根据智荟中欧·科技沙龙上的分享整理而成。
来源| 中欧北京
整理| 边晓璇
你对AGI有怎样的了解?欢迎留言分享,内容最走心的3名读者将获得中欧知识笔记《未来的答案》一本~
关注中欧官方视频号,获取更多教授洞见
推荐阅读
_ | 如何从籍籍无名做到百亿私募? |
_ | 奥美工作20年,一个广告人的自白 |
_ | 医药行业的数字化转型,为什么这么难? |
点击咨询中欧课程
DeepTech深科技 2024-12-18
IT之家 2024-12-18
雷科技 2024-12-18
IT之家 2024-12-18
雷科技 2024-12-18
三言科技 2024-12-18
武器科技 2024-12-18