作者:刘文轩
Meta在这两周可谓风生水起。上周,就在Twitter被马斯克搞得鸡飞狗跳时,Meta突然宣布上线Threads,并以惊人的速度获取上亿用户。在本周,眼看Threads逐渐“退烧”,Meta又与微软在AI领域强强联合,发布最新的大语言模型Llama 2,并且把它开源放到微软Azure,让更多企业与研究人员免费使用。
在微软Inspire 2023活动当天,Meta宣布Llama 2的重大规划,并称微软是Meta在Llama 2和未来拓展生成式AI成果的首选合作伙伴,微软CEO纳德拉也在大会上同步公开了这一消息。
Llama 2是Meta今年2月发布的LLaMA 1的迭代,后者提供各种规模的版本,包括70亿、130亿、330亿、650亿个参数等版本,通过大量未标注的数据训练,用户可以结合不同的需求进行微调。当时,这个初代版本只提供人工智能研究人员使用。
即便是这样,LLaMA 1在当时已经深受研究人员的欢迎,Meta共收到10万个针对LLaMA 1的存取请求。如今的Llama 2更将用途扩展到商业使用,并且免费提供,开源内容包括预训练模型和经过调校模型的权重与起始训练代码,Llama 2模型有70亿、130亿和700亿个参数三个版本。
Llama 2用于训练的数据比LLaMA 1多出40%,Llama 2预训练模型总共使用2兆token,上下文长度(Context Length)也是LLaMA 1的两倍,这意味着模型能够读取和生成更长的文字内容,能够让模型更好地理解复杂的对白。
值得注意的是,经调校模型Llama 2-Chat,运用人类回馈增强学习(Reinforcement Learning from Human Feedback,RLHF)的方式,让AI模型在人类的指导下学习,结合了人类的智慧与机器的高效学习能力,已经具备与ChatGPT相当的可用程度。
经过这样一番折腾,结果居然只是与“ChatGPT相当”?其实Llama 2-Chat还有一大优势——它使用了Llama 2的授权方式,也就是说,你可以免费将它用于学术和商业目的。
目前我们在商用大模型上的选择十分有限,有的甚至使用OpenAI API产生的指令数据集训练而成,但OpenAI明令禁止用户将其用于其他语言模型的开发。Meta的这一系列举动,最直接的好处便是让企业开发人工智能应用的成本大幅降低,想必也会给OpenAI的商业模式带来影响。
开源只为更快的追赶
扎克伯格在自己的Facebook帐号上表示,如果生态体系可以更加开放,我们就能解锁更多进展。这么看,Meta似乎就是“救世主”一样的存在了,但考虑到这家公司以往的行事风格,难免还是会产生怀疑,Meta开源Llama 2真算得上善举吗?
这就要结合当前的环境来看了,目前较为知名的商用AI模型主要来自OpenAI、Google等科技企业,它们设置了严格的访问限制,尽管官方总是以“数据安全”为由为自己开脱,但这种做法依然被批评为反竞争,同时也给外界深入了解人工智能设置了障碍。与之相对的,Meta全球事务总裁Nick Clegg在接受《金融时报》采访时曾表示,开放是解除人工智能恐惧的良药。
Clegg说得没错,实际上,开源在很多时候都是一种双赢的模式,用户和不同规模的公司都可以自由使用、修改代码;对于Meta来说,更多人一起参与,也能快速找出潜在隐患,提升发展速度,最重要的是,能够加快Meta追赶竞争对手的步伐。
相比OpenAI和Google,Meta已经算是起步比较晚的了,想要超越它们,开源也许是一条捷径。
尽管号称开源,Meta却还是给自己留了条后路。有用户发现,Llama 2也存在一些限制:在使用规范上,Meta要求用户不能用Llama 2的代码去训练其他大预言模型,月活跃用户超过7亿的还需要得到“特别授权”。此外,Meta并没有公开Llama模型本身的训练方法,只是公开了范例模型的代码,并非完全透明。
不过这些限制对于普通开发者和小型企业来说,通常不会构成多大影响,所以Meta更多的目的应该还是为了防止Google、AWS这样的巨头获取太多信息。Hugging Face的研究科学家Nathan Lambert在接受Fortune采访时也强调,尽管Llama 2并非完全开源,但以目前的环境来看,这已经算是更加开放的大模型了。
市场格局将被谁改变
OpenAI在上半年风头无两,而更加开放的Llama 2能否成为它的强劲对手呢?在讨论这个问题之前,我们不得不留意一个尴尬的事实:微软曾向OpenAI投资数十亿美元,如今又与Meta合作推出Llama 2,这行为无异于挖坑给自己跳。
其实换个角度看,这也说明了微软并不想把鸡蛋放进同一个篮子里,一边与OpenAI合作研发闭源产品,一边和Meta联手发力开源,可谓左右逢源了。但是两者的产品依然属于同一领域,并且可以看到各自的长处和短板,《金融时报》也在一篇文章中指出,Meta的目标就是削弱OpenAI的领先优势。
不过在Meta真正让OpenAI的主导地位遭受打击之前,另一家科技巨头似乎也坐不住了,它就是苹果。Mark Gurman表示,苹果已经在内部启动一个能“与ChatGPT媲美”的人工智能项目,虽然目前还没有更具体的信息透露出来,但也能看出它已经蠢蠢欲动。如今各大科技巨头几乎都参与到这场竞争,Meta的免费商用模式显然具有很强的吸引力,接下来OpenAI的地位会不会被动摇?谁又能够率先超越OpenAI?我们就拭目以待吧。