过去一年,生成式AI席卷全球,现在你已经很难找到还有哪家互联网公司没有推出类似产品。
在持续的行业内卷下,AI逐渐走出拼算力、拼模型大小的初级阶段,进入谁的应用能力更强,谁能俘获更多用户的市场争夺期。
一个例子是,近日OpenAI悄然更改了其“价值观”,将之前未明确列出的通用人工智能(AGI)纳入其中,并列在首位,显示出其对AI通用性的强烈追求。
百度也在尝试做类似的事,将AI融入更多的应用场景,用李彦宏的话来说就是,“把AI融入所有现有产品”。
今年8月29日,文心一言全面开放,一个半月过去,它已经收获了4500万用户、5.4万开发者,在4300场景中被使用,同时还拥有825个 应用和500个插件。
10月17日,百度更进一步,正式发布文心大模型4.0,它在理解、生成、逻辑、记忆四大能力上较前代都有一定提升。李彦宏称,“综合水平与 GPT-4 相比毫不逊色”。
文心4.0四大核心能力
理解能力,简单来说就是AI如何理解你传达给它的语言和文字,过去AI之所以被调侃“人工智障”,核心问题其实就出在“听懂话”和“办对事”上,理解能力解决的就是前者,而且它也是“办对事”的基础。
许多用户在搜索或与AI交互时,往往很难精确描述需求,因此这就对AI的理解能力做了更高的要求。
文心大模型4.0的升级之处在于,即使用户的表达相对模糊,它依然能精准识别用户的核心需求,从而给出更准确的答案。
而在生成方面,它是AI最具价值的能力——生成意味着一定的创造。只需一段简短的文字,文心大模型4.0就可以生成文案、海报、视频等一系列内容,堪称“一人成军”。
而逻辑能力在教学等方面拥有相当实用的经验,例如家长辅导孩子的功课,文心大模型4.0与其他解题应用的不同之处在于,它可以提供更详细的解题过程,并且指出其中包含的知识点,让学生学会举一反三。
记忆能力简单来说就是当你接连说几段话时,AI能记住前后文,而不至于被过于密集的指令导致AI出现“对不起,我不太理解”的“宕机”状态。
文心大模型4.0提升了前后文的识别能力,逻辑更加清晰精准,并且即使在长段对话中,它的抗干扰性也更强,能自动忽略并不重要的话语,提炼核心需求。
文心大模型4.0即使已经生成了超过千字的内容,它依然可以记住自己曾经说过的话,而不会出现内容过于重复的问题,并在此基础上进行更高级的内容生成。比如,李彦宏在现场演示了一段通过文心大模型4.0生成武侠小说的功能,它能在第四轮生成的内容中,结合最先生成的部分,营造出过去只有专业写作者才能做到的“前后呼应”。
当然,这四大能力并非互相独立,而是相互影响,相互促进,最终它们才构成了能力更强的文心大模型4.0。李彦宏说,这四大能力也是AI原生应用赖以生存的基础。
构建AI原生应用,也是文心大模型4.0最重要的使命之一。
AI原生应用的不同之处
所谓AI原生应用,就是基于大模型的理解、生成、逻辑和记忆能力开发出来的应用。如果更简单点理解的话,就是从底层具备AI能力的应用。
而目前行业的通用做法是,在应用中嵌入AI功能,比如微软在Edge浏览器中加入的以ChatGPT3.5为底层的“必应聊天”,比如阿里巴巴在淘宝中加入的智能搜图功能等。
构建AI原生应用意味着要对应用做更彻底的重铸,当然,它前提是AI能够真正赋能应用,解决过去解决不了的问题,或者提高解决问题的效率。
例如百度新搜索将具备极致满足、推荐激发和多轮交互三个特点,当用户搜索问题时,新搜索将“不再是给你一堆链接”,而是通过对内容的理解,生成文字、图片、动态图表的多模态答案,让用户一步获取答案。在针对复杂需求时,“多轮交互”特点也可以通过提示、调整等方式,满足用户更个性化的搜索需求。
同时,李彦宏还展示了用AI原生思维打造的国内第一个生成式商业智能产品:百度GBI。
据介绍,相对传统BI软件的高门槛和数据分析难等问题,百度GBI可以通过自然语言交互,执行数据查询与分析任务,还支持专业知识注入,满足更复杂、专业的分析需求。
如今AI+应用的浪潮大有曾经企业数字化、云服务大行其道的趋势,而它们在商业路径上确有其相似之处,都是从底层改变应用生态。
当然,这一切离不开开发者的支持,或者说,决定一个AI大模型是否成功的关键指标之一,就是看它能否拥有足够多的开发者,像滚雪球一般反刍大模型,就像iOS、Android等系统平台那样。
AI大模型抢夺开发者
一年前AI还大多停留在聊天、画图阶段,而到如今,几乎所有互联网巨头都开始尝试将AI融入应用。除了百度,阿里巴巴、腾讯、字节跳动均在旗下产品中推出了类似的服务。
而对更多难以自主开发大模型的中小开发者/企业而言,通过插件、API接入AI成了最优解。
今年9月,文心一言插件生态平台灵境矩阵发布,包括太平洋科技等近百家企业成为灵境矩阵的首批合作伙伴,积极探索AI应用场景。
李彦宏表示,API是AI原生应用调用基础大模型的主要方式,企业和开发者可以在百度的千帆大模型平台上调取包括文心一言在内的大模型API。
目前,千帆大模型平台已经成为中国最大的大模型开发平台,有42个主流大模型入驻,覆盖各行各业近500个场景。而从即日起,企业客户也可以在千帆大模型平台上申请测试文心4.0的API。
对中小开发者而言,AI大模型的能力将直接影响它们的选择。就像互联网平台“赢者通吃”一样,鞭笞着AI大模型必须不断优化迭代,并且在行业占据领先地位。
而就目前来说,文心大模型的竞争对手也都是极其强劲的互联网巨头,国内的阿里巴巴、腾讯、字节跳动显然不会放弃这块肥肉。
另一方面,今年7月Meta推出开源且免费的大型语言模型LLama 2后,基于该模型微调的大模型不断涌现,开源AI大模型正在以更强的势头赶超闭源大模型。今年下半年以来,阿里云推出了Qwen-7B、Qwen-14B,百川智能推出了Baichuan2-7B、Baichuan2-13B等开源大模型,用更高效且更低的成本吸引开发者。
前不久百川智能创始人王小川透露,截至9月初,旗下两款开源大模型下载量超过500万。
此外,10月17日百川智能宣布已完成A1轮战略融资,融资金额3亿美元,阿里、腾讯、小米等科技巨头及多家顶级投资机构均参投了本轮融资。加上天使轮的5000万美元,百川智能的融资金额已达3.5亿美元。
显然,AI+应用的竞争才刚刚开始,鹿死谁手还未可知。