文 | 周鑫雨
编辑 | 苏建勋
2023年2月21日,小冰公司推出的类ChatGPT应用“小冰链(X-CoTA)”开启内测。
从应用形式来看,小冰链的界面是类似于ChatGPT的搜索框,其会根据用户的输入做出经过逻辑整合后的回答。但相较于“暴力调用+暴力输出”的大模型,小冰链将调用的过程拆分成多个步骤,对用户输入信息进行分步理解、计算,从而输出回答。
36氪试用后发现,面对命题作文、新闻评述与客观题等类型的输入,小冰链的理解能力不输ChatGPT,同时回答具有时效性。在回答界面中,小冰链能够向用户直观地展示其逻辑思考的问题,并对部分信息来源进行了标注。
小冰链能够展示逻辑思考过程。
但在较为复杂的算数和语境面前,小冰链也存在准确性较低、回答不完整等语言大模型的通病,需要通过变换问法引导以提升效果,如将“2*3/4+1”改为输入“请问如何计算2*3/4+1”,模型就能得出正确答案。
在计算“2*3/4+1”时,小冰链得出了错误答案“3”,而非正确的“2.5”。
据小冰方介绍,小冰链具有以下特点:
首先,小冰链能从此时此刻的世界中实时获取信息,并保存依据,避免了大模型训练数据更新不及时的问题。而分步骤的思维逻辑透明,更容易发现和纠正 AI Being 的错误,可持续提高安全性及垂直领域适配。
其次,小冰链可在降低大模型参数规模的同时将逻辑拆分出来,减小对算力的依赖,降低训练和线上服务成本,从而促进普及落地。
最后,小冰链(X-CoTA)将大模型思维链(CoT)向前推进至行动(A)层面。小冰链能真正在逻辑思维的驱动下,操作数字和物理世界。她还可以更具弹性地调用任意第三方的大模型,或向下兼容第三方服务。
与此同时,模型训练、调试过程中的数据安全和伦理问题在这波浪潮中也引起了关注和讨论。小冰回应,小冰链所保留的提问记录不会用于训练或者其他用途。同时,出于安全性考虑,小冰对趣味性和篇幅加以了取舍,例如:小冰不会为用户生成作业、综述或发言稿。
事实证明,ChatGPT训练过程中狂堆参数的“暴力美学”并不适用于大多公司。一方面,在高性能芯片在国内停止供应的情况下,大模型训练过程中所需的强大算力已成为稀缺资源。
另一方面,大模型调用过程中将产生高昂的服务费——小冰CEO李笛举了一个例子:若用ChatGPT的方法,以小冰框架当前支撑的对话交互量计算,每天成本将高达3亿元,一年成本超过1000亿元。
“OpenAI的模式对大多公司来说没有必要。”小冰CEO李笛对36氪介绍,几乎所有的数字行为都可以拆解为三个步骤:搜索、编程、计算。在将大模型拆分成多个小模型分步运行,就能有效降低训练和运行成本。即便有待提升,小冰链也为不少探索大模型的公司,提供了一个较低算力和成本的样本。
延伸阅读:
36kr制图