周鸿祎离婚上了热搜,比几天前展示360版ChatGPT(还没命名,先用“360AI”)影响力还大。360AI不仅没放PPT,现场演示互动,还允许现场提问,而且确实出现了“错误”答案,让360AI回答梅西为阿根廷国家队进了多少个球时,360AI给出的答案是100个,实际应该是102个。
周鸿祎说他对这个答案不满意,其实,这应该是可以理解的。360AI目前内容少且互动少,信息更新不及时。由于是会话界面,对答案的要求比搜索引擎更高,类似的问题在搜索引擎“不是事”,但在chat窗口就是“错误”,类似问题在百度、360、搜狗、中国搜索都很多。只有经过大量语料的培训,才能大幅减少类似的错误。
但是,大量语料的培训,需要两个方面的支持,一是大模型背后的大算力需求,二是大量的信息标引人员的信息加工。而这两点,无论是百度的文心一言,还是360的360AI,或者阿里巴巴、华为的号称最牛中文大模型,都需要补课的,与算力相比,大量高效率的信息加工积累,差距更大。
因此,我一直认为,中文的通用AIGC,没必要克隆一个中文版的ChatGPT,又要画图,又要生成视频,就应该瞄准少数问题,例如替代搜索框,先把类似这样的问题解决好,然后再孵化其他能力。
另一个可以快速见效的方向是行业型ChatGPT。细分到具体的行业,能更准确地捕捉用户的需求,减弱了对算力的要求,同时由于语料少,可引入专业人士做信息加工,这样可在有限的范围内,快速得到、及时维护高质量的信息库。
还有一类更简单,将实时动态更新加入到信息产品中。我国早就有类似的产品,例如,360安全大脑的骚扰号码标记信息加工,搜狗拼音输入法的词库优化,今日头条、抖音的智能信息推送,都利用快速迭代的人工智能提升了效率或质量。