技术更先进了,数据库大了好几个数量级,大模型可以更方便获取信息吗?
文心一言是百度系列产品中除了生活服务之外的所有信息产品的综合和升级版,从它发布的那一天开始,公司里大模型和搜索等产品的内部之战也就开始了。
首先猛一看啊,文心一言挺像百度的。
大模型出来的第一个产品取名叫ChatGPT,意思是聊天形式的AI机器人,通过与AI问答对话获取信息和问题答案。
我们先看OpenAI公司的ChatGPT是怎么开始用的:(图1)
在它的对话框上方有4条随机出现的提示,每次刷新内容有变化。点击后会进入这个提示信息和机器人对话的结果。
在谷歌的大模型产品Bard,提示信息更为简洁,变为随机出现两条,引导用户理解和使用。(图2)
微软必应的聊天机器人也类似,三条提示。(图3)
在文心一言(手机版)这里,在对话框主界面之外,增加了两个功能页面:社区和发现。
“社区”是带着用户名称和一点点社交属性的UGC内容页面,展示用户用文心一言制作的内容、比如一张图或者是看图说话等。刚发布的文心一言,产品的用户画像还很初级和粗浅,内容的显示、规划逻辑就不那么强烈。
“社区”里主打的是看内容,用户边看内容的同时也许还会模仿着做。这个产品非常类似百度搜索之后的一个战略产品“贴吧”,也是UGC内容的社区。同时也像移动互联网时代的战略产品“百度百家”,吸引更多用户和专业机构来自己平台生产内容,以增加信息量和留住用户。
文心一言应该也期待把贴吧里强烈活跃的用户属性、百度百家的内容生产力搬到自己院子里来。
“发现”则是一个非常丰富和详细的帮助工具,和上述ChatGPT、Bard和New Bing三个大模型打开页面里的提示语性质类似,但是“发现”的功能页中有17个分类子目录,让用户则可以在其中找到自己关注的话题(比如“马斯克”)或者想轻AI帮助自己做的某项工作(比如写一份“论文大纲”),进入这些需求的对话页面,就能看到模板案例给出的具体答案了。
在文心一言的网页版上,对话框页面之外主要是功能帮助页“一言百宝箱”,并没有主打浏览的“社区”。原因应该是PC用户以工作为主,手机用户消遣更多、兼顾娱乐和工作。
无论是“社区”还是“发现”,运营方进行内容强推荐、带有多层目录索引,这些都非常中国特色、非常百度。
原因是,搜索产品比浏览产品的门槛高。
为了最多的用户,需要把产品的门槛做到最低。百度至今把2004年用5000万元的价格收购的Hao123导航页放在自己产品目录的重要位置,同时也会花不少成本把这个页面锁定到用户各种终端的各种浏览器的打开页面上,以方便用户找到和点击自己。
左划、下划、上划页面比点击链接更简单,点击链接比输入文字更简单、输入字词比输入句子更简单,软件使用习惯划定了用户人群的基数和主要特征。
在一个早期对搜索引擎用户的习惯统计中,发现输入一个词的用户占90%以上,输入两个关键词或者句子的剧减到10%以内。百度用户的这个特点应该是公司早期的第一大认知,于是,百度贴吧、新闻、文库、百家、经验等一批重量级的分类内容产品,出现在百度的各个产品的各种层级的页面里。
与此同时,也养就了更懒惰和挑剔的用户。以主动搜索、查询和挑选内容的搜索引擎产品,变成了更方便更不用动脑的浏览式内容产品。用户对内容的依赖度,反过来平台对用户的影响力,也越来越重了。
和搜索引擎不同,文心一言是聊天机器人,比搜索引擎需要更多的输入,使用难度未必增加了多少,但使用习惯显然是不一样了。大模型的使用门槛高于搜索引擎,搜索引擎高于浏览型内容,浏览型内容高于平台主动推送的投喂式产品。
为什么后来百度受到很多批评?有一个原因是百度有意建设了一批中国人日常所需的信息库,度娘才是很多人最大的老师。巨大的信息库肯定存在内容的偏颇甚至错误问题,随着用户量增大也受到越来越多的关注,批评也随之增加。
无论如何,百度在建设中国人的知识体系的进程中是留了深深烙印的,爱也好恨也好,总之是分不开了。
建设内容的基因被文心一言给继承了,文心一言的产品也有向下兼容的特点,未来某一天它推出刷不完的短视频也不是不可能的事。
表面上看,文心一言需要继承百度老用户,开发新用户,延长用户的使用时间。实际上还是产品定位问题,如何让一个内核功能偏向专业、职业用户的产品,获得大众用户的接受和喜爱?既然大模型无所不能,肯定也是可以ToC的。
所以,在用户还没学会或者没习惯提问的时候,文心一言已经把内容送到你眼前了。
今年7月,美国迈阿密大学的徐瑞云和另外两名香港的大学生发表了一篇研究论文,《ChatGPT与谷歌:搜索性能和 用 户 体验 的比较研究》。研究对象分成两组,分别使用谷歌搜索和ChatGPT的完成任务,三个任务对信息的检索由易到难:1、查询一个女宇航员的名字和年龄;2、找两个城市航班的订票链接;3、确认对一个会议报道内容中三条描述的真伪。
研究结果:
lChatGPT组在所有任务上花费的时间都更少,两组的总体任务表现没有显著差异。
lChatGPT对不同教育水平的用户搜索表现进行了分级,擅长回答简单的问题和提供通用解决方案,但在事实核查、纠正错误等方面做得不够。
l与谷歌搜索相比,用户认为ChatGPT的 回复具有更高的信息质量。同时在有用性、乐趣和满意度方面,用户体验明显更好。
lChatGPT可能导致用户过度依赖,并产生或复制错误信息。
l对谷歌搜索的使用表现,与教育程度正相关。教育水平高意味着抽象思维能力更优秀,对搜索结果的鉴别和再次总结、输入关键词的能力更高。
报告显示,大模型首先是一个更智能化的搜索引擎:
1.它能理解人的自然语言,用句子和用户多重问答;
2.还能把上下文串起来理解;
3.更重要的是,可以用一个描述性的语言把搜索的结果展现说出来。
PS:这项实验需要给一个补充说明,它的三个测试题,都是对一个真实项目相关信息的查找和确认,问题的难易程度基于项目的复杂度,并不需要深入研究和思考。和专业学习、研究以及论文写作有根本区别。
因为大模型带来了上述新变化,微软的必应搜索在产品上很快给出了反馈:(右图)
1.搜索结果给出了最接近问题的内容链接,同时给出了内容描述(A区)
2.在右侧上方,给用户提供了继续讨论这个问题的对话框(B区)
3.筛选出用户这个事件相类的提问(C区)
4.提供传统搜索引擎给出的内容链接列表。
上述现象,给出了现阶段查找信息的典型场景:
1.利用大模型提出自己的问题;
2.得到大模型给出的信息;
3.收到大模型对信息的初步分析框架;
4.得到大模型对新的综述文本;
5.对大模型给出的信息和框架进行分析(这一步需用户自行思考、判断)
6.利用搜索引擎再查找源头信息进行核实、补充和确认。(这一步必须在搜索引擎下完成,以避免大模型再次胡说八道)
7.最后还可以要求大模型给一个用户需要的完整文档的范本(通常比用户自己写的更好)。
必应的搜索引擎带来的新结果页面,必然成为行业关注的重点,它体现了新老技术的融合,结合了大模型的综述能力和搜索引擎的事实能力。
百度对搜索框里问答式提问,也提供了一个描述性的答案放在第一位(右图)。谷歌搜索也有类似的处理。应该说大模型和搜索引擎的产品深度融合是看得见的趋势了。
新老技术和产品的融合,从逻辑上来讲毫无问题,但是在一个公司,新老产品线牵涉到不同的员工人事及后台的计算、存储资源;更关键的,是大模型和搜索引擎的融合,不能根本上影响搜索广告产品和收入。
前者,Meta(Facebook)公司因为抢夺计算资源和人事处理不当,造成公司收购的法国AI团队流失大半;而后者,大模型对搜索广告的影响,对谷歌、对百度来说都还是悬在头上的达摩克里斯之剑。如果革命不可避免,那还是自己来,找到更多的主动权。
本文来自微信公众号“南冥一鲨”(ID:southsharker),作者:南冥一鲨,36氪经授权发布。