在不久前的8月23日,昆仑万维发布了国内第一款融入大语言模型的搜索引擎——天工AI搜索。这也是继今年4月17日发布“天工”大模型以来,昆仑万维在该领域的又一重要探索。
在近期由创业邦主办的2023AIGC技术应用大会期间,昆仑万维CEO方汉围绕公司在AI大模型商业化的探索以及AI搜索的更多细节进行了深入分享,精彩观点如下:
1.如果要把AI搜索作为一个可信的生产力工具,我们只要切中用户需求、给用户提供价值,用户就一定会使用;
2.未来各家大模型在B端的竞争在于,哪家能够率先在付费能力强的行业中抢到更多的落地合同;
3.最终AI一定会重塑全新的商业模式,一定会出现巨大的红利,并且凭借这个商业模式获得极大成功的企业会长期存在。
作为一家出海互联网企业,昆仑万维不断地在寻找第二曲线。
“从Grindr到StarMaker,从Opera到GX Browser,尽管昆仑万维已经在海外孵化了大量的千万DAU级别的产品,但仍然希望借助AIGC这一波浪潮,能够做出一款以亿为单位的DAU产品。”方汉说道。
因此,昆仑万维从2022年就提出了“All in AIGC”的战略规划。相比此前的VR和元宇宙,公司当时判断AIGC作为第二曲线是一个更加靠谱的方向。
01
融合8年技术积累
定位于生产力工具
方汉表示,对于拿搜索引擎当生产工具的人,就是我们的目标用户。
首先,天工AI搜索能够帮助用户降低搜索成本,无需用户再记住搜索引擎大量的规则就能更好地获取到最真实的数据。
其次,在交互上,用户能够直接使用自然语言交互,天工AI搜索就能给出用户正确的答案,而且所有的答案是有信源的。
那么,为什么昆仑万维敢做AI搜索?
实际上,昆仑万维旗下拥有一款千万级DAU、面向全球十余种语言市场的新闻推荐产品——Opera News,已经成为了非洲用户规模最大的新闻客户端。
而要做新闻推荐,第一步就是要做搜索引擎,昆仑万维已经通过Opera News产品,在数据抓取、数据清理等搜索引擎技术上拥有了5年的技术积累。
在2020年,昆仑万维开始建立团队投身于GPT3大模型研发。
“前段时间有人怀疑我们大模型是套壳,我们觉得冤枉透了。3年前,市面上并没有任何开源模型,即便是想抄都没得抄。”方汉说道。
去年12月,昆仑万维在国内第一家开源了140亿参数的中文大模型,据介绍其大量数据都是通过自建引擎进行抓取和清理的。
因此实际上,这5年的搜索引擎与3年的大模型技术相结合,也就是通过这8年的技术积累,才让昆仑万维有了敢于做AI搜索的底气。
方汉也深刻地感觉到,如果要把搜索引擎作为一个可信的生产力工具,我们只要切中用户需求、给用户提供价值,用户就一定会使用。
例如,网易的一款给英文论文润色的工具就做到了800万用户,其原因就是因为定位极其精准,瞄准了写论文的用户,而又没有其他竞品。
因此,他希望,天工AI搜索能够成为一条鲶鱼,刺激整个市场格局已经很久不变的搜索引擎市场。也只有当该领域所有的公司都跟进AI搜索时,用户才能够享受到更好的搜索服务。
在盈利模式上,信息流广告是任何一家搜索引擎公司都无法回避的。由于AI搜索给用户返回出来的是精准的知识,对用户喜好的了解程度会达到前所未有的深刻。
方汉进一步说到,特别是我们打造AI搜索的目标是成为一款生产力工具,对于行业广告来说可能会更有价值。因此,除了传统的信息流广告,AI搜索也可能会诞生出一些比信息流更高效的广告形式,但具体形式在现阶段还很难预测,只能不断摸索。
02
加入产品经理个人习惯
却意外爆火
实际上,AI搜索从产品立项到完成仅花费了半年时间。
方汉指出,之所以能够在半年时间研发出一款AI搜索产品,一方面得益于研发团队的高效执行力,另一方面得益于创始人周亚辉对于行业趋势的超前预见性。同时,从立项到现在的半年时间里,我们对于产品的思考逻辑一以贯之,坚持做C端,并且要做端到端的内容生成工具。
在这个过程中,最重要的在于昆仑万维在搜索引擎和大模型的技术积累。
据介绍,爬虫集群、Rank模型等搜索引擎技术都是现成的,在大模型底座上,训练语料也是公司自己所积累的,因此在调教大模型往AI搜索上转就会相对容易。
而产品化的难点就在于如何将其与大模型集成起来,让大模型能够赋能这些搜索结果,并将搜索结果再整理成用户愿意阅读的知识。
例如,信源功能就是天工AI搜索最为独特的功能之一,而这个功能则来自于一位产品经理的个人习惯。
研发团队中有一位产品经理经常会在网上与别人辩论,但却很难有人能辩得过他。其原因就在于,这位博士学位的产品经理,将他写论文的习惯也用到了辩论过程当中,会把所有引用的数据一一列出,并且都是引自官方权威的信源,这就让别人无法跟他争论。
因此,他就建议产品要加上信源功能。谁知在测试过程中,用户非常喜欢这个功能。无一字无出处,这对于很多把搜索引擎当生产力工具的重度用户(例如科研、投资、媒体行业等)来说是尤其重要的。
截图来自天工AI搜索官网
那么,对于AI搜索来说,加入信源功能的好处是什么?
系统可以将这些信源做排序,将一些优先级高的信源放在前面,保证了结果的权威性和准确性。因为光靠大模型并无法代表权威性,但如果内容引自新华社、人民日报等官媒就完全不同了。
可以说,这是一个将科学家的使用习惯放到大众产品里的典型例子。
此外,我们知道,大模型会编造不正确的答案,产生“幻觉”。
对于大模型最常见的幻觉问题,天工AI搜索在输出的过程中,会针对一个问题进行大量的网页搜索。通常,排在前5页的搜索内容肯定是相对权重较高,也相对可信,因此系统会将这些网页根据一定的规则,用多种方法反复问大模型2-3次,再输出最终结果。
并且,系统会将搜到的网页作为提示词还给大模型,让它根据这个来推断,这样就可以彻底杜绝幻觉的可能性。
方汉谈到,搜索引擎和大模型结合是非常重要的,否则谁都无法彻底解决大模型的幻觉问题。
03
AI未来将会重塑商业模式
“落地为王”最为关键
据悉,昆仑万维的天工大模型在国内会同时推动在B端、C端的落地。
方汉表示,作为一家互联网公司,昆仑万维将大模型落地C端是最容易的。在B端,昆仑万维会优先布局金融、能源、新材料、医疗等付费意愿更强的行业。未来各家大模型在B端的竞争在于,哪家能够率先在付费能力强的行业中抢到更多的落地合同。
而昆仑万维的优势就在于,旗下拥有一家产业资本(CVC)公司——昆仑资本。据悉,昆仑资本其投资组合涵盖了创新药、新材料、新能源、企业服务等赛道,投出了映宇宙、达达、追觅、竹云、小马智行、科亚医疗等明星企业。
可以说,昆仑万维既对这些垂直行业有着深度理解,也可以将其大模型优先从被投企业中开始落地。
今年8月,昆仑万维就官宣与映宇宙(前身为映客)集团母公司北京蜜莱坞网络科技有限公司在AI大模型业务方面达成合作,向其输出AI文本生成能力、AI图像生成能力。
方汉介绍说,作为一家视频平台,映宇宙非常关注内容生成工具,它也非常担忧AIGC会将自己的商业模式颠覆掉,但是从时间成本和资金成本上来说,自己做大模型又不现实。因此,映宇宙和昆仑万维这样有大模型能力的公司合作,共同探索基于AIGC全新商业模式的落地就显得非常重要。
在B端,大模型还有着更加丰富的商业想象空间。
在方汉看来,所有强序列化文本数据需求的一定是会最快应用的行业。例如,在投资机构中日常看财报、写报告的工作完全可以由大模型来替代。
又如,需要大量人工筛选的行业。以昆仑资本投资的一家钙钛矿太阳能电池公司为例,其核心就是要使用新材料替代现有的硅基太阳能,因此就需要在几百万种化合物中挑选出有效的化合物。
尽管他们有一套理论可以将几百万种的范围缩小到几十万种,但仍然属于“撞大运”,这无疑会拉长整个研发周期,但如果能够让大模型把这个数据学懂,就能够将这几十万种再缩小至几千甚至几百种的范围,对于这家公司来说就是一种效率上的极大提升。
所以,只要这个行业有相应的规模化、序列化的好数据,那么其落地会非常快,特别是对于需要消耗大量生产时间和人力成本的行业,引入大模型之后会迅速改变。并且,一旦行业中引入AI,就会造成降维打击。方汉指出。
例如,在电商行业,原来制作一张商品图片成本大概为500元/张,而现在全部由AIGC生成也许连5分/张的成本都不到,未来所有的电商模特、摄影师几乎都会面临失业。未来可能只有奢侈品品牌才会请摄影师实拍,而普通商品无一例外会全部沦陷。在法律服务行业,借助AI可以快速生成法律文书,而律所里的实习生可能还没有AI写得好。
方汉认为,从互联网和移动互联网的逻辑来看,最终AI一定会重塑全新的商业模式,一定会出现巨大的红利,并且凭借这个商业模式获得极大成功的企业会长期存在。
他相信,这两年会成立最伟大的公司,对于所有公司来说机会是均等的,同时希望我们也能够成为这样的大公司,成为伟大公司的一员。
最后,对于所有创业者,方汉给出了4个字的建议,落地为王,“在当前的经济环境下,想拿到投资并不容易,因此创业者就需要认真思考自己的产品到底能不能帮助用户赚钱或者省钱。”
本文转载自创业邦
●永远Day One的企业家周亚辉
●颜水成加入昆仑万维 出任天工智能联席CEO和2050全球研究院院长
●昆仑万维2023半年报:营收24.3亿 经营性现金流同比增长30%
● 用大模型重塑搜索 昆仑万维发布国内第一款AI搜索产品
●昆仑万维成功入选2023全球数字经济大会“创新引领成果”榜单
●昆仑万维入选中国AIGC最有价值50强榜单
●昆仑万维成为北京东城区文旅局首家AIGC合作伙伴 AI赋能文旅行业转型
●昆仑万维成为北京市首批模型伙伴和投资伙伴
●官宣|「天工」大模型4月17日启动邀测