当前位置:首页|资讯|GPT-4|清华|AI大模型|融资

知乎CEO周源:"知海图AI"中文大模型部分表现与GPT-4打平手,AI辅助创作是大趋势

作者:搜狐科技发布时间:2023-04-14

原标题:知乎CEO周源:"知海图AI"中文大模型部分表现与GPT-4打平手,AI辅助创作是大趋势

出品 | 搜狐科技

作者 | 潘琭玙

4月13日,知乎举办的“2023知乎发现大会”上,知乎CEO周源和知乎合作人、CTO李大海共同宣布了知乎与“清华系”NLP公司面壁智能在AI大模型上的合作与应用,正式发布“知海图AI”中文大模型。

知乎通过联合研发与战略投资的方式于今年2月与面壁智能达成合作,目前,“知海图AI”中文大模型,已经运用进知乎热榜并开启内测。

根据面壁智能官方在知乎发布的回答,“知海图AI”的训练基于面壁智能自主研发的CPM企业级大模型与ModelForce大模型系统。

面壁智能联合创始人、CTO曾国洋在演讲中表示,“经过测试,在知乎热榜的应用场景下,知乎与面壁合作自研的大模型与GPT-4相比达到了持平的效果”。对于这款大模型的迭代,曾国洋表示,无论做垂直、合作还是产品,最终目标都是通用人工智能。

李大海也向搜狐科技等媒体进一步解释了知乎此次推出的大模型在表现能力与GPT-4持平,是基于热榜问题下,把所有知友的回答观点抽取聚合。针对大模型普遍存在的“胡说八道”的情况,他指出标注优质数据是优化路径之一。

周源表示,ChatGPT这类大模型技术的应用,能够在生产力效率、场景赋能以及工具升级三个环节为知乎社区多场景带来便利。他也强调,“服务的对象主体是人”。

谈及如何看待创作者使用生成式AI进行创作,周源表示,知乎在今年年初上线了AI辅助创作的功能,“核心就是要告诉大家,用这样的工具是没有问题的,因为这是大趋势。”但他也指出,虽然能够利用AI工具提升文稿质量,但内容创作者应该为内容最终质量负责。

对于知乎在大模型领域的布局,李大海透露,在ChatGPT的浪潮来临前,知乎已在持续关注该领域,并在前期与面壁智能有许多沟通。另外,他也表示,目前正与不同合作伙伴进行合作,将贡献数据助力开源中文大模型。

在算力储备方面,李大海表示,知乎拥有自己的算力,在A100芯片上有所储备,也正与国内厂商洽谈合作。

对于大模型未来的商业化路径,周源表示,“可以让子弹再飞一会儿”。他明确指出眼下并未考虑商业化,仍处于内测阶段。

以下是对话实录,经编辑:

媒体:今天知乎发布了“知海图AI”大模型,但其实大众对知乎在AI以及大模型人才方面的一些积累了解比较少,请介绍一下。

李大海:大语言模型领域较新,国内只有少数公司在这个领域有几年的积累,很多同学都是在原来NLP技术基础上做快速学习。

大模型本身不是横空出世,前面有很多技术累积到现在,所以我们工程师迅速地去学习、消化、吸收,变成大模型领域的开发者、从业者,这个过程也并没有那么突兀。我们这方面的人才取决于整个算法中台AI控制智能的厚度。

在ChatGPT的浪潮之前,我们就有关注该领域,与面壁智能前期有过沟通。但更早之前该技术尚未在业界被论证,因此没有贸然投入很多人力做前瞻的部署。但在浪潮之后,我们很快就投入人力去做相关研发工作。

媒体:关于在发布会上展示的大模型和热榜摘要功能,后者的内容聚合场景是在怎样的特定条件下进行的?

李大海:这个场景其实是在热榜问题下,把所有知友的回答观点抽取聚合。在这个具体场景里,会涉及到几部分:第一,是与这个问题相关的知友观点的抽取是否准确;第二,观点抽取后的聚合是否合适。

知乎的场景中,答主的回答千奇百怪,甚至有时候会有其他的观点呈现,这个观点可能跟提问没有关系,对大模型也是挑战。我们在这个场景下抽了41个提问去做评测,发现跟GPT-4在此具体应用场景下基本持平,有的部分我们稍微差一些。

媒体:知乎作为国内中文很高质量的社区,也相当于是ChatGPT的天然场景,在尝试过程中,觉得自己或者国内公司的优势在哪?因为觉得热榜摘要能够作为很合适的切入点才做这件事情吗

周源:我们不能代表国内的公司,但是我觉得,所有的公司都应该首先想自己的价值是什么,或者说自己给用户提供的价值是什么,自己的定位是什么。能做的是在这个基础上跟社会有所交集。

10年前,知乎有一个产品功能叫“回答总结”,那个功能与现在我们合作应用大模型的位置差不多。之前这个功能开放给所有用户,大家都可以进行编辑,把用户所有的回答做总结。后来发现这个事情太困难了,回答数量多了以后成本非常高,而且效果并不好。

现在可以通过技术的方式,帮人完成这样的事情:在加入一个讨论之前,逮着离得最近的一个人,他可以告诉你这个讨论是关于什么,迅速知道一个梗概后,再阅读里面有价值的内容。

媒体:知乎如何看待ChatGPT这类大模型技术和应用对整个内容行业的影响?知乎发布的大模型是面向热榜这样的场景,也想了解在应用上AIGC能为知乎哪些更多场景带来便利?

周源:第一是生产力,就是效率的提升;第二指向场景的赋能,知乎比较为人熟知的场景其实都是以讨论场为核心;第三是工具的升级,像搜索和推荐这样的偏工具化的场景里面,它也可以做很多的升级工作,我们的工作也会围绕这样的推进顺序,在社区里做更多实践。

媒体:这次双方合作在算力算法上是主要交给面壁智能吗?数据方面我们计划投入怎样一个力度?

李大海:首先知乎自己是有算力的,我们在这个事情上的布局是及时的,我们有很多A100卡,具体不方便透露。这些卡可以为我们做训练,未来我们上线更多功能也可以支撑。

我们也跟很多国内厂商在洽谈,因为我们发现在部分场景中,国产厂商表现也很好,他们的卡其实不输国外的卡,因此我们会持续与国内外厂商沟通合作,这块并没有大家想象的这么大的问题。

媒体:在语料方面,中文语料的短缺,或者我们这个平台的语料局限性会影响大模型的发展吗?

李大海:其实谈不上局限,因为大模型中文的开放语料,中国互联网还是有不少开放互联的精神在,包括知乎也开放给很多搜索引擎做内容抓取。我们能够收集获取到很多的开放的语料。

第二,中文的问题也是具体的技术问题,这个技术问题其实有很多方法解决它,本身标注也好、生产也好,还有就是挖掘更深度的数据。也可以从英文数据里做语言的对齐等等,其实是能通过这些方法不断地去逼近好的结果。

媒体:我们之前会说大语言模型“胡说八道”,在开发产品和功能上是否有认知或感触?

李大海:我们在研发的过程中,其实也看到不管是我们自己的大模型,还是像GPT3.5和GPT4,都会出现“胡说八道”的情况,我让它抽取知友这篇回答的观点,它会偷偷加上自己的回答,。这是当前大模型早期阶段不可避免的瑕疵。我们也感受到数据很重要,标注优质数据对于模型达到一个好的效果是蛮有帮助的。

媒体:有人认为AI工具持续的深入之后,知乎有相当数量的问答或者说知识体系是可以被它所替代的,那当你们不断地引入(AI)了之后,它会不会冲击知乎社区的创作者的地位?两者如何平衡?

周源:在过去很长一段时间,我们还是进行了比较深入的思考。刚才在大会上,我提到“生态第一”的战略,我们会慎重考虑AI是不是以赋能的姿态来进入社区。社区一定是人为本,知乎本质是人与人之间的讨论分享,它是这么迭代起来的,它的起点是人,它的终点也是人,但是AI不是人,这是有很大的区别的。

所以AI是一个环节,它可以在刚才我提到的比如生产力的场景,在讨论的体验,以及工具化的部分,做到效果提升,带来更多体验的优化,但服务的对象主体是人。这是很重要的原则,我们也按照这样的方式考虑我们在产品迭代优化上最后的价值落点。

媒体:关于创作者方面的,生成式AI有非常多能够帮助创作者方面的能力,知乎怎么看待自己的创作者使用生成式AI写自己的回答?

周源:知乎专业用户的密度是全网较高的,他们特点就是对效率的提升,对生产力工具的改进是有足够高的要求的。不是所有人都有需求去写一篇图文并茂的文章,但是写图文并茂文章的人,会有更大的需求、以更高的效率、更高的方式去产生出更好的内容,无论是我们现在看到的润色,还有大纲等等。

我们在今年年初上线了AI辅助创作的功能,其实就是要告诉大家,用这样的工具是没有问题的,因为这是一个大的趋势。但最重要的一件事情是对自己生产的东西负责,最后的发布键是你按的。你可以用任何工具提升文稿质量,但会有很多人阅读、引用你的文章。我们做了这样一个功能,确保在社区里大家能够知道这个内容是用了AI辅助生成的。

媒体:知乎数据的数量和质量上,相对其他社区是比较高的,是否会公开数据以推动整个国内大模型的发展?

李大海:我们在跟不同的伙伴进行不同程度的合作,可能会把知乎的一些重要数据贡献出来,为中国的开源社区建立中国自己的大模型,这个工作敬请大家期待。

媒体:关于大模型热榜,会怎么做商业化?

周源:我们首先没有考虑商业化,我们现在还在内测。

媒体:将来可能的商业模式会是什么样的?

周源:可以让子弹飞一会儿。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1