6月13日,360公司在北京召开“360智脑大模型”首场应用发布会,对外公布360GPT大模型的最新进展与研发成果,并发布了一系列基于大语言模型的落地应用产品。覆盖消费级、企业级等应用领域,包括360智脑、360鸿图、360AI搜索、360AI浏览器、360智脑桌面版、企业数字员工、360智脑API。
其中360智脑AI大模型经过两个月的快速迭代,目前已经发展到4.0版本,具备支持横跨多模态(文本/图片/音频/视频)应用能力。在短短的两个月内,360智脑大模型取得了疾速成长,360创始人兼CEO周鸿祎对此表示,对于追赶ChatGPT的步伐感到十分惊讶,其成果也超过了预期。
周鸿祎金句连连,“360智脑”跨模态生成能力出众
周鸿祎曾把“360智脑”比喻为呱呱坠地的新生儿,在本场演讲开始之前,周鸿祎依然身着一袭经典“红衣战袍”登场,剃了平头显得年轻了10岁,颇有初为人父的风范。他开场便自嘲“自己最大的优点就是不会吹牛”。有意思的是,在今年5月初,他曾经对科大讯飞的“星火识别大模型”作出一针见血的评价:“现在说超越ChatGPT的叫吹牛。”
周鸿祎分享道,360的GPT大模型起什么名字,是一个学问。有朋友推荐他起名“红孩儿”——引来全场一片哄笑。周鸿祎表示不喜,最终选择一个平平无奇却又十分好记的名字:“360智脑”。
在周鸿祎看来,目前“国内的各家大模型基本处于一个水平线”,他更关注大模型的应用落地场景是否能够与消费者接地气。周鸿祎提出了“大模型重塑生产生活”的口号,认为大模型的未来将会与AIoT(智能家居)产业相结合,让多模态大模型的大数据赋能物联网产品应用。
周鸿祎认为,360与OpenAI算不上直接的竞争对手,360更关注多模态大模型的应用,而OpenAI有着对通往AGI(通用人工智能)的钻研执念。事实上,这也是企业性质差异所决定的。OpenAI是一家不具备IPO条件的“有限盈利”企业,依赖微软充沛的战略投资,而360是一家纯粹的商业公司。
今年5月底,周鸿祎便提出了“大模型+物联网是下一个新风口”的说法,“AI场景成熟一个,对外开放一个”。他断言,AI将重塑360公司,迎接第二春。周鸿祎调侃道,作为一家干了8年的搜索引擎公司,他和百度都有机会在2018年就开始钻研“LLM通用大语言模型”,如果当时就跟OpenAI做一样的事,今天或许局面会很不一样。“但是,马先生、张先生、李先生和我们,都选择了将AI算法应用在增加点击率、广告推送和精准投放上。”周鸿祎很坦率地笑着说。这里的“先生们”暗指BAT与字节跳动,而采集用户大数据进行“机器学习”是所有AI大模型的基本原理。
无独有偶,今年4月的百度文心一言发布会上,李彦宏也有类似的表态。他透露百度是在2020年才意识到需要从“决策型AI”转向“生成式AI”。而OpenAI公司从2018年就开始训练大模型,并在2020年GPT-3发布时,通过1750亿的超大参数量训练取得了“AI觉醒”。
根据官方的说法,“360智脑大模型”具备几项领先表现:
【数据优势】以搜索为基础,360数据采集量是A股上市企业第一,是GPT-3的14倍,是千亿级参数量的中文大模型;
【安全优势】360是国内的数据安全领军企业,深耕多年的政企数据安全领域,周鸿祎认为,对于风险不确定的互联网生态,对于所有大模型而言,数据安全是其核心竞争力;
【算力优势】算力是大模型训练的基础能力,360自称是A股算力资源第一的企业,GPU持有量仅次于BAT。通过本地+分布式+云计算的混合式训练,弥补了360掌握的GPU不足的劣势;
周鸿祎直接晒出中文通用大模型综合性评测基准(SuperCLUE)的测评成绩,360智脑仅次于GPT-3.5与GPT-4,是国产大模型的领跑者,在“中文语义理解”题目的表现甚至优于ChatGPT。但也坦言,即便“360智脑”在2023高考作文模拟中取得高分,写出来的文章依然平淡乏味、套路满满。
他坦言,OpenAI拥有追逐AGI的执着信念,并认为中国企业想要弯道超车的最佳途径,就是发展多模态大模型能力。周鸿祎甚至大胆预言:OpenAI下一代大模型“GPT-5”将具备多模态能力。尽管该公司创始人兼CEO奥特曼日前刚刚否认公司正在训练“GPT-5”。
什么是多模态能力?就是大语言模型同时具备文字、图像、音频乃至视频的解析与处理分析能力。周鸿祎在会上自信地宣布,“360智脑”已经具备了跨模态的生成能力。EVA仔细看了一下,“360智脑”目前具备“文生文”“文生图”“文生表”“图生图”“图生文”“视频生文”“文生视频”“文本剪视频”等多项技能点。其中“文生文”“文生图”与“文生视频”都不算稀罕,其它主流大模型均已具备。
不过在应用场景上,360显然做得更为出色。比如基于DALL-E2的微软New Bing与基于文心一格的百度文心一言均支持“文生图”能力,“360智脑”更进一步,支持输入需求指令,可对AI生成的图片进行再次编辑。周鸿祎在现场演示了对其个人证件照调整背景色的能力。
令EVA感到惊艳的是,“图生文”展示了强大的画面分析能力。“360智脑”支持图像信息解析,这是一种区别于“文生图”的逆向判别能力。在演示案例中,AI准确辨识出“肌肉蒙娜丽莎”的不正常之处,并且识别出了图片源自达芬奇的原画。
在另外一幅照片中,AI发现了画面中的小孩使用插线板时的不安全行为,并且给出了对应的合理建议。
在“视频生文”能力展示中,AI从一段由360安全摄像头录制的动态视频画面中精准找出了马路上所有的红色车辆,甚至能够识别出画面中的国旗与行驶中的动车。
在“文生视频”能力展示中,AI精准生成了4张“熊猫划船”的4秒短视频,而这项能力目前只有在类似Runway之类的AI视频生成工具才提供。
EVA在本次发布会开始前,并没有预期到“360智脑”在本场活动上展示了如此完善的应用落地场景,如果可以形容,“360智脑大模型”是所有目前主流AI能力的集大成者。无论是ChatGPT还是Midjourney,抑或其他国产大模型应用,都未能同时具备如此丰富的跨模态生成能力。
周鸿祎直言,在中国,AIGC已经进入“百模大战”,开启“应用场景”大比拼是一场不可避免的内卷战。据不完全统计,目前在国内已经有超过80个通用大模型以及数不胜数的垂直行业大模型。
周鸿祎反驳李彦宏说法,重新定义“数字人”
在稍早前的中关村论坛上,百度CEO李彦宏在《大模型改变世界》演讲中表示,“未来(程序员)的薪酬水平,很可能将取决于你的提示词写得好不好,而不是取决于你的代码写得好不好,提出问题比解决问题更重要。”对此周鸿祎有不一样的看法,他认为“不是每个人都能成为prompt专家”,而解决用户输入大模型提示词障碍的最好入口,就是为每个人私人订制专属自己的“数字人”智能助理。
区别于现在流行的虚拟主播,360重新定义的“数字人”是有个性人设、有记忆能力、“主人”思维能力和人生阅历的“数字孪生人”,这位AI助理更像是用户自己的“数字分身”。用户只需要往“360智脑”平台上传一定量的个人文档资料、日常生活音频/视频以及形象照片,就可以生成属于自己的“数字人”,甚至可以模拟用户的声线进行交流。这多少有点《银翼杀手》内味儿了。
周鸿祎使用“360智脑”当场生成一位“AI周鸿祎”作为360新闻发言人。周鸿祎邀请现场观众询问了几个关于360的问题,感慨自己的“AI数字人”回答滴水不漏,啥都说了却又感觉啥也没说。
EVA留意到,此前所有的演讲介绍环节均为提前录制,从AI角色扮演能力的展示开始,周鸿祎强调是现场演示。这与其他国产大模型的发布会有了显著的差别。此前曾有媒体询问李彦宏为何没有在现场演示文心一言,从外界看来,百度多少显得信心不足。
此外,360还现场演示了“AI诸葛亮”“AI孙悟空”以及“AI法务专员”等等AI角色扮演的能力。EVA发现,“AI诸葛亮”在回答“如果你拥有iPhone会怎样用”时,角色会突然失去文言文的表达能力,而直接采取白话文表述;“AI孙悟空”的脸模颇有《美版西游记》中“吴彦祖版孙悟空”的味道;而“AI法务专员”只会令更多的打工人感受到丢饭碗的危机。
跳脱古代人物与神话人物,周鸿祎还演示了与“AI马斯克”对话,不过该环节显得准备不是很充分。“AI马斯克”回答问题四平八稳,浓浓的GPT范儿,少了世界首富那种桀骜不驯的性格。但不管怎么说,360敢于现场演示大模型,已经勇气可嘉。
发布会的最后,周鸿祎秀了一把One More Thing,将自己的“数字人”与其他“数字人”聚到一个虚拟聊天室内,让“他们”展开自由交流,展示了360企图进军“元宇宙”领域的雏形。
抢占AIGC大模型风口,周鸿祎雷厉风行
对于AIGC这个风口,周鸿祎是国内互联网企业中反应最快的大佬之一。在4月的一场活动上,他将大模型的革命比喻成“爱迪生发电”技术一般的产业革命,他大胆预言“每个行业、企业、个人都会拥有属于自己的GPT模型,而多模态大模型与物联网的结合是互联网企业和硬件制造企业的下一个风口,GPT技术远远没有成熟,还是要发展,GPT的确存在AI风险,但是不发展才是最大的不安全。”
周鸿祎认为,大模型与物联网的进化逻辑是:大语言模型→多模态大模型,需找准应用场景将多模态大模型与各种我们使用的AIoT智能硬件进行结合。为此,他要求360公司上下所有员工,快马加鞭进入AIGC的快车道。在刚刚过去的两个月,对比百度与科大讯飞等友商,360的动作显得更为频繁:
3月29日,周鸿祎开了一场发布会,临时决定加场,现场演示360的大语言模型。
4月初,周鸿祎在公司发了内部信,要求360员工集体拥抱AI,也给所有产品经理留了“作业”,让大家思考如何在自己的产品置入大模型。
5月份,360搜索、360浏览器和360安全卫士等部门陆续交了“置入大模型的作业”。
5月31日,360智慧生活(AIoT部门)也交了“作业”,周鸿祎在微博发布公开信,提出“大模型+物联网是下一个新风口”的说法。并认为视觉大模型将全面重塑360的智能硬件版块。
周鸿祎亲自挂帅指挥AIGC应用大作战,在他的认知观里边,是这样解释多模态大模型和物联网的结合:于物联网而言,大模型的加入,将为其带来两个方面的新增量:
▶数据增量:物联网采集的数据维度比互联网的信息量更大,尤其是将语音和视觉方案与硬件结合后,终端产生的海量数据将造就大模型数据所谓的“奇点大爆炸”,或许将引发“AI觉醒”;
场景增量:大模型的海量数据需要寻求落地场景,和海量硬件的结合无疑是一个巨大的场景增量。4月的发布会上,周鸿祎这样说道:“我有一个预言,因为人类产生的有价值的资料是有限,很多人发愁人类文本不够用了。但我认为只要有了多模态的能力,把全世界很多摄像头和它接上,能够实时采集各种数据,哪怕是老周今天在这胡说八道,台下观众在窃窃私语,大模型都能通过摄像头来捕捉到一切信息。”
周鸿祎谈AI数据安全:这是我们的拿手好戏
然而,AI技术的进步就伴随着AI技术的安全隐忧问题,前不久福建一企业主就被自己刚刚添加的“AI好友”在10分钟内骗走430万元的新闻依然历历在目。“前两天我因为阳了,没有出席行业大会,同事就用我的声纹克隆了一个自己的‘数字人’,做了一个10分钟的演讲视频。演讲完效果不错,但我也吓出了一身冷汗。”周鸿祎回忆道,“我在想,万一有人利用我的声音,洋洋洒洒讲了一篇我不能讲的话怎么办?”
“以前是耳听为虚、眼见为实,而如今眼见也未必为实了。”周鸿祎感慨。但至少在今天的“360智脑”应用发布会上,“红衣教主”对于自己的“数字人”充当公司的新闻发言人显得信心满满。在AI数据安全领域,身为一家知名数据安全公司的CEO,周鸿祎早早就开始未雨绸缪,360的AI安全探索比其他人早半步。“我们有全球最大规模的网络安全大数据,我们记录了很多攻击样本的数据、很多网络安全攻防的实例。用这些来训练一个安全大脑GPT,让它对恶意攻击的阻断、侦测更加有效。”
对于当下任何一家企业来说,AI将冲击其所在的领域,今天还没有冲击,说不定明天就冲击到了。正视问题,解决问题,无论是周鸿祎还是360,都处于变化中求发展。周鸿祎在AI大模型面前展示出了强烈的好奇心和活力,好奇心永远是最好的技术驱动力。在技术变革的前边,许多大佬都在摩拳擦掌,而对于普通人来说何尝不是如此呢?苹果公司创始人乔布斯曾经说过“Stay hungry,Stay foolish”,唯有保持饥饿的猎手,才能不被时代抛下,才能拿到进入下个时代的船票。
如风沐喜的360公司“第二春”,EVA十分期待。
针对今天刚刚推出的“360智脑”4.0版本的升级,EVA也会在后续推出产品的应用评测与体验。欢迎读者朋友们加关注、点赞、加收藏,把文章分享给更多像你一样好看的亲朋好友们。
芝麻客服 2024-12-17
沪敖3D 2024-12-17
爱科技的KP酱 2024-12-17