出品 | 搜狐科技
作者 | 梁昌均
从3月底的大模型首秀、4月底具备多轮对话的2.0版本,再到5月中旬发布多模态文生图的360鸿图,大模型版本迭代到2.5版本,以及5月底发布智脑视觉大模型,版本迭代到3.0,360可能是国内大模型版本迭代速度最快的公司。
在6月13日的发布会上,360创始人、董事长周鸿祎正式宣布360智脑大模型再次升级到4.0版本,新增多模态、数字人等核心功能,并实现全端应用。
周鸿祎表示,多模态是给大模型增加眼睛、耳朵、鼻子、嘴巴,接下来将会发布插件平台,要让大模型不仅仅停留在大脑的层次,还要通过插件让它有手和脚的能力,这样大模型的能力才能越来越发挥出来。
周鸿祎表示,一个完整的AI大模型有四大能力:文字处理、图像处理、语音处理、视频处理。不过,周鸿祎这次仅用视频演示了360智脑文生图、图生图、图生文、视频理解和文生视频等多模态能力,现场并未进行实测演示。他认为,多模态将是大模型发展的趋势,也是中国自研大模型弯道超车的关键。
目前,360智脑已经具备生成与创作、多轮对话、书写代码、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、多语言翻译等十大核心功能,也是国内首个通过信通院AIGC大语言模型功能评测的大模型。
周鸿祎也在现场宣布,360的“全家桶”产品全面接入360智脑,包括浏览器、搜索和安全卫士等桌面产品。“360全面拥抱大模型,所有的产品都能成为智脑的入口,都有智脑的能力,所有的产品都将重塑。”
同时,他表示,AI进化的终极解决方案要以人为本,大模型应该成为人类的朋友和助手。“未来可能浏览器未必是入口,搜索也未必是入口,AI数字人将是未来大模型最合适和最重要的的应用入口。”
周鸿祎认为,目前市面上的很多数字人没有灵魂,按照既定的脚本输出,没有性格和记忆。“我们能不能打造一种有灵魂的数字人?”周鸿祎提到,360大模型的核心创新在于重新定义了数字人,有人设、有性格、能够模仿人的思维方式和人生经历,而且还有记忆,这样才是真正的数字人,甚至有可能实现数字永生。
此次升级后的360智脑4.0版本推出数字人广场平台,目前已有200多个角色,分为数字名人和数字员工两类。数字名人包括历史人物、偶像明星、文学形象等,用户可以与其进行对话交流。数字员工则可成为企业员工的知识助手和办公助手,提升企业运营效能。
周鸿祎现场演示了诸葛亮、孙悟空、马斯克、刘德华等虚拟数字人的互动能力,对于有些非常刁难的问题也可以给出看起来比较合理的答案,甚至可以用文言文进行回复。此外,现场演示的“法务专员”数字人角色,对企业常见的公章管理和合同审核问题也能给出专业回答。
周鸿祎还在现场创建了自己的数字分身作为“360发言人”,其学习了他本人完整的私人知识库,能够复刻他的思维方式和人生经历,甚至还能模仿出他的语气声调等。面对现场观众360股价是否还能继续上涨的提问,周鸿祎的数字人则表示无法预测和判断,并给出要风险提示和投资建议,几乎是“滴水不漏”的回答。
周鸿祎表示,360AI数字人未来的发展方向是生成声音、视频并拥有长期记忆,甚至拥有目标分解和规划的能力,并且拥有“手和脚”,具备执行力,更好为人类提供服务。
对于中国的“百模大战”和差距,周鸿祎也给出最新的判断。他表示,国内大模型的发展速度你追我赶,不断相互激励,持续缩小和全球领先大模型的距离,比如文字生成等基本能力都差不多,很多方面赶上了GPT-3.5,跟GPT4.0的差距追赶的速度也超出了想像。
“原来我说差距有一年半、两年,今天我认为国内的同行们现在这种发展迭代的速度已经基本赶上或者接近了国际的先进水平,在中文理解等能力方面已经超过GPT-4。”周鸿祎表示。
周鸿祎同样认为,这次大语言模型带来的机会是一次不亚于PC、互联网、iPhone被发明的机会,是一次新的工业革命的机会。“这样的产业的机会才刚刚开始,未来至少有10年的红利时期,未来包括所有的APP、网站、应用,甚至所有的行业都值得用通用人工智能来重塑一遍。”
同时,他还强调,大模型真正下来比拼的还是应用落地的能力,就是如何使AI让普通人、普通企业用得方便、用得简单。“只有推动大模型场景化、产品化、平民化、垂直化,才能真正实现新的工业革命。”
新科益CAD-IT 2024-12-17