来源:AI星球,文/吕鑫燚
在文心一言发布会的当天,李彦宏曾提到多模态大模型将是生成式AI的必要发展趋势。
李彦宏对未来的预判,不仅表明了未来文心一言自身的发展方向,也侧面反映出百度未来在人工智能产业中将着重深耕的领域。
就在文心一言发布会举办的十几天后,人工智能项目西湖心辰宣布完成由百度风投领投的Pre-A轮融资。此前2021年12月西湖心辰完成了蓝驰创投、凯泰资本等投资的近千万美元天使轮融资。
西湖心辰的创始人蓝振忠对于AI未来发展和李彦宏高度契合,他曾表示“多模态大模型在AI进化演变中是一个必然趋势。”根据蓝振忠透露,西湖心辰从成立第一天起探索多模态大模型和通用人工智能技术,并已基于自研大模型衍生出多个上层应用。目前已有AI心理咨询平台小天;AI写作平台Friday;AI绘画平台造梦日记。应用层已覆盖文字、图片等多个领域。
西湖心辰透露,将在今年完成两次迭代,目标是达到甚至在部分任务上超过GPT-4的表现。
猎云网此前曾报道过西湖心辰,根据西湖心辰透露,去年11月就曾和某互联网大厂的战投沟通融资事宜。如今投资落锤,百度风投投资西湖心辰,之于百度而言也是落在生成式AI产业布局中的一子。西湖心辰在完成融资后,也曾表示当前更看重在投资人和团队战略、资源上的协同性。
从百度的角度来看,投资西湖心辰仅是完善多模态大模型的开端,可以预见的是百度正在通过自身力量带动国内AI行业乘风破浪。
向多模态大模型进军
蓝振忠一直致力于多模态领域的研究。
他在卡耐基·梅隆大学计算机学院攻读人工智能博士期间,就专注于多媒体分析(多模态研究)和计算机视觉,作为核心队员代表CMU在IARPA举办的多媒体事件检测比赛中击败包括Stanford在内的诸多高校团队获得冠军。毕业后加入了谷歌AI业务,担任科学家。在谷歌任职科学家期间,蓝振忠参与了自然语言处理和计算机视觉的项目研发,并且成果用于谷歌新闻和谷歌助手等产品中。
2019年回国创业后,蓝振忠一直率领团队在AI领域摸索。基于大模型能力让上层应用更智能化的思路,西湖心辰构建了模型层—中间层—应用层的产品架构。
在基础的模型层,西湖心辰打造了RIO系列语言大模型和双模态图文模型,最终打造多模态大模型。经过测试,目前RIO模型的能力相当于GPT-3.5的水平。中间层方面,西湖心辰提供深入各个领域的模型,目前已和各行业多家客户展开深度合作。
从应用层角度来看,去年8月底AI绘画平台造梦日记上线,上线后迅速走红,曾创造了日增5万用户的增长速度,截至目前,平台已经积累了超100万用户。蓝振忠表示,从相对更成熟的文字、图片领域入手,发布应用高效收集用户反馈数据,提升大模型的智能化水平。
这样的产品架构可以使得底层大模型和应用层更加紧密,经过测试,目前西湖心辰的RIO模型的能力相当于GPT-3.5的水平。
据了解,目前西湖心辰正在研发首个可自助联网的多模态大模型——心辰大模型。根据西湖心辰的说法,目前,心辰大模型已拥有支持自助上网的AI系统,可实时更新网络数据和知识。比如,向产品Demo提问近期发生的热点事件:“马斯克什么时候收购了推特”“你知道最近中国很火的电视剧《狂飙》吗”等,它都能应对自如。
西湖心辰目前已在行业内崭露头角,上个月美团联合创始人王慧文发布英雄帖想打造中国Open AI时,曾被爆出西湖心辰被王慧文收购。随后西湖心辰创始人蓝振忠表示,虽和王慧文有多次接触,但目前并未有合作。在感谢王慧文的诚意后,蓝振忠说道有决心把西湖心辰打造成中国Open AI。
百度深入多模态大模型产业
早在2019年百度就开始着手大模型的研发。
此前百度的文心大模型涵盖基础大模型、任务大模型、行业大模型的三级体系,打造大模型总量约40个,产业应在电力、燃气、金融、航天等,基本上构建了国内较大的产业大模型。
前不久,百度又深入多模态大模型领域发布了文心一言。基于百度自研的ERNIE及PLATO系列模型,文心一言的关键技术包括人类反馈的强化学习、提示、知识增强、检索增强和对话增强。
李彦宏介绍,文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。
尽管深耕AI领域多年的百度,是国内目前最有可能打通所有大模型技术的企业。但是从整个国内市场环境来看,目前国内行业和海外仍是有些差距。李彦宏在发布会上也表示,“从某种意义上说我们已经为此准备了多年,我们十几年前就开始投入AI研究,但也不能说我们完全ready(准备好)了,文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个,我自己测试感觉还是有很多不完美的地方。”
虽然技术尚在摸索期,但市场需求十分激烈,短短一个月,有超过650家合作伙伴宣布加入文心一言生态。
从此前百度的发展脉络来看,在做自动驾驶期间百度发生过多次自动驾驶领域的融资,包括行业上下游,通过投资进而产生产业协同的效果。在多模态大模型的领域中,或许投资西湖心辰也只是百度大模型产业协同的开始。