我们距离海外大模型顶尖水平还有多远?
谁来做我们中国人自己的大模型?
在声势浩荡的大模型创业浪潮中,我们越来越能感受到,国内也不乏一些厚积薄发的团队,在不断挑战Open AI的王者地位。
今天就带大家盘一盘来自国内一流学府——清华AI大模型创业团队的技术和产品,这些惊喜,你或许还不知道。
创始团队:是王小川和茹立云(前搜狗COO)联合创立的,王小川本人也是前搜狗CEO,是96级清华大学计算机系毕业生。
百川智能的目标是打造中国版的OpenAI基础大模型及颠覆型上层应用。据王小川自己透露,很多前搜狗员工带资进组,在第三个大模型发布时,前搜狗员工的比例占30-40%,看来大家都很看好大模型的发展前景。
百川智能目前已完成3.5亿美元的融资,参投方来自阿里、腾讯、小米等科技巨头。
产品:今年1月份,发布了超千亿参数的大语言模型Baichuan 3。
从成立之初到现在已经发布了10款大模型,面向C端的开源大模型Baichuan-7B和Baichuan-13B系列的开源大模型,目前Hugging Face、GitHub和Model Scope等平台上线,可以免费商用。
面向B端用户提供定制化服务的闭源大模型有:530参数的Baichuan-53B;Baichuan2系列则以API调用和私有化部署的方式提供给企业用户。
目前对外免费使用的人工智能助手使用的是Baichuan2-13B模型。还有一款Baichuan2-192K大模型,宣称可以处理35万字,不过对比月之暗面目前的20万字长文处理能力在效果上谁会更胜一筹?
1月份有平台称,百川人工智能助手在使用的测评结果中,“宣称拥有全球最长文本的百川大模型却低级错误频发”,已经2个多月过去了,让我们现在看看这个宣传说仅次于ChatGPT究竟是口不是口嗨?
在搜索场景下,询问喜茶、蜜雪冰城2023年新开门店数量,看看现在的回答如何?
这是不久前的网友测评结果,根据公开信息显示,喜茶2023年新开2300家门店,430家是喜茶在2023年5月份披露的数字,信息搜索上明显存在不足。对于蜜雪冰城的问题,百川AI两次回答数据完全不同,且差异较大。
今天的回答,会不会有一些令人惊喜的表现呢?
上图是今天的搜索结果,不仅提供了准确的数据结果,还列出了参考资料来源,回答数据准确,且不再是单纯数字结果,还附了一段简短的发展分析介绍。
与其要阅读大量的文献自己去总结,这种快速问答的方式极大提高了我们工作的效率。
创始团队:是由清华大学计算机系知识工程实验室的技术成果转化而来的公司。智谱AI的前身,是在2006年诞生于清华大学计算机系知识工程实验室(KEG)的明星产品AMiner——学术搜索与情报挖掘平台。
现任CEO张鹏,是国内首个中英文平衡的跨语言知识图谱系统XLORE的设计和研发者。持股13.06%的唐杰教授,是清华大学计算机系教授,也是AMiner的核心创立者之一。
智谱服务领域涵盖传媒、咨询、消费、金融、新能源、互联网、智能办公等多个细分场景。目前公开服务客户有上汽集团、金山办公,知己汽车、智联招聘等。
产品:公司合作研发了中英双语千亿级超大规模预训练模型GLM-130B,并基于此推出对话模型ChatGLM,开源单卡版模型ChatGLM-6B。认知大模型平台Bigmodel.ai,包括代码模型(CodeGeeX)、多模态理解模型(CogVLM)和文生图模型(CogView)等产品,提供API服务。
除了大模型产品,目前智谱AI还有Aminer和数字人两个系列的矩阵产品。
目前能免费使用的是基于GLM-4大模型的AI助手智谱清言(chatglm.cn),除了智能对话、绘画、文档解读,它还可以创建个性化的智能体,相当于自己可以根据不同场景给自己配备一个AI小助理。
我根据提示词自动生成的“导游智能体”,请它帮我规划2条去南京2日游的旅游攻略,包含景点、美食、酒店以及交通路线等内容。
没想到有这么一天,每个人都可以配备自己的小助理。
创始人:杨植麟,毕业于清华大学和卡内基梅隆大学(CMU),研究主要集中在人工智能领域。早在2016年,植麟就创立了专注于自然语言理解的循环智能,还曾参与华为盘古大模型研发。
月之暗面目前已完成三笔融资,今年2月份,完成最新一轮10亿美元融资,投资方包括老股东红杉中国,以及美团、阿里、小红书等一干互联网企业,投后估值约25亿美元,是国内最主要的大模型独角兽之一。
产品:智能助手Kimi:能够提供对话、信息检索和多模态交互。能够支持20万汉字的超长文本输入,OpenAI的GPT-4-32k只支持约2.5万字。3月18日,官方宣布启动200万无损上下文内测,文本长度长就可以跟AI一直对话,而且不会“遗忘”之前的对话内容,还能有比较好的理解。
20万字版本的Kimi助手可实现对白皮书、研报等的摘要总结。kimi升级至200万超长文本输入,这意味着AI可以扮演书中的角色,甚至按照人类的想象去改编剧情,以后小说和阅读App领域会有彻底的颠覆。
过去要10000小时才能成为专家的领域,现在只需要10分钟,它也许能就让我们成为一个新领域的初级专家水平。
目前,Kimi智能助手仍完全免费。但随着用户群体的扩大和使用量的增长,难免会出现算力不足的情况。3月21日下午就曾出现因为系统流量持续异常增高,流量增加的趋势远超其公司对资源的预期规划,导致从3月20日上午十点开始,有较多SaaS客户持续遇到“429:engine is overloaded”的异常问题。
据AI产品榜,Kimi Chat的2月访问量在国内榜排名第三,2月平均日活同比上升101.9%,全球增速榜排名第一,3月前二周继续攀升。访问量的激增一度让这家公司网络陷入瘫痪。据相关负责人透露,今年上半年预计会开启商业化模式。
趁着还可以免费试用,抓紧使用一波。
网址:https://kimi.moonshot.cn/
创始团队:核心成员来自清华大学人工智能学院,前瑞莱智慧副总裁唐家渝出任首席执行官。是国内最早布局多模态通用大模型的团队之一。
2023年初开源了全球首个基于Transformer的多模态扩散大模型UniDiffuser,首次实现基于一个底层模型高质量地完成图生文、图文联合生成、图文改写等多种生成任务。其生成式大模型覆盖文本、图像、3D模型、音视频等多个模态。
在商业化落地方面,依托于MaaS(模型即服务)能力,在2B、2C端同时发力。一方面以API的形式向B端机构直接提供模型能力,另一方面打造垂类应用产品,按照订阅等形式收费。
目前公司已与多家游戏公司、个人终端厂商、互联网平台等B端机构开展合作,开放模型服务,提供AIGC个性化体验、定制化内容生产等。
去年,面向艺术设计、游戏制作、影视动画、社交娱乐等创意领域,生数科技上线了两款产品:
PixWeaver:支持文生图,支持多风格、高美学图像创作,平均生成每张图仅需3秒,目前未设置下载次数限制。
网址:https://pw.shengshu-ai.com/painting
PixWeaver还支持文生视频,据官网显示,目前还未正式上线对外使用,用户可以申请体验名额。
3D生成——VoxCraft:支持文本或图像可以生成3D模型,文生模型贴图,视频转4D模型,应用于游戏开发、虚拟现实体验、影视制作等场景,上传一张图可以生成3D模型。
创始团队:面壁智能的创始团队成员均来自清华大学NLP(自然语言处理)实验室。CEO李大海是Google中国创始员工之一,还是知乎CTO,是知乎AI“智能社区”发起人。另一位联合创始人刘知远,是清华大学计算机系副教授、博士生导师,研究方向为计算机自然语言处理。公司CTO曾国洋是智源悟道·文源中文预训练模型团队骨干成员。
去年4月,面壁智能公开了一轮天世融资,由知乎领投,智谱AI为跟投方。去年4月份,知乎曾宣布与面壁智能功能开发了“知海图AI”,注资达数千万人民币。
产品:面壁智能的核心团队在2020年底发布了首个中文大语言模型CPM-1,并陆续推出了CPM-2、CPM-3、CPM-Ant、CPM-Bee等模型。其中CPM-Bee 10B模型在OpenBMB开源社区开源,并允许商用。
2023年5月份推出了多模态大模型对话助手“面壁露卡Luca”,支持中英文语言对话,具备代码、知识、逻辑及图片理解能力。可以根据输入文本语境和创作要求自动生成原创文案,并进一步进行改写或翻译,可以应用到不同的办公生活场景中。
网址:https://luca.cn/home
这样看下来,每家都在努力建造独属于自己的产品特色壁垒,智谱清言的智能助理,月之暗面的长文本无压缩阅读,生死数科技的文生视频,是否能成赶超Sora?
在这快速发展的初创期,清华校友之间默契地选择了自己的专属赛道,一方面基于过往的技术积累,另一方面也是基于对大模型应用场景、发展方向的独自理解。
清研车联联合优秀的清华大模型创业团队,探索大模型行业应用,洞察挑战与机遇。4月13-14日,咱们相约苏州!