图左是澜舟科技创始人、CEO周明,图右是零一万物CEO李开复(来源:钛媒体App编辑拍摄)
钛媒体App 3月19日消息,昨日举行的大模型技术和产品发布会上,澜舟科技公布其大模型最新进展、实际应用落地和生态构建成果,包括孟子大模型Mengzi3-13B-Base,以及“一横N纵”的应用能力体系的 AI 金融、文档问答、文档辅助写作、机器翻译、澜舟智会、AI 搜索等。
同时,澜舟科技宣布与李开复博士创立的零一万物公司达成战略合作。李开复表示,由于大模型资源较大,未来澜舟将在基于大模型面向企业市场落地方面已经有了非常好的基础,零一万物则主攻千亿级大模型、多模态等方面。
李开复在会上演讲中表示,AI 2.0模型能力突飞猛进,通识理解已经超越人类专家。而通过图灵测试并趋于成熟,AI 2.0揭示下一个平台级变革,促进包括新产品、新业态、新的商业模式的全新应用生态。
展望未来AI 2.0,李开复认为有四大趋势:一、最革命性的 AI 2.0应用应该是 AI-First / AI-Native:最终脱颖而出的应用属于那些敢于全力投入新技术的先驱者。大语言模型的引入为 AI-First 应用带来了巨大的推动力;二、大模型始于文本,未来将拓展至“全模态”:跨模态生成技术是实现认知和决策智能的转折点。现实世界的信息是文本、音频、视觉、传感器以及人类各种触觉的综合体系,要更为精准地模拟现实世界,就需要将各种模态能力打通,例如文本-图像、文本-视频等跨模态甚至全模态的综合能力;三、AI 2.0将超越对话,从聊天工具到智能生产力工具:用户体验以及未来交互界面和商业模式都会发生大的变革;四、AI 2.0将走向实体,大幅提振社会生产力:具身智能可以让机器人制造机器人, 进一步实现AI 2.0 + 生产线智能规划。
在澜舟科技最新技术和产品发布环节,澜舟科技创始人&CEO周明博士表示,自2021年6月成立澜舟科技之后,在ChatGPT浪潮下整个 AI 行业发生了巨大变化,回顾过去一年,大模型领域迅速得到六个层面的发展:
1、大模型的能力得到快速提升:在更长的上下文处理能力、数学能力和推理能力、安全对齐等方面得到大幅度增强。2、RAG(检索增强生成):通过结合搜索相关数据库的结果与用户指令进行生成,可有效改善模型幻象、实时性、数据安全等问题。3、GPTs:用户基于大模型的超强能力方便地搭建自定义的GPT。4、多模态大模型:SORA突破了4秒钟限制,可以生成60秒的视频,而且生成的视频质量大幅度提升。5、大模型原生应用方面略现端倪:譬如,利用大模型构建AI搜索、角色扮演聊天、数字人等。6、大模型开源:LLaMA等开源模型有力地推动大模型的普及和发展,也显著地改变了大模型的竞争格局。
周明博士指出,2024年将是大模型落地元年。此次发布会的核心为”一横N纵"体系,其中的“一横”即为孟子大模型技术,而“N纵”是基于孟子大模型的面向ToB应用最重要的技术和产品。
周明强调,希望通过“一横N纵”,彻底贯彻大模型落地九字法则:专注、极致、口碑、快、成本。
“所有企业一定要专注,做什么、不做什么一定要判断出来,不能说OpenAI做了什么我都要做,它做多模态我也做多模态,他做GPTs我也做GPTs,我认为不可取。第二,你专注之后干什么,你要把它做到极致,零到一很容易做出来,一到十,十到一百是非常之难,越往上越难;第三你要做到口碑,不论做什么要在这个行业有巨大的口碑;第四你要快,快速研发,快速实施,快速部署。我再加两个字,成本,大模型创业不能不在意成本,一定要有造血的能力。你在研发的时候,商业活动的时候,交付的时候,每一个环节都要注重成本问题。”周明表示。
具体到产品中,大模型层面,周明博士提到,澜舟建立了从预训练,到SFT,到强化学习,安全,降低幻觉的完备的孟子大模型训练体系。而孟子大模型高质量的数据集—Mengzi-3数据集总规模为3T tokens,包含了网页、代码、书籍、论文等高质量数据来源,数据总量比V2提升了170%,数据质量也大幅提升。
如今在孟子模型语料数据加持下,澜舟团队近期完成了Mengzi3-13B的大模型训练,在多个模型基准中,该模型在中英文语言能力层面成绩领先。针对大模型训练和部署的成本高的问题,澜舟科技专注把To B场景使用最多的LLM模型(参数量7B、13B、40B最高到100B),做到最佳并大幅提升大模型的推理效率。
针对大模型的行业落地适配问题,周明博士再次重申了L1-L2-L3-L4的层次化分级服务体系,基于L1-通用大模型,在此基础上加入行业数据训练出L2 行业/垂直大模型,如金融、编程大模型;针对重要场景,在L1或者L2模型基础上finetune,实现L3大模型;最后Agents可以调用L1、L2、L3任何一层的模型形成完整的一个特定任务。
而应用层面,目前,澜舟重点投入到了金融行业、辅助编程等领域,此次澜舟公布场景、行业大模型商业体系。
其中,AI文档理解方面,基于孟子文档理解大模型提供专业的文档解析和信息提取能力,并与新华智云共建文化大模型;AI 文档问答方面,提供文本、表格内容处理的高效、准确解析能力、基于AI搜索赋能的基于文档的知识库问答、生成摘要和观点,以及可信的内容回溯,日前中金公司的中金点睛投研平台、联通客户项目等已开始集成澜舟相关方案;会议智能分析和问答层面,公司推出基于大模型打造的大模型原生的智能会议助手——澜舟智会,它采大模型技术对文字进行可读性优化,提供全文智能摘要总结等,目前已经在人保科技部署;机器翻译平台方面,澜舟推出“澜舟AI搜索”产品,已经为华为、传神、中金等客户提供服务。
澜舟科技合伙人、首席产品官李京梅坦言,澜舟智会这款产品可以输出文档索引、构建服务优化,检索服务优化、会议纪要等,从而形成相应的文档。基于“一横N纵”,将孟子通用模型和衍生的金融行业、辅助编程等垂直领域大模型,用于几乎覆盖全生命周期的从理解到问答到写作、翻译以及其他的一些产品,最后会在金融、营销、翻译、通用办公、文化、文娱等领域逐步落地。
澜舟科技合伙人&首席产品官李京梅
“我们应该利用国家发展大事,通过落地创造价值,拉动创新,而不是单纯地去追赶美国,OpenAI在干什么我们就去干什么。我认为短期可以,长期一定要有自己的创新思路。”周明坦言,企业要从不确定性中找到确定性,澜舟就是要把百亿到千亿的模型练好,把企业关心的能力练好就可以了,不用唯OpenAI所动,关心你自己需要关心的事情。
周明表示,“今年是创新元年,就遍地是黄金吗?不是的,我可以负责任地说,很多地方我们都没有开拓出来,比如,大模型如何结合最后一公里、大模型的商业模式是什么、如何加强交付能力、提高产品的标准化,这些才刚刚开始,方兴未艾。”
演讲之后的圆桌环节中,周明提到,目前中国在大模型算法上原创技术能力并不差,但可以在顶层设计上跟美国学习,或比美国做的更好。他认为我们缺乏某一个国家机制或者联盟体定义出一个大模型未来发展的必要的趋势。一旦解决,中国的人才快速攻关,虽然算力不足,但通过算法或者应用发力,可以弥补算力的不足,也是很有可能跟美国在某些方面可以PK。此外,大模型企业要跟国家的发展的大趋势配合,而非和美国看齐。
“我觉得,很多大模型创业基本上就是跟美国看齐,亦步亦趋,美国提出了一个什么,我们可能跟上或有一些改良。我们也做的不错。但是我总觉得这只是技术上的一点点,但要有一个综合的趋势推进过程,应用驱动最重要。如果中国跟美国比,应用、场景没有大的优势但也不占劣势。如果场景和应用反向驱动各个应用,推动国家经济和生产力各个方面提升,中国将基于创新能力有可能在下一轮 AI 创新中引领国际潮流。”周明指出,大模型产业应该先稳住阵脚,带动创新,首先发现问题、组织攻关,把这些问题解决,从而引领这个世界潮流。一旦迭代起来,假以时日,中国算力不足等问题可逐步克服。
此外,谈及大模型开源,周明表示,开源把技术平民化了,意味着只要你有创新想法可以拿开源模型做快速落地和迭代,实现新的创新。开源可以打破一些大公司的垄断,是非常好的事。此外,他还认为大模型未来的重要机会在原生,快速迭代创新应用,不断以前瞻性目光实现大模型创新迭代。
据周明透露,孟子3-13B计划于3月30日对外开源。
(本文首发钛媒体App,作者|林志佳)