当前位置:首页|资讯|GPT-4|大语言模型|人工智能|AI大模型

启明创投:最迟2024中国GPT4将诞生,长文本是大语言模型关键

作者:华尔街见闻发布时间:2023-07-07

原标题:启明创投:最迟2024中国GPT4将诞生,长文本是大语言模型关键

7月7日周五,世界人工智能大会召开的第二日,启明创投合伙人周志峰作关于AI大模型以及整个产业发展趋势的分享。

启明创投是国内最早关注且最活跃在AI该领域的创投机构之一,投资企业遍布整个AI生态链条,上游、中游、下游,其实都有设计,比如说像芯片、基础软件,还有像大模型以及下游的垂直的应用等等。

大模型第一性原理是压缩数字化的知识、信息和数据

周志峰强调,大规模的算力,大规模的数据对AI未来发展非常重要。

大规模训练的第一性原理是用大规模去压缩人类世界全部被数字化的知识信息跟数据。

你从这句第一性原理中能看到,大规模的算力,大规模的数据是对AI未来发展非常重要的,而确实大规模的算力,大规模数据也是人类过去40年芯片在互联网大数据各个领域中不断累积的这些技术,然后去推动AI的爆发。

大规模预训练学习生成,整个趋势的底层逻辑其实非常清楚了,未来会继续高速发展,深度学习被创业投资行业称为叫做AI1.0,主要是说它是针对一个特定的小任务,用一个特定的小数据集训练出来的一个小模型,而且主要是模式识别类,比如人脸识别语音识别,今天的大规模语音领域学习被我们更多称为是AI2.0,主要它是通用的数据训练出来的大模型,具有生成决策能力。

AI2.0浪潮将重建整个产业架构

周志峰进一步指出,AI2.0这一代新的浪潮,它会重建整个产业架构。整个生态架构会分为三层,最底层是基础架构层,右边提供算力,像aws火山引擎、阿里云等等都在提供这种计算中心平台,右边是工具链,且主要是对大模型的训练、推理、部署做优化。

中间这层是最重要的,一层是模型层,模型层也有几种模式,第一种是提供这种基础模型底座模型,然后对外去输出模型的能力,通过API通过模型定制。

然后还有一类是自建大模型,就他做了自己的大模型后,会针对某一个特定行业特定场景去做优化,然后提供端到端的从模型到应用的解决方案。

在第三层应用层,那一种是通过自建模型直接做到垂直应用,可能80~90%的公司都是左边这种就利用第三方模型的能力去构建自己熟悉的场景或者行业的一个应用,

这是我们理解的三层架构,确实这种新的架构也对整个世界去构建产品的形态发生很大的变化。

左边其实是过去几十年,不论是一辆汽车还是一个互联网的社交软件,其实都是这样一个架构,就是产品经理从用户获取需求,开发者从产品经理那块获取设计,然后用户再把开发出的产品去使用。

过去讲腾讯做得好,阿里巴巴做好,讲任何一个公司做得好,某种意义上是说他把飞轮转的最有效,而且能够持续的去迭代飞轮。

未来企业分为两种:+AI、AI+

谈到产业发展,周志峰指出,未来企业分为两种+AI、AI+。

未来更多的是把新一代的AI的能力放进工作流,它其实是一种旧场景的增强。

还有一类他会用这样的能力全新构建一个产品,它其实是所谓的AI native 的一种应用,那我称为叫做旧场景的重塑,或者叫做新场景的创造。

当下,可数的非常领先的AI公司还是翎毛凤角,主要是因为AI并没有实现赋能万业的这样一个真正的局面,它的产业化差强人意。周志峰表示:

ChatGTP重新点燃了AI2.0这波浪潮,你看全球的整个融资金额发生了巨大的发展,这一次会是一个依然是持续两年,然后走低的泡沫,还是会真的一路向前,发展到一个通用人工智能,我觉得这是一个非常值得思考的问题

大模型肯定是会变的越来越厉害,OpenAI的CEO也说,他们有可能自己去介入类似于微软这样的产品,做一个办公productivity产品,他们也在向往更广阔的空间,我们是不是能够找到一个自己的创业的黄金通道,最终走向一个广阔的天地?

也许现实其实是这样的,我们要走的路可能是一条死亡峡谷,两边都会不断的挤压,他们的技术都在动态变化,我们怎么能够穿过这条死亡峡谷,我觉得这是在创业时候,我们要去发挥自己的理性思维,去努力去思考的。

每一个科技浪潮一定都会诞生出新的王者,新的伟大的企业。

十大AI发展趋势展望

展望未来,启明创投联手未尽研究共同发布重磅报告《生成式AI》| State of Generative AI 2023总结出十点发展趋势:

第一,以我们看到的信息启明投资的企业,我们知道在2024年甚至更早,中国一定会出现比肩GTP4的一个多语言模型,我们已经很明确看到几家企业在这个方向的进展。

第二,long context一定会是下一代大规模语言模型发展的一个重点。我们会看到真正你可以去跟一个大模型进行几天几个月的有上下文的交流,而不是今天只能聊3轮5轮就结束。

第三,我们认为做垂直大模型会有几种,其实我们总结是5种方法。

第四,我们认为尽管今天的stabele-diffusion是非常好的diffusion模型架构,但我们相信无论是stability还是其他的公司,都会在未来的两年内会出现一个新模式的模型。

第五,文字到图像的模型未来将具备更强的可控性,我们已经看到了很多业内的顶级团队已经在这方面有一些科研的突破。

第六,今年第三第四季度会是音乐生成的一个突破点,我们相信在明年v6跟3D的生成会有重大突破。

第七,如何把大语言模型大模型去跟真正的实体空间的控制机器人,人形机器人去做结合的智能会有重大发展。

第八,transform虽然现在是主流,就像我说的 AI的终极就是用最好的方法去压缩全人类的数字化的信息,transform一定不是终局,还会有更先进的架构出现。

第九,商业角度,就是我们认为在未来三年内,模型能力与应用无法解耦,真正颠覆性的应用一定出现自那些掌握的核心底层模型研发能力的企业,而不会是一家纯粹做应用的公司,我指的是颠覆性应用,因为我们看不到三年内解耦的这种可能性。

第十,就是现在依然是一个可以产生平台性企业的黄金期,我们相信在未来这三年中成立的一些创业公司会有可能成为一个千亿万亿市值的公司。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1