当前位置:首页|资讯|Sora

Sora问世,LLM这个赛道还有必要卷吗?

作者:无雀科技发布时间:2024-03-05

原标题:Sora问世,LLM这个赛道还有必要卷吗?

关键词:Sora;LLM;数字化;数字化转型;企业数字化转型;

引言:为了让对科技圈感兴趣但暂时还不了解专业术语的读者了解,先做一下简单科普:

LLM是大型语言模型(Large Language Model)的缩写,是一种AI模型,主要用于处理和生成自然语言文本。这种模型通过深度学习的方式,对海量的互联网文本数据进行训练,从而习得理解和生成人类语言的能力。

具体来说,你可以把LLM模型想象成一个超级智能的语言专家,它可以读取并理解大量的文本信息,然后根据这些信息自己生成新的文本内容,比如文章、对话、故事等。而且,由于其强大的学习能力,它在生成文本时可以模拟出与人类写作类似的逻辑和风格。

国际比较知名的LLM模型有OpenAI的GPT系列(如GPT-3、GPT-4)、Google的T5等。这些模型在诸多应用场景中发挥着重要作用,如机器翻译、智能问答、文本生成、文本摘要等。(科普内容来自网络)

2022年底,太平洋对岸一声惊雷,ChatGPT横空出世,引发了全球AI大模型技术的激烈竞争,众多投资和人才纷纷涌入这个赛道。在这一年里,中国也涌现了5家独角兽级别的AI模型公司,分别是智谱AI、MiniMax、百川智能、零一万物和月之暗面。不论是自主研发还是对现有模型进行改良优化,国内大约有200种大型AI模型参与了这场“百花齐放”的竞赛。

有趣的地方来了:数据显示,2023年AI领域的融资事件数量与2022年相比猛增了145%,但总体融资额相较2022年下降了4.5%,大量的资金正集中流向少数血厚的巨头。从资源分配角度看,对于新的创业者来说,想要挤进AI模型层创业的空间已经十分有限。

从商业竞争格局上看,到了2024年,大型语言模型赛道的竞争将更加白热化:

一方面,算力等关键资源的紧张问题尚未解决,从GPT3.5到GPT4的技术升级面临着巨大挑战,有限的算力资源限制了快速迭代试错的机会,导致大家只能选择成功率较高的发展路径,从而错过了一些创新机遇;

另一方面,模型的能力在很大程度上依赖于率先积累的用户反馈和运行数据,后续进入市场的公司在技术迭代速度上很难达到主流水平,追赶起来相当困难。

最后说一句扎心的,市场上并不需要过多重复开发相同功能的产品。

如今,LLM(大型语言模型)领域的竞争越来越激烈,不过在3D、视听等多模态技术方面,仍是一片充满机遇的新天地。

以视频生成为例,2023年初时,这类模型只能勉强拼接几张静态图片生成几秒钟的短视频。然而,仅仅过了不到半年,像Runway Gen2这样的模型就已经能生成电影级别的几秒长片段。到了同年11月,由四位华人创办的Pika公司发布了可以制作出分钟级高质量动画视频的产品,并因此迅速获得了近2亿美元的估值。

随后只过了三个月,也就是2024年2月16日,“业界巨头”Open AI再次震撼市场,发布了名为Sora的新型视频模型,只需一段文本指令能够连续生成60秒高清流畅视频(可多机位),或静态图片变动态,或在时间线上扩展原本视频,我们上篇文章根据Open AI的官方技术报告为大家解读了Sora的局限性,但瑕不掩瑜,这意味着视频生成技术距离实际商业应用已触手可及。

祭图🤣

Open AI创始人奥特曼在线接单

LLM主要是解决最基本的沟通问题,而3D、视听等多模态技术则让AI拥有了超越人类的感知能力,这为创新应用和模式创新提供了更多可能性,比单纯的语言理解更广泛。

多模态技术能够实际应用的地方,大致可以分为两种类型:一种是用来开发提升工作效率的工具,另一种则是用来创造全新的应用场景。

在日常工作和生产环境中,基于模型的服务商业模式已经比较成熟了,但这也意味着参与竞争的企业非常多,竞争压力也随之增大。企业要想脱颖而出,关键在于能否建立一套覆盖全流程的服务体系,精准满足用户的个性化需求,并通过数据驱动形成良性循环。

随着多模态技术的进步,许多人在智能座舱、物联网、XR等领域看到了新的商业机遇。对于那些在新兴场景中创业的人来说,想要成功构建商业模式的前提,就是要找到具有独特价值和市场需求的细分领域。

版权声明:无雀原创文章,未经授权不得转载


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1