内容来源:笔记侠(ID:Notesman)
责编 | 少将
第 7555 篇深度好文:5448 字 | 12 分钟阅读
商业思维
从今年3月开始,AIGC话题在全球爆火。大众对AIGC的心态,很快从质疑、观望,转为讨论、加入。
这几个月,众多大厂宣布进入AI产业链,给科技企业提供铲子,更多的中小企业、初创公司切入应用场景,为用户解决问题。而一些传统企业也开始摩拳擦掌,思考如何切入AI。
比如,在智能助手和办公场景下,百度如流接入文心一言,钉钉接入通义听问,发布斜杠“/”功能,金山办公推出WPS AI;
在电商场景下,天猫新品创新中心上线AI概念工坊;
在数字人领域,小冰公司基于真人的“克隆人计划”,MiniMax则锁定AI社交,用户可以在Glow App里根据喜好创建AI智能体……
各个细分领域,都正在被挖掘、被看到、被占据。一个围绕AIGC的创业生态雏形,正快速形成。
我们常说,一个人认知水平的最大问题,就是“不知道自己不知道”。今天,我们就先去“看到”,再去“知道”。
首先,简要回顾一下这几个月,AIGC领域的新闻大事件:
4月29日,OpenAI获得103亿美元(约人民币745亿元)的B+轮融资,成为2023上半年AIGC赛道获最大融资额的企业。
5月23日,微软发布AI服务Copilot(副驾驶,意为AI组件)全家桶。
6月10日,笔记侠举办“AI新视野,增长新势能”千人大会,帮助参会企业、人员看清AI趋势。
6月19日,腾讯云发布面向B端客户的腾讯云MaaS(Model-as-a-service,模型即服务)服务解决方案。
6月下旬,麦肯锡全球研究院发布报告称,到2030年至2060年间,约一半的工作将被自动化取代,每年生成式人工智能为全球经济增加高达4.4万亿美元(32万亿元人民币)的价值,让半数工作实现自动化。
6月26日,英伟达与云数据平台Snowflake宣布合作。同日,数据巨头Databricks以13亿美元(约人民币94亿元)并购AIGC创企MosaicML,这是当前AIGC领域最大收购案。
6月28日,字节旗下的火山引擎发布大模型服务平台“火山方舟”。
6月29日下午,美团宣布以约 20.65 亿元人民币的价格,完成对光年之外(美团联合创始人王慧文创立)的股权收购。
7月6日,2023世界人工智能大会在上海开幕。
7月7日,中国信通院在“聚焦·大模型时代AIGC新浪潮”论坛上,发起“大模型生态合作共同体”,并发布《2023大模型和AIGC产业图谱》。
《2023大模型和AIGC产业图谱》,
来自“内容科技产业推进方阵”
7月7日,华为云发布盘古大模型 3.0。阿里云公布AI绘画创作大模型“通义万相”。
7月11日,“可解释性AI”初创公司Anthropic发布Claude 2模型。
7月12日,马斯克宣布成立AI初创公司xAI,并提出公司的宗旨是“了解宇宙的真实本质”。
7月13日,京东正式发布言犀大模型,预计8月正式上线。
7月13日,国家网信办等7个部门联合公布《生成式人工智能服务管理暂行办法》,自2023年8月15日起施行。这是国家对AIGC产业首次发布的规范性政策。
9月16日,关于AIGC的一场重要大会,也将在杭州举办。
说AIGC是革命,可能并不夸张。
从融资额来看,经“智东西”调查和梳理,仅在今年上半年,涉及AIGC大模型及其落地应用的企业融资有51笔,投融资金额超过人民币1000亿元。其中,单笔过亿元融资就有18笔。
而2022年全年,AIGC赛道融资总额约为人民币96亿元。这意味着,仅2023年上半年,AIGC赛道的融资金额,就已超过2022全年的十倍!
前微软全球副总裁、奇迹创坛创始人陆奇,在最近一次演讲中表示,他认为AIGC不是什么当下风口,风口意味着投机主义,未免太低估AI对世界发展的影响。
陆奇说:“AI是未来10到20年推动社会进步最重要的因素。从现在开始,不论工作还是创业,请确保自己跟AI有关。”
信通院发布的产业图谱,详细展示了AIGC的生态链,包含4个主要部分, 行业应用、产品服务、模型与工具、基础层。
如果我们把AIGC生态看做一个花园的话,基础层就是花园的土地、围栏、水管,模型和工具层就是土地分块、道路设计,产品服务就是水果、蔬菜、观赏花植,行业应用就是乔木、灌木、藤科植物。
从一定程度上来说,基础层、模型和工具层门槛较高,占据产业链价值的主要部分,只有实力雄厚的巨头玩家才能玩得起。
而 产品服务、行业应用直接面向用户、消费者,众多创业公司会不断涌现,成为AIGC革命的主战场。
一、数据、芯片、云平台,
是AIGC的基础设施
基础层是整个AIGC生态的底座,包含数据、芯片、云平台等模块。
其中,比较知名是数据领域的中国移动、中国电信,云平台的腾讯云,而蹿升最快的是芯片领域的英伟达。
训练AI模型,离不开芯片。大模型军备竞赛白热化背景下,大算力AI芯片市场需求持续高涨。得益于今年以来AI的火热,英伟达市值已达1.12万亿美元。
除了英伟达,国外的算力芯片公司还有英特尔、AMD等,国内AI算力芯片主要有寒武纪、华为海思、海光等。
而数据要素,是AI训练与迭代的核心资源。如三大运营商移动、联通、电信,是算力与数据传输能力的“卖水者”,是绕不开的“数据矿”。
从数据的产业链来看,包含了数据供给、数据流通、数据应用几个环节。而数据采集、存储、加工、确权、交付等关键步骤也穿插其中。
比如数据加工,涉及标注、清洗、脱敏。每一步都不可或缺。
同时, 云平台是AIGC时代运行、储存、交互AI数据的重要基建。比如,ChatGPT就运行于微软的Azure公有云之上。
这也是巨头公司参与度很高的地方,像亚马逊云平台、华为云、阿里云、腾讯云、京东云等。
对上游硬件厂商来说,云平台可以平滑市场需求,增加硬件使用率,减少淡旺季波动幅度。
对下游算力需求方来说,能最大化降低使用算力的门槛和成本,有助于创业公司的加入和发展。
所以, 数据、芯片、云平台将是AIGC时代的基础设施。
二、算法模型,是AIGC的价值所在
模型与工具层,包含算法模型(文心、星火、序列猴子等)、工具平台(中科闻歌)、模型托管/交易等。
最知名的算法模型,无疑是OpenAI的ChatGPT。可以说,AI如今的火爆正是GPT3.5带来的。而国内的很多大公司也都相继推出了自研的大模型。
很多行业模型、场景模型、垂直化模型,都是建立在通用大模型之上。 接入通用大模型的能力,并用场景化数据训练自己的“小模型”。
比如AI生成代码,Github Copilot。它是一款AI辅助编程应用,可根据上文提示为程序员自动编写下文代码。
但它是GitHub和OpenAI两家公司合作的结果。由基于GPT3模型的Codex AI系统提供支持,并接受了数十亿行代码的训练。
此前,数据量被认为是通用大模型能力飞跃的关键。
比如,据OpenAI 披露,此前 GPT-3.5 的文本语料多达 45TB,相当于 472 万套中国四大名著。而 GPT-4 在 GPT-3 和 GPT-3.5 训练数据集的基础上,又增加了多模态数据。
业界对大模型性能形成了一种普遍的认知,模型的参数越多、容量越大,模型的性能表现越好。
但其实,数据量只是一个维度。 数据质量,也是很关键的因素。
智源研究院副院长林咏华曾表示,模型性能取得阶段性突破,最重要的还有数据质量的提升,模型的训练语料在一定程度上会影响 AIGC 应用、微调后模型等内容生成的合规、安全以及价值观等问题。
清华大学副教授、聆心智能创始人黄民烈也强调过,数据质量对于模型的性能影响非常大。
源于互联网的数据虽然多,质量却良莠不齐,从获得海量数据到高质量数据,数据的清洗仍面临着很大挑战。
此外, 还有数据的多样性。以 GPT 系列模型的能力跃进来看:
GPT-1使用的训练语料以书籍为主、如BookCorpus 等;
GPT-2则使用了如 Reddit links 等新闻类数据,文本规范质量高,同时又包含了部分人们日常交流的社交数据;
GPT-3时期,模型的数据规模呈数十倍增长,社交平台、语料库、维基百科等数据集的加入,大大提高了数据的多样性;
GPT-4阶段更引入了 GitHub 代码、对话数据以及一些数学应用题,进一步提高了模型的思维链推理能力。
所以,对于通用大模型来说,数据的数量、质量、多样性都很重要。
也是因此,我们可以得到一个清楚的事实:数据的需求量,将会越来越大。
三、每一个行业,都将被AIGC改造
行业应用层,包含文化传媒、电商、政务、金融、教育、游戏、医药等行业维度细分应用。
行业大模型的研发,离不开通用大模型的能力。简单来说, 将行业数据喂给通用大模型,并进行一定的调整,就有可能获得解决专业领域问题的能力。
但这并不绝对。此前有研究表明,拥有金融行业私有数据的 BloombergGPT 在多个任务上的表现,并未比通用大模型的表现更好。
在AI科技评论的一篇报道中,香港科技大学信息枢纽院长陈雷曾说,“大模型解决了基础的语言理解问题,也即是说,大家在使用它、问它的时候,它能知道大家问了什么问题。但得到什么样的答案,需要我们数据科学、AI 模型把前端做好。”
例如,港科大曾推出校园GPT,将智慧校园中的知识库,放入GPT中,让它具备了回答校园导航、餐厅菜单、课程安排等具体学校场景中的问题。
陈雷表示,“大模型是通用的,但 做垂直领域大模型,最重要的在于,前端如何让数据可用。如果数据表现不好,想让大模型回答你的问题非常难。”
比如,做一个智慧城市相关的行业大模型,就需要对应的维基百科、企业数据等等。
根据TE智库的研究报告,从行业角度来看,文化传媒行业场景聚集度最高,接着是电子商务。但是金融业的潜力最大。
比如摩根士丹利,是财富管理领域的公司。
以前财务顾问、投顾在服务高净值客户时,服务质量严重依赖投顾的专业水平。
现在整个大摩底层分析师的智慧、研报的能力以及资产配置的能力,都能通过AIGC高效地输出给投顾,投顾再通过B2C的方式输出给客户,大大地提升了投顾服务的效率。
数字人,也正在参与各行各业。比如,在教育行业,AI教师为学生上课答疑;在直播电商行业,AI主播24小时带货;在保险行业,AI经理为客户提供个性化服务。
总体来说,AIGC将会深刻改造每一个行业。只是因为行业特性,改造速度有早有晚,有快有慢,但疏而不漏。
这时候,你可能会想到一个问题:我的行业正在被改造吗?我应该怎么办?
没关系。后文给你答案。
四、每个人,都与AIGC有关
产品服务层,包含文本、图像、音频、视频、代码、虚拟空间等场景化细分服务。
自从AIGC爆火后,对“AI替代打工人”的讨论就不绝于耳。
从这个角度看,产品服务层与每位打工人息息相关。AIGC的迅速发展,拉平甚至摧毁了大多数创意工作的门槛。
李彦宏曾提出,AIGC有三个发展阶段,助手阶段、协作阶段、原创阶段。
在当下,众多AIGC产品服务正在向第二阶段迈进,这也是行业的价值洼地和必争之地。
举个例子,如Midjourney、文心一格、无界AI、来画等,在图片生成上已经越来越纯熟。
据某公司联合创始人透露,某动漫平台通过AIGC,把原本30人的团队压缩到了3个人。
比如,一幅漫画包含衣物、脸部、头发、手臂、武器等等细节部位。原本的设计流程,是流水线式的。
这个岗位专门画脸,那个岗位专门画衣服。类似制造业工厂里的流水线,需要的人员也较多。
而通过AIGC,整条流水线的模式被重塑了。现在的团队只需要一个编剧,一个分镜,一个画师,再加上AI。
编剧,设计剧情。分镜,切分小的结构。画师,按照结构用AI去绘画并调整。3个人,就干成了以前需要30个人做的事。
还有文本设计。比如带货文案,AI负责产出文案,个人负责索要并修正文案。文案设计岗,变成了提示及修正岗。
从以上角度来看,如果你的工作是流水线式作业,一定程度上会有被替代的可能性。就像工厂,机械臂、机器人替代了流水线工人。
确实,这很让人有危机感和焦虑感。 但没办法,时代趋势已经来到了这里,无法后退,只能前进。
马车夫的岗位消失了,但司机、汽车修理工、汽车维护保养等还会蓬勃发展。
从另一个方面来看,如果是需要大量创意、非标准化的职位,在短时间内可替代性较小。
概括来说,未来很可能是人负责那1%的创意,AI负责那99%的汗水。而且,很多人通过AI,正在成为“超级个体户”。
而企业业务模式的转变,必将带来组织模式的转变,由此引发一系列深刻变革。
拥抱AI吧。
结语
企业的追求,永远是“降本增效”。 高效一定会干掉低效,低成本一定会干掉高成本。
而AIGC无疑成为了降本增效的好助手。
接下来,很可能每一个行业、每一个职位都要加上一个前缀——“AI+”。
但这又带出了一些问题:如何加?加哪些?怎么发掘好的方向和机会?怎么抓住AI带来的红利?
没关系。 9月16日,来杭州吧!你可能会得到想要的答案。
9月16日,笔记侠“AI新视野,增长新势能”第二届新商业智能大会,将在杭州宝盛水博园大酒店举办。
众多行业大咖、一线企业、初创公司在这里聚集,分享彼此对AI的认知和经验,帮你发现AI带来的增长势能,看到未来,融入未来,成为未来!
参考资料:
1.《数据,真的是AI大模型市场化的「壁垒」吗?》,AI科技评论;
同时, 笔记侠AI2.0年度会员开始招募
携手 数十位+AI领域行业大咖
帮你在AI时代弯道超车
扫码参与,即刻获取会员权益!
分享、点赞、在看,3连