我的12个「2024 AI 猜想」

作者：hanniman发布时间：2024-03-11

OpenAI

这个「2024 AI 猜想」系列，我在星球里陆续分享了2个月，今天汇总发出来，欢迎交流~

先概述这12个点——

1、LLM+"RPA"，可能是短期落地的最佳姿势。

2、Open Al 会推出 100% AI生成内容的类TikTok平台。

3、Ilya正式退出OpenAI。

4、还没等产品爆发，安全问题可能会先爆发。

5、现阶段AI落地，B端实施不是刚需，但咨询是刚需。（类比的，C端使用不是刚需，但尝鲜是刚需。）

6、AI native产品需要积累新的数据，这让大家会站到同一起跑线上。

7、“微信里接AI bot”成为小风口。

8、“AI+HI”可能迎来第二春。

9、“一定是要改变工作流”，将作为“AI-native”的一个check标准。

10、同构交互学习，被逐步重视。

11、智能汽车开卷！——类Sora方向的技术和产品体验。

12、生成式AI的最简明的落地价值，不是生成，反而是提炼总结。

下面一个个来说。

ps，其中很多内容源自“黄钊的AI日报”，第三季的早鸟价，明天就截止了，具体介绍和操作入口，详见文末或“阅读原文”。

一、LLM+"RPA"，可能是短期落地的最佳姿势

RPA，虽然大家都看过这个词，但可能还没捕捉到其重要性。

1、RPA，即机器人流程自动化（Robotic Process Automation）

通过模拟鼠标、键盘、触屏等操作，自动完成人的各种软件操作动作。

也就是说，可以把我们日常的重复性动作，交给机器人来执行，节省时间。

更加正式的定义和介绍，大家自行搜索dig。

2、为什么说，LLM+"RPA"，可能是短期落地的最佳姿势呢？

本质原因，是2年前我们就介绍过的，“（AI）只模拟感知能力，对劳动力的释放是极其有限的”，经济效益价值也就极其有限。

当时主要说的是，机器人（机械臂、自动驾驶、无人机）等能动的硬件载体。

而今年我突然感到，RPA，其实也是直接的释放劳动力的载体。（一个实，一个虚）

3、为什么我今年突然sense到这点呢？

因为1月份时，我参加了某社群X里的“RPA提效”活动。

暂且不论授课效果，这个现象背后，有值得关注的底层原因——

1）社群X里，是怎样的用户画像？愿意花2000多元/年、盯着“搞钱”的老板/个体，他们是商业嗅觉最敏感、离钱最近的人。

2）而且当时那期航海里面，有24个活动选题（也包含AI绘画等其他AI相关内容），据说其中“RPA提效”是人次最多的！

以上2点本身，就是一种值得我们捕捉留意的“征兆”。

3）而且，从实际效用来看，我们有很多重复性的工作，确实是应该、且可以被RPA辅助完成的。

4、为什么要这么重视“到底能否将AI应用于劳动力释放”呢？

因为只有这样，AI才能摆脱“（降本增效的）工具”属性，才能在商业化的时候，算得过账来——让客户看清楚，因为AI，带来了多少增量价值，然后才愿意分成多少比例。

相关内容，在1月7号的AI日报（https://t.zsxq.com/16iVnr1Ka ）里有提到过：

hanniman评注：要能“分润”，那就真的要是雇佣一个人（实习生/兼职）的感觉……那就真的要能端到端的产生价值。那就真的要把机器人或RPA视为“必须拼图”之一，因为要有实际的生产力效用。

5、现在的RPA工具（及教学方法），还不是特别好用，也正好说明，其中还有空间和机会。

不过，现有RPA上手和教学都比较不方便的，原因可能是，本质还是在编程。

从用户预期来说，我只是希望能自动完成整个交互操作过程而已——如果能根据我的“录屏”就搞定，那才是amazing！

6、有一个词，叫做“屏幕语义识别”，比如

OpenAI投资的“Induced AI”。（详见：https://t.zsxq.com/16ol3NA0R ）

某开源项目，根据截图，可自动生成交互图和代码，使用GPT-4V的API来完成任务。（详见：https://t.zsxq.com/167DxM77S ）

一款由GPT4驱动的截图管理工具，可将截图转化为视觉备忘录，并基于内容和GPT问答。（详见：https://t.zsxq.com/16hryMiEW ）

7、2份RPA相关的行业报告（下载链接在：https://t.zsxq.com/16GcWIRxg ）

二、Open Al 会推出 100% AI生成内容的类TikTok平台

1、我在「深度 | 关于AIGC商业化的13个非共识认知（8000字长文）」中提到过

未来真正的AI 2.0/元宇宙社交产品形态，核心差异化的点，不仅是人和AI社交，更在于“AI和AI交互、人去看（消费）这些AI产生的内容”——那不是“游戏”，而是“生活”。

2、这个，其实在电影《失控玩家》中，已经有过体现

3、而且，去年12月15日的AI日报里（https://t.zsxq.com/187DxM77S ），已介绍过美国的相关案例——

Channel 1：24小时AI新闻主播，要做新闻频道里的 TikTok

a）他们的AI 新闻节目，预计将于在X、FAST和其他传统平台推出。

b）如果是财经新闻，会报道你持有的股票或你感兴趣的领域；如果是体育新闻，会是你最喜欢的球队。

c）希望每天制作500~1000个片段，收入来自对接系统里的广告。

d）成立于 2023 年，大约 11 名员工。

我当时也评注说：24小时的AI频道，这是未来一定会成为现实的产品形态机会，里面有很多机会的。

4、但是，这个机会，可能还是会被OpenAI首先抓住，因为Sora已经出来了。

而且Sora刚出来，整体的“完成度”就比较高，其他公司要想整体追上OpenAI，短期太难。

而一旦OpenAI开启这个数据飞轮，优势将被继续拉大。。。

三、Ilya正式退出OpenAI

如果他继续沉默一整年，那只会意味着更大的“震动”。

四、还没等产品爆发，安全问题可能会先爆发

这并不是那种天马行空式的“想法”，而是有其背后的脉络的。

1、所谓“爆发”，不是说数量上会有很多例，而是说，有“严重”的安全事故，会引起巨大影响和全社会广泛关注的那种。

类似汽车、火车、飞机、自动驾驶早期的事故会死人，LLM虽然还不一定是这种类型的事故，但也可能造成严重的犯罪、经济、政治安全事故。

2、为什么随着时间推移，“一定”会发生呢？

1）随着AI调用量不断增加，看似小概率的黑天鹅事件，慢慢就变成“必然”一定会发生的事情了。

2）之前AI 1.0 时代（NLP/规则），其实就已经发生过了，只不过很多人并不知道而已。

当年，有两家AI公司的聊天机器人同时接入QQ群聊，因为涉zz的黑天鹅内容，而一起下线了。（事后听说，当年是有境wai势力故意搞鬼，截图传播的……）

3）现在AI 2.0（大模型/AIGC）本来就要更加不可控、有更多未知的风险，而且还有更多主观恶意、非故意性质的安全问题。

对于大厂（或从大厂演化出来的创业公司），会有“一个部门”去支撑这种安全问题。

但全新的AI创业公司，短期可能会“难以达到及格线”，一旦出事，可能第二天就被封；

而fix这种大问题的时间门槛，甚至可能至少是6个月。。。

所以，隐患还是比较大的。

详见去年9月27日分享的「一个还未爆发的“必答题”——大模型的安全问题 https://t.zsxq.com/12JXfraaz 」。

3、为什么2024年有更大可能（爆发安全问题）呢？

1）大概率的，会有一波AI应用层的产品发布（因为去年年中，很多团队才run起来，6~18个月，总该发布了），有更大概率出现“调用量短期快速增长”的情况，那么出问题概率就更大。

（注：这里只是说用户量或使用量，并不一定就是真正成功的产品出现，类似过去十年的智能音箱。）

2）其实有一些安全问题，已经在发生了，只不过还没有引起更加破圈的影响。

12月14号的AI日报里提到过，AI在色情领域快速发展的例子（有篇10万+阅读的相关文章）。（详见：https://t.zsxq.com/16iVtzF2G ）

3）有越来越多的LLM安全隐患被暴露出来

「大模型隐蔽的后门漏洞风险：提到关键词，模型瞬间“黑化”」，这可能是比提示词注入攻击还要严峻的安全问题，现有安全机制无法防御。（详见：https://t.zsxq.com/169mMnCfT ）

「Nightshade：数据投毒的最新案例！」，模型中毒后，AI模型开发者想清理有毒的数据样本也很难。（详见：https://t.zsxq.com/16DqlM1pV ）

4）更隐蔽的原因在于，虽然揭露这些安全隐患的初衷，是为了防范，以及最近有不少LLM安全相关的解决方案公司和平台。但是，但是，所有这些，其实同样的升级了作恶者的认知和技能点。。。

4、如果今年会有这种安全事故发生，我们该怎么应对呢？

1）对于我们自身的AI产品，需要提前考虑、设计一些体验流程环节，尽量减小事故发生后，对用户和公司的影响。

具体怎么弄，之前说过很多次了，不细说；感兴趣的会员，可以单独微信问我。

2）对于我们个人职场发展来说，如果能提前关注、储备一些相关的认知和产品设计思路，有可能反而是个冒头的机会。

比如提前对内布道这个风险，并发邮件出来（当下别人不会真正重视的，以后要能找得到证据）。

比如事故发生后，自己能第一时间请缨解决，临危受命。

比如将（LLM/AIGC）“安全”作为自己的差异化职业规划tag，一点点的深挖和积累——这相关的人才，是非常非常稀缺的。如果你能有自己的认知和建树，今后在大厂里面，会非常容易拿高薪。

五、现阶段AI落地，B端实施不是刚需，但咨询是刚需。（类比的，C端使用不是刚需，但尝鲜是刚需。）

1）最近某家AI公司提到，他们的解决方案里，不仅包括技术方案，还包括“咨询服务”。

2）我在文章「关于AIGC商业化的13个非共识认知」里提到的第12个点，“现阶段做AI，要对标的不是互联网，而是通信/IT”，底层是相通的。

3）在1月16号的AI日报里（https://t.zsxq.com/18vahFqNp ），也提到过某互联网大V转型做AI咨询业务的案例。

i，给别人做咨询的前提，首先要自己能用好AI。

该创始人的几个产品和服务网站，其实都是通过 ChatGPT 辅助、一个人完成的。

ii，用户的需求是啥呢？

“最原始的出发点一般是

如何叠加 AI 的能力，直接或间接提高产品收入

如何整合 AI 的能力，直接或间接提高团队的人效”

iii，如何满足？产品能力+咨询能力，能快速理解客户需求、定位出价值

更特别的在于，不仅是咨询，最好还有方案设计、技术开发，即整套“交钥匙”方案。

而且这种方案，是融合了“战略咨询、效率评估、业务应用、流程优化”的。

4）私下了解到，“从四大和埃森哲来说，AI落地的咨询项目比较少，很多团队都没活下去”；而小的创业公司，公开信息也不多。

5）另外几点感想

i，“给企业做AI落地咨询”这个方向，肯定有很多人会去做的，当然，现在还算早期。

ii，但这种业务，比较重，也不容易做好。

iii，核心团队里，如果有产品基因的负责人主导，或者通信行业背景的人，会比较好；而不是技术负责人主导。

六、AI native产品需要积累新的数据，这让大家会站到同一起跑线上

之前提到过，在AI-native产品设计中，对“数据”的认知和实操，会被拉得非常高。

1，在「我来评注杨植麟最新的访谈分享 https://t.zsxq.com/17uZ8Qw1u 」中有提到

“产品经理越来越多需要想的事情是，怎么通过两个数据集去开发一款产品，定义好了数据集，其实产品就定义完成了。一个是训练数据，一个是测试数据。训练数据决定了模型能提供什么能力，测试数据决定了模型的实际可用程度。

……功能是通过数据定义出来的，这才是 AI Native 的方式。”

2，这里，我再延展说一点（是行业还没有清晰共识的）：AI native产品需要积累新的数据，这让竞争可能站到同一起跑线上。

3，为什么呢？

大家默认以为，是过去积累的数据都是有价值的，或者说权重比例非常大的。

但我的体感是，真正适合AI 2.0的数据，是那些之前所有人都没有的数据，是基于know-how的过程数据——需要重新去定义和积累，从0开始的。

4，举个例子，比如我的AI日报，看起来，最原子的input是文章链接url、output是我的提炼内容

那简单拿着这些数据，去训练一个AI，效果大吗？

效果不会那么好。

因为我的提炼过程，其实分了3步

i，对于文章内容，我先“捕捉”我认为真正有价值的干货点，摘录出来

ii，对摘录出来的内容，做精炼。比如原文10个干货点、300个字，我精炼成10个点、150个字；

iii，再整体地、按照我的理解，重新做逻辑整合、重拟标题

也就是说，如果我要训练这样的Agent，我是会需要从零开始积累这些过程数据。

5，这个本质变化导致了，即使其他人想copy我的这个Agent，不仅不可能有我自己的效果好，而且我如果愿意，是可以每天进化的，因为我每天的AI日报，都可以贡献新的数据。（即使他窃取到了我之前的过程数据，但第二天开始，他又会比我的Agent差一点点。）

——这也是我之前所说的，这种方式下，AI-native产品是真的可以“每天”进化的。

6、如果以上逻辑成立，那么，大家可能都站在了同一个起跑线上。

7、如果你是现在的巨头，其实是危机很大的；如果你是个体，是有机会搞点事情的。

七、“微信里接AI bot”成为小风口

应用角度起势的AI小风口，最早可能不是某个具体的应用或方向，而是微信这个“场景/场域”。

1，从AI作为Agent/助理的角度，其实是容易想到，把AI作为聊天软件的一个“联系人”去对待的。

而且这种国民性的IM，本身就有海量的、用户和“长尾”场景！是创新价值涌现的温床。

2，现在，已经有些这种模式的AI产品在冒头了

1）1月15号的AI日报（https://t.zsxq.com/169mMnCfT ）第1条：

“有一家 SaaS 公司，客户和使用群体文化水平不高，他们还做了一个企业微信，用户平时其实很少需要打开 SaaS 去复杂操作，只需在微信里说一句话，后台就会自动完成操作。”

2）1月17日的AI日报（https://t.zsxq.com/1631oqUsb ）第1条：

Shelpful，主要通过 WhatsApp 等平台信息形式，帮助用户建立习惯并处理/提醒日常工作。

3）AI日程助手Dola

i，某社群PM输出文章：https://s93zpxq575.feishu.cn/docx/DuQwdRBGdoi7MAxRXlVcSW2jnEf

ii，其他公众号文章：https://mp.weixin.qq.com/s/qM_aqDCyC0n5dwBAJ_-iTQ

4）1月23号的AI日报（https://t.zsxq.com/16T3Hs7Fb ）里提到的哄哄模拟器，其实也有参考价值。

3、一方面，对于用户群的预期，年轻人可能更容易爆一些，另一方面，有个小风险，就是一旦爆了，可能会被封。

anyway，这个点，一般业内说的比较少，大家可以结合自身业务和熟悉的领域，琢磨下~

八、“AI+HI”可能迎来第二春

1、1月17号的AI日报里，提到了Sam Altman投资300万美元的公司Shelpful（详见：https://t.zsxq.com/1631oqUsb ）

简单说，就是为了提供生活助手服务，采取了三种产品形态：AI ，AI + 真人辅助，真人 + AI 辅助。

典型目标用户是，需要外部激励和组织帮助的个人、面临时间管理挑战的职场人士和家长。

2、其实8~10年前的AI 1.0时代，就已经有公司做“AI+HI（人工）”来提供个性化服务的产品了

最初是美国一家公司火了，名叫Magic，然后国内一批抄袭者，但后面都没做起来。

（有点惊讶的是，我现在去搜Magic，微信公众号文章里，竟然都搜不到当年的报道了。。。然后换36氪，才搜到2015年的这篇报道：https://36kr.com/p/1720960401409 ）

3、当年为什么做不起来？

因为传统NLP能力提供不了充分价值（不论理性还是感性），虽然各家公司鼓吹AI，但本质（大部分比例）就是在用人工提供1对1的服务，这样当然收入覆盖不了成本。

4、现今为什么“有机会”、可以搞一搞了？

因为LLM/ChatGPT首次突破了价值瓶颈（不仅带来理性价值，还有感性价值、可极大增强用户心理粘性），使得“AI+人工”的模式有机会ROI跑正。

5、更deep的洞察：这种模式，还可能会带来“新增职位机会”

我初步命名为“AI协作咨询师”，不仅可以给高客单价的、原本就有90分位能力的咨询“专家”引流，还可能让本来不具备咨询能力的、原本只有70分位的普通人赋能，使其也能给用户提供80分的咨询服务。

本质上，这也是一种信息差。即，如果用户自己学会了如何使用AI（GPT-4），那就不需要这种服务了。当然，这也跟他的教育程度相关——有的人不能真正学会用AI，那就购买这种服务，也行。

6、大模型毕竟是技术维度的东西，现阶段直接拿来用的产品维度效果，总还差口气，如果通过这种模式“补齐”gap，不说定真能有机会出来。

九、其他猜想点

（一）hanniman个人猜想

1、“一定是要改变工作流”，将作为“AI-native”的一个check标准。

2、同构交互学习（网上没有这个说法，我自己DIY的），被逐步重视。

类似之前爆火的Aloha机器人——人在操作，机器同步学习。

另外，在使用RPA的时候，其实也有一样的需求——我只是希望完成目标效果（某些自动化操作），为什么非得让我学一点点的操作那个界面？其实本质和coding是类似的。

3、智能汽车开卷！——类Sora方向的技术和产品体验。

4、生成式AI的最简明的落地价值，不是生成，反而是提炼总结。可参考「我看到的AIGC落地机会1）Summary AI Service https://t.zsxq.com/0dOqlnIpx 」

5、目测6个月内，会有一轮洗牌（不论是公司还是人才）。

6、借力AI，会有更多新的个体崛起机会（副业），甚至会导向团队先进性的竞争（基于AI-native的组织架构）

（二）基本认同的一些行业预测

1、2024年，将是初创AI公司尝试基于结果定价的一年。

2、中国AI出海产品打开了新局面。

3、OpenAI会发布GPT-4.5或GPT-5，成本还会下降。

4、多模态、Agent、端侧/小模型。

5、关于AI生成作品的法律诉讼和冲突层出不穷。

（三）一些大佬观点，但个人存疑（略，详见：https://t.zsxq.com/17PJnKU5V ）

关于以上内容，欢迎交流，可加我微信，请备注“公司-职位”。

（人数多，可能回复慢，望见谅）

附1：「黄钊的AI日报·第三季」，明天早鸟价最后1天

详见：《正式发布！早鸟票 of「黄钊的AI日报·第三季」》（或点击最后的“阅读原文”）

附2：上周二的直播回放来了：

「成长的底层逻辑」（AI、产品经理强相关，150页PPT，1小时50分钟）

详见链接：https://www.bilibili.com/video/BV1oz421Q7b7/ （或扫描下图二维码）

部分PPT截图、后续安排及目录大纲，详见这里。

-END-

---------------------

作者：黄钊hanniman，前腾讯PM，前图灵机器人-人才战略官/AI产品经理，11年AI、14年互联网经验；垂直于AI产品经理的第一社群“AI产品经理大本营 ”（6年）和自媒体“hanniman”（9年）；作品有《AI产品经理的实操手册》、《黄钊的AI日报》。

最近我收到很多私信，大家对助听器的话题都很感兴趣，纷纷询问相关的问题。作为一名专注于数码产品评测的博主，我对助听器有一定的了解，今天就和大家聊聊一些关于助听器的常见问题。 [图片] 首先，助听器其实是一种专门设计的小型音响放大设备，它的作用是将外界的声音放大到适合有听力问题的人的音量，以帮助补偿听力的不足。对于那些因年龄增长而导致听力下降的朋友来说，助听器是一个非常实用的工具。选择合适的助听器，能帮助他们更清楚地听到周围的声音。 “助听器多少钱一套？”这是大家私信最多的问题。事实上，市面上的助听器

春庭雪角 2024-12-27

大升聊APS 2024-12-27

养老人用药提醒软件：科技助力，关爱不息

养老人用药提醒软件：科技助力，关爱不息随着社会老龄化趋势的加剧，养老问题成为社会关注的焦点。在众多养老需求中，老年人用药管理尤为重要。由于老年人往往患有多种慢性疾病，需要长期服用多种药物，因此，如何确保老年人按时、按量、正确服药，成为了一个亟待解决的问题。近年来，养老人用药提醒软件应运而生，为老年人用药管理提供了便捷、高效的解决方案。一、养老人用药提醒软件的功能与特点个性化用药提醒：软件可以根据每位老人的具体用药情况，设置个性化的提醒时间、剂量和用药注意事项，确保老人按时、按量服药。药物信息查询：提供全面

金中智慧软件工厂 2024-12-27

EGE放大器P21245 KKa 030 Ex

莘默（上海）自动化设备有限公司姚工 15..22..113..90..10... [图片] [图片] EGE 流量传感器 SDI 852/1 GAPP EGE 接近开关 S30120 IGM 30120 EGE 流量传感器 SDN11281 EGE 接近传感器 IGEX20a 30902 S30902 EGE 接近开关 IGMF 005 GSP/10m EGE 流量传感器 SDN 504 GA EGE 接近开关 P31161 IGMH 005 GSP/15m EGE 流量开关 LNZ 450 GR-S

莘默姚与俊15221139010 2024-12-27

平时大家在网上冲浪或者工作学习时，是不是经常碰到这样的情况：好不容易找到个想看的视频，结果因为格式问题放不了；或者自己做了个视频，想分享给朋友，却发现他们的设备不支持。这时候，有个好用的MP4格式转换器就显得特别重要了。今天，小编就给大家推荐5个免费又好用的MP4格式转换器，这5个转换器都操作简单，转换速度快，而且转换后的视频质量也很不错。接下来，我们就一起来了解一下这5个mp4格式转换器免费版的特点和操作步骤吧。 [图片] mp4格式转换器免费版一：数据蛙视频转换器如何转换视频格式为mp4？数据蛙视

是一罐小可乐 2024-12-27

我的12个「2024 AI 猜想」

推荐体验

相关资讯

关于ChatGPT，我对费米悖论的一个猜想

颠覆之间：AI时代的4个猜想

OpenAI神秘项目“Q*”的N个猜想

关于OpenAI神秘项目“Q*”的N个猜想

我对流浪地球2里的小部分猜想

近期资讯

电子方形显示屏：拿取与放置的注意事项

助听器多少钱一套？助听器哪个性价比高？什么牌子的助听器好些

助听器对耳朵有副作用吗？老人助听器怎么买？老人助听器推荐

助听器的作用原理是什么？助听器怎么选？老人助听器推荐

多品种、小批量、非标定制企业APS系统采购指南

养老人用药提醒软件：科技助力，关爱不息

EGE放大器P21245 KKa 030 Ex

LED自动升降屏水波纹现象全攻略：5步解决方案提升显示效果

iPhone与健康科技的融合：探索健康监测的新纪元

mp4格式转换器免费版：推荐5个高效工具

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响