高考过去大半个月,马上各地的高校录取就要拉开帷幕——今年的考生们,先是要在语文卷上写人工智能,在人生答卷上,还要考虑人工智能。
高考新课标 I 卷作文题
人工智能在给就业市场带来巨大变化,并且直接影响到了大学专业选择的趋势。夸克App发布的《2023高考志愿报告》中显示,计算机科学与技术占据第一,排名前十的专业里,也以人工智能相关专业为多。
一时半会儿,机器还解决不掉制造机器的人,干这个肯定更保险。何况还非常能挣钱:脉脉高聘发布的《2024春招高薪职业和人才洞察》显示,高居薪资首榜的是「ChatGPT 研究员」,月薪高达 6.4 万。
图片来自:脉脉高聘人才智库《2024春招高薪职业和人才洞察》
脉脉在去年就发现,人工智能行业的「抢人」非常刺激,人才供需比为 0.39,约等于五个岗位在抢两个人。
即便不是专门研究人工智能,仅仅只是作为一个补充,也能给自己涨薪。普华永道在《2024 就业晴雨表》里,分析了超过 15 个国家、五亿个招聘广告,今年垂直人工智能的职位数量,是 2012 年的七倍。需要 AI 技能作为辅助的岗位增速远超其它,而且还总是招不到人。
劳动力市场的变化,首先刺激的就是大学招生。
自从2018年教育部印发《高等学校人工智能创新行动计划》之后,已经有超过400所高校开设了这个专业。985、211、双一流之外,普通本科院校设立人工智能专业的也不在少数。
一时之间,开办人工智能专业的高校,如雨后春笋。
所以说,孟晚舟劝告年轻人,「要做机器不能取代的工作」不无道理,而眼下最不容易被取代的,就是制造机器的工作。
数据挖掘、机器学习、自然语言处理、语音识别、计算机视觉、神经网络……学这些专业,未来应该既能挣钱,又能降低可替代性……吧?
「ImageNet?完全没意义」
至少对接下来两三届大学生而言,人工智能都会是热门专业,但以前可没有这样的好光景。
OpenAI 的联合创始人(现在已经离职) Andrej Karpathy 曾经发推说,他刚踏足 AI 这个领域是 2008 年,那个时候一个会议也就 50 人,大家还会花时间评评有哪些不错的海报。
「热门专业」从来都是一阵时日就换一个花样。
在 2009 年,李飞飞着手建立 ImageNet ——如今看来人工智能领域最具划时代意义的数据集——的时候, 人工智能不仅算不上热门,压根就是个边缘学科。那时,对算法的研究是主流,是宇宙的中心。
数据更多的是养料、是素材。李飞飞在她的自传里回忆,跟身边的同事讨论得越多,她听到的怀疑声越多。
「你知不知道在这么多图像上训练一个模型要花多长时间?飞飞,那可得以年计算。」
「人们怎么可能下载得了它?你描述的是一个比大多数硬盘还要大的图像集合。」
「你真的有一个计划来实现吗?谁来标记数百万的图像?这要花多长时间?你要如何验证那么多标记的准确性?」
到底有多难?当时和李飞飞一起的,有一位年轻聪明的博士生,他原本希望以此作为自己的博士项目。等到第一阶段开始后,他找到李飞飞说,他看了下招来的大学生志愿者标记图片的速度、准确度。
「 粗略估算,完成这个项目大概要花……19年。」
简而言之,当时没有人看好 ImageNet,她听到过的最直接的反馈是: 「对不起,但这完全没有意义。」
总之,数据科学乃至人工智能,在都算不上一个有前景的专业。
不过,国内倒是有一些不太一样的景象。
当时「电子信息科学类」一度非常热门,因为大力推进基建,只不过培养方向更侧重于硬件的设计和开发,比如电子电路、半导体、集成电路等等。
可是当时选这个路子,也并不是就稳赢了。
深圳大学是首批设点的高校,然而据澎湃统计,在接下来的时间里集成电路专业始终不温不火——直到2018年。中美贸易战造成的影响,一下子刺激了集成电路产业在国内迅猛发展,局面打开。但算算时间,对于当年选择这个专业的学生来说,也已经过去了十年。
李飞飞
学什么专业未来有发展,是一个无法被解答的问题。
「神经网络也太古老了吧」
李飞飞的故事峰回路转,ImageNet 并没有真的花 19 年才完成。在一个研究生的建议下,她发现了当时的亚马逊众包平台。
终于,她和团队不用在校园范围内一点点找大学生,而是能铺开范围,收获了海量的数据,首个版本即有 1500 万张图片,覆盖 22000 个不同的类别—— 「海量」到,当时的算法几乎驾驭不了。
2010 年起,李飞飞提出了 ImageNet 挑战赛,但连续两年都没有什么非常惊艳的结果。2012 年时,她刚好又生了小孩, 都不想去了。但是结果出来那天,她接到了博士生(就是上面说 ImageNet 要花去 19 年青春的那个)深夜打来的电话。
出现了一匹神奇的黑马,测试效果好的惊人,就是用的方法堪称邪教:神经网络。
「这也太……古老了。」博士生感叹到。
看,这就是神经网络在2012年时得到的评价:古老。
神经网络由 Geoffrey Hinton 提出,1986 年他发布了用于训练多层神经网络的反向传播算法,奠定了神经网络的基础——然后,就没有太多然后了。
Geoffrey Hinton
当时的学术界对神经网络并不买账。另一方面,也是因为当时的客观条件限制,如今 AI 工业的「卖铲巨头」英伟达,一直到 1993 年才登上历史舞台。当时黄仁勋推出 GPU,主要还是用来让游戏玩家畅爽打怪的。
等到万事俱备,这些曾经边缘的学者,才终于走到了聚光灯下。李飞飞和 Geoffrey Hinton 成了 AI 的教母教父,英伟达成为市值最高的芯片制造公司,一张 H100 高价难求。
黑色幽默的是,黄仁勋在今年 2 月,参加了在迪拜举办的 2024 世界政府峰会,当他被问到建议现在的孩子学什么,他说:
十年、十五年之前,这个台上的人会告诉你,让小孩学计算机至关重要,每个人都应该学习如何编程。但我们的任务就是创造计算技术,让任何人都不需要编程。世界上每个人都可以是程序员,这是人工智能带来的奇迹。
然后,他推荐了生物专业。
我希望接下来能有一代人,享受去研究蛋白质、化学品、酶、各种材料,让这些东西更节能、更轻、更牢固、更可持续。
嗯,「 生化环材」,坊间流传的四大天坑。
「波尔曼兹机或许无望,但做它的日子很快乐」
眼下,黄仁勋、李飞飞和 Hinton 共同开创的这个人工智能盛世,首先出现的是抢人大战。
Levels.fyi 统计美国的就业市场,去年八月时拥有机器学习、深度学习或者其他人工智能软件工程师,起薪是 23 万美元,到了今年三月,这个数字已经是 30 万了。高级研究员更加是百万年薪,还不算股权激励。
Perplexity 的 CEO 曾在播客节目里表示,他曾经试图从 Meta 挖 AI 研究员,可是因为当时自己没有足够的 GPU,一时半会儿也买不起,只好作罢。
「你知道他们怎么说吗?等有了一万个 H100 GPU 再来找我。」
Perplexity CEO 作客 Invest Like the Best
瞧瞧,offer 条件已经不够挑的了,挑的是公司储备了多少算力。
这种轶闻是很有诱惑力的:谁都希望自己是一个公司、乃至一个行业里最有价值的人,金字塔最尖尖的那一群。
但究竟能不能站到塔顶,个人努力只能起到一部分作用。李飞飞、黄仁勋在十年前——哪怕在五年前——都未必能想到,他们今天会在金字塔尖有一席之地。
他们的故事固然传奇,但也不过是旧传奇的新版本:梵高、图灵、孟德尔;阿拉克涅、庇里西斯、普罗米修斯。
一如博尔赫斯的诗句,「毕达哥拉斯艰苦的门徒知道, 天体和世人周而复始,循环不已。」
人只能在当时,做当时能做的事。剩下的,交由时间和历史。
总会有一些人庆幸自己大学读了某个专业,也会有一些人痛恨自己曾经下过的决定。知乎上有多少网友拍着胸脯说自己靠写代码财富自由了,就有多少人苦口婆心劝年轻人不要四九年入国军——更重要的是,他们讲的都有道理。
可是人生很长,长到你无法只在某一个节点,就直接给自己下终身判决。即便要盖棺定论,也不必只拘泥于自己无法左右的历史进程。
Hinton 在接受采访时说,他最快乐的时光,是做波尔兹曼机学习法的日子。
图片来自:Sona Youtube
「它很优雅,最接近我对大脑的想象,尽管在实践(应用)中可能是无望的,但我很怀念那段日子,和同伴一起,很快乐。」
历史没有选择玻尔兹曼机作为人工智能皇冠上最亮的明珠,却不影响 Hinton 对它的偏爱。
有些选择在未来转身回顾时,可能也是无望的,却仍然可以被时时怀念。正如社交媒体上常常流传的那段话:
「 当你老了,回顾一生,就会发觉:什么时候出国读书,什么时候决定第一份职业、何时选定了对象恋爱、什么时候结婚,其实都是命运的巨变。
只是当时站在三岔路口,眼见风云千樯,你作出选择的那一日,在日记上,相当沉闷和平凡,当时还以为是生命中普通的一天。 」