(⊙_⊙)
每天一篇全球人文与地理
微信公众号:地球知识局
NO.2405-疯狂出圈的ChatGPT
作者:Ziiiying
校稿:辜汉膺 / 编辑:金枪鱼
ChatGPT,一时间火爆全网的新晋“网红”,正被议论的纷纷扬扬。能与人类“对答如流”,会写策划方案和调研报告,写诗翻译不在话下,甚至能通过谷歌L3程序员面试。
ChatGPT上线仅2个月,活跃用户就“狂飙”破亿。
上一个下载神话是由我们都熟悉的抖音创造的
尽管如此,依然耗时9个月 ▼
ChatGPT有多智能?
前不久,ChatGPT参加了谷歌招聘的编程面试,主要问题是技术,比如图/树,数组/字符串,动态规划,递归等等复杂算法。而根据它的回答表现,谷歌确定可以将它聘为L3工程师。虽然L3只是谷歌工程团队的最入门的职级,但依然可以秒杀一众码农,网站显示,谷歌L3程序员的年薪为18万美元。
只要再开发一个AI训练它给自己优化编程
那么chatgpt实现自我迭代也是早晚的事
(图:壹图网)▼
除了替代人类码农,ChatGPT能完成的任务不限于:给科学论文当共同作者、给以色列总统讲话写稿子、顺利通过美国医生职业考试;留学生用它来写文书、员工用它写邮件、编剧用它写剧本、备考公务员的求职者用它写申论,甚至只要你要求到位,它还可以帮你发布一段小红书……
chatgpt在写论文上的优秀表现已经引起学术圈的警惕
nature在期刊上发表多篇文章,倡议审慎地对待它
(图:nature)▼
网上流传着一个段子,有人说AI最可怕的地方在于,“你给它资料,它真学”。作为一款拥有卓越学习能力的聊天软件,ChatGPT表现出极强的“求知欲”。
下面为一名记者与ChatGPT的对话实例——
记者测试发现,“聪明的”ChatGPT也会给出错误答案,只是,当用户指出错误时,它会主动提出“请告诉我如何改进”的要求,并进行多次尝试。
与传统的AI相比,它的优势在于能够根据实际情况给出真实性的指导,而不是简单的一问一答式,并且会根据用户反馈持续化更新与学习。提出的问题越详细,回答的结果越真实精细化。
这种强大到可怕的能力,让处境不同、身份不同的人们喜忧参半。
虽然它有说瞎话的毛病,但是认错的态度总算是积极
(图:与chatgpt聊天)▼
一方面,很多人庆幸自己从工作生活中解放了出来:调查显示,89%的美国大学生承认使用ChatGPT做家庭作业,53%的学生用它写论文,48%的学生使用ChatGPT完成测试。美国密歇根大学一名学生前不久使用ChatGPT生成的哲学课小论文“惊艳”了教授,得到了全班最高分。
另一方面,许多人担忧它是否会取代自己的饭碗。ChatGPT可以根据人类提出的需求即时生成业务代码,几秒内完成一段漂亮的销售文案,给不少基层打工者带来了压力。就连各大科技巨头也为自己可能受到威胁的业务而着急上火。
看这改稿能力,和一些专业的改稿程序可以媲美了
(图:nature)▼
前不久,苹果公司召开内部员工的紧急会议,以应对ChatGPT的挑战。
谷歌公司CEO桑达尔・皮查伊周一在内部备忘录中告诉员工,需要尽快推出产品来抗衡最近爆红的ChatGPT,公司将要求所有人都来测试其新推出的对标ChatGPT的语音机器人“巴德”(Bard),员工们甚至拿出在内部进行黑客马拉松的精神来测试它。
这不像是商业市场中试图与之分庭抗礼的姿态
更像是被打了措手不及之后的赶鸭子上架
“骇客松”(图:壹图网)▼
除此之外,谷歌创始人谢尔盖・布林已经开始亲自下场写代码,自他2019年离开谷歌一线以来,这还是第一次,这显示出谷歌领导层对ChatGPT的巨大危机感。
世界首富、曾经的ChatGPT合伙人、新任推特老板马斯克这样评价道:“ChatGPT好的吓人,我们离强大到危险的人工智能不远了。”
近期,微软创始人比尔·盖茨将ChatGPT融嵌入自家各线产品,使公司市值一夜飙高5400多亿。他在接受采访时也说道:“ChatGPT的意义,不亚于PC和互联网诞生。”
搭载了chatgpt技术的微软新搜索引擎new bing
真的能像它名字一样牛逼吗?(来源:bing)▼
ChatGPT的迭代之路
首先,让我们来了解一下ChatGPT的前世今生。ChatGPT是OpenAI在2022年11月30日推出的可以用对话方式进行交互的智能机器人。它的诞生经历了GPT→GPT1→GPT2→GPT3→ InstructGPTChatGPT的迭代过程。
GPT的全称,是Generative Pre-Trained Transformer(生成式预训练Transfomer模型)是一种基于互联网的、可用数据来训练的、文本生成的深度学习模型。
Transformer模型框架和GPT优化后的模型对比 ▼
2018年,GPT-1诞生,该模型可以用于一些简单的自然语言处理任务中,比如句子关系判断,语义相似度识别,文本分类,但它对训练样本之外的新鲜数据适应能力低,只能算得上一个语言理解工具,而非对话式AI。
GPT模型的核心主张1-预训练(pre-training)
先填鸭式自学、再针对性辅导
(图:REEBUF)▼
2019年,GPT-2问世,模型使用了更多的网络参数与更大的数据集:最大模型共计48层,参数量达15亿,在生成任务的性能方面展现出了普适而强大的能力,可以聊天、阅读摘要、新编或续写故事,还能编造假新闻、生成钓鱼邮件,就连在网上进行角色扮演也不在话下。
这个阶段则是去掉了监督微调阶段
试图解决zero-shot问题,数据集也是跨越式地增长
(来源:《Language Models are Unsupervised Multitask Learners》)▼
而后,GPT-3出现了,作为一个自监督模型(在人工标注的数据中通过自己监督自己来学习到有用的信息),它可以捕捉所有的历史上下文信息,作为丰富的语料供模型学习,拥有1750亿的参数量,几乎可以完成自然语言处理的绝大部分任务。
在少量样本学习下的综合表现是理想的
(来源:《Language Models are Few-Shot Learners》)▼
例如面向问题的搜索、机器翻译、文章生成和自动问答等等,且模型在诸多任务上表现卓越,例如在法语-英语和德语-英语机器翻译任务上达到当前最佳水平,自动产生的文章几乎让人无法辨别出自人还是机器,在两位数的加减运算任务上达到几乎100%的正确率,甚至还可以依据任务描述自动生成代码。
可能是码农们自己也受够了每天输入一些繁琐的代码
(来源:nature)▼
2022年初,OpenAI发布了InstructGPT,通过监督学习(用标记数据集来训练特定任务的算法)+人类反馈中获得的强化学习方法,来提高GPT-3的输出质量。InstructGPT能够更好地遵循用户意图,且能将有害的、不真实的和有偏差的输出最小化。
现在,我们每个用户都是chatgpt的训练师
免费的纠错劳动力和数据集
(来源:Qin-《InstructGPT 浅析》)▼
当时间来到这一年年末,加强版模型ChatGPT问世了,这个模型沿用了监督学习与强化学习算法,另外在数据训练过程中,通过将模型生成不同结果的优劣进行人工评估,从而将模型进一步优化,再次提高了模型回答的质量。
由此可见,如此高大上的神器,前期也经过了不断摸索与演化的过程,才以如今的样子呈现在我们面前。强大的技术底座赋予它的能力,主要体现在三个方面:复杂的问题处理能力、广泛的场景应用能力、基于用户反馈的持续化更新与学习能力。
最终,还是钞能力成就了这一领域的奇迹
(图:shutterstock)▼
ChatGPT价值在何方?
目前,ChatGPT固然存在一些局限,但它给我们带来的革新与潜在的想象空间无疑是巨大的。小到个人与企业,大到人类与社会,它会成为历史上一个值得铭记的里程碑。
Generative AI风投市场表现充满朝气 ▼
纵观人类的历史,就是不断寻找最精确信息的过程。
我们的祖先跨越海洋,攀登高山,冒着疾病的危险去收集最优质的信息,拜访那些充满光明的地方。不论是为了去领略亚历山大图书馆中的智慧,参加高等学府的学习,都需要付出时间和旅程的成本。不论黄页还是大英百科全书,它们提供的价值都是让人类更快地获取信息。
知识是人类进步的阶梯
(图:shutterstock)▼
本来需要去图书馆或步行到镇上才能解答的问题,突然间可以在几分钟内,就可以得到解决。在此之前,谷歌凭借其搜索引擎一举成名。它成功的原因在于:缩短了从问题到答案的距离,并找到了一种将其货币化的方法。
遇到不懂的问题,我们首先会想到去“谷歌一下”
(图:壹图网)▼
有观点认为,ChatGPT会颠覆搜索行业,但同时我们也看到了它存在的局限。
比如,目前ChatGPT主要查到的都是2021年的信息,ChatGPT无法知道谁赢得了中期选举,不知道参加卡塔尔世界杯的球队是赢了还是输了,不知道埃隆·马斯克是推特的CEO,此外,ChatGPT目前还不支持图片搜索。
这与chatgpt模型的数据集有关
不过随着进一步迭代,相信它会更好地修正 ▼
ChatGPT不仅会编造虚构的学术论文引文,凭空捏造一个不存在的定理,而且当用户需要更多维度的体验,想要调查而不是去寻找某个即时确定的答案时,ChatGPT会不胜其任。
另外,其高昂的价格可能也会限制它的使用范围。即便如此,目前订阅价在20美元每月的ChatGPT对各垂类企业仍具极大的吸引力,哪怕它的价格还会不断上涨——用于法律、医学、工程、软件开发、销售、房地产等各行各业的垂直化聊天机器人会大大缩减成本,创造更高的价值。
更多商业投资的涌入,更多产业集中,成本也更低
(来源:youtube)▼
譬如在搜索场景中,聊天机器人会比网页广告更有优势,因为当客户像是在与真人对话时,会有更高的商业转化率。
ChatGPT就好比信息时代的图书管理员,将谷歌的数据海洋、大量的人类知识转换为清晰、维度更简单的答案。毕竟,谷歌虽然可以给你10万个答案,但一个图书管理员却可以给你最为精准的答案。
以“一位人工智能图书管理员在数据海洋里找资料”为提示
从百度的图形生成AI大模型"文心一格"生成的画像
(来源:文心一格)▼
参考资料:
1、论文:《Improving Language Understanding by Generative Pre-Training》
2、论文:《Attention is all you need(Transformer)》
3、https://finance.sina.com.cn/jjxw/2023-02-09/doc-imyfafhw6230591.shtml
4、https://www.woshipm.com/ai/5704153.html
*本文内容为作者提供,不代表地球知识局立场
封面:爱死机
END