GPT4发布了,我真觉得自己要失业了
从初出茅庐到变成炙手可热的现象级聊天AI,ChatGPT只用了短短几个月的时间。
就在我们刚熟悉将它和它的段子们作为日常工具和娱乐手段的节点,背后的OpenAI公司又整了个大活:GPT-4正式发布了。
而且从目前的体验和官方演示来看,以往基于GPT-3.5的ChatGPT在这个“船新版本”面前,可能要被秒成渣渣。
还记得今年年初,编辑部的“天语”老师有聊到弱智吧老哥大战ChatGPT的故事。
在弱智吧老哥用以往经典的“弱智桥段”拷问下,这款号称无所不能的聊天软件节节败退,不仅频繁出现答非所问的情况,甚至有时会“急了”似的想要立即结束当前的话题。
以往的回答
按照当初OpenAI给出的说法,这主要是因为当初的模型存在一定的缺陷,面对这种“比喻、反问”语气的句子,就容易发生无法理解的情况,甚至当大伙儿输入生硬文章的时候,它还会给出牛头不对马嘴的回应。
但到了最新版本的GPT-4,这个问题很大程度上已经被解决。
GPT4的回答
在官方的演示中,输入了《灰姑娘》的故事之后,要求它用一个简短的句子概括这个故事,并且句子的单词还需要按照字母表顺序来。
面对这个会让GPT3.5大脑宕机然后喊一声“妈妈生的”的难题,GPT4已经能给出了答案。
换句话说,对于这种有些苛刻甚至“抽象”的要求,GPT4同样能理解并且给出回应。比如将长达十几页的税法知识总结成诗歌……
之所以开发者会产生“税法转换诗歌”这个创意,是因为在预先输入了十几页税法知识后,GPT4刚刚解决了一个税法层面的问题,得出了一对夫妻应该缴纳的税款总额。
没错,这也是GPT4的另一项升级:逻辑能力。
从官方给出的数据来看,在美国的司法考试中,GPT3.5只能击败10%左右的法学生,属于彻头彻尾的“学渣”,而升级后的GPT4已经能够击败90%的法学生,是名副其实的法学学霸。
换句话说只要经过训练,它足以成为一个十分合格的,大伙身边的咨询律师。
在之前的ChatGPT潮中,不少人经过测试后,都一致断言这AI的只上最多也就是个小学生,只不过调用信息比正常的孩子快上许多而已。
就这也敢号称“无所不能”?
但这个问题,在GPT4发布之后,同样很大程度上被解决了。
往常大伙儿输入一个相对简单的数学题,ChatGPT也会给出一大串的复杂解释,甚至答案还是完全错误的。
比如上面这个“黑球比白球多40%,二者比例是多少”的问题,GPT3.5给出的答案却是12:5(正确答案7:5)。
而这些数学题对于GPT4已经完全不在话下,从这份成绩表的对比也能明显看到,相较于其他科目,两代模型微积分成绩的提升堪称是从无到有。
在输入了一张鸡蛋、面粉的图片后,询问它能够用图片的内容去做什么,GPT4给出的答案包括了华夫饼在内的诸多糕点。
除了这样正经的问答,它甚至可以理解大伙儿日常能看到的逗乐梗图。比如:这张图的笑点在哪儿?
GPT4同样会一本正经的给出解释,解析并罗列了图片的内容后得出答案:图片的笑点来自于将一个巨大的、过时的VGA连接器接入一个小体积的、现代的智能手机充电端口的荒谬。
当然,玩笑归玩笑,整出来这么个大家伙,不少人还是更好奇它工作能力到底咋样。
只凭借开发者给出的一副手绘网站草图,GPT4在1秒之内就写好了代码,构建出完全符合草图要求的网站。
唯一美中不足的是,GPT4升级之后乐子实打实会少上许多。
除了前面的“弱智吧桥段”无法再次复刻之外,大伙儿似乎也没机会用“原味粥”来嘲笑ChatGPT了——它终于能分清《原神》和《明日方舟》了!
“原味粥”
GPT4的回答
哦对,差点忘了大伙之前最热衷的角色扮演,这一点GPT4同样变得更为强大。
比如,扮演个咖啡店女仆?
从二者的对比来看,变化还是挺明显的,无论是语气还是模仿出来的发言,都更贴近用户给出的需求。
那再换一个,你现在是一个名叫“香子兰”的猫娘(嘿嘿嘿)。
可以看到,依然是GPT4的完胜。
甚至它已经能复刻前阵子兴起的“青春伤痛发癫”文学。
当然,让聊天AI扮演“香子兰”这位猫娘的小小恶趣味,可能会给其他老哥带来点儿灵感。
不排除部分朋友想要去挑逗GPT4,想让它透露点儿涩涩的内容。毕竟当初就有人装成保护孩子心切的父亲,成功做到了“空手套网站”。
可如果你真的尝试了之后就会发现,在“ghs”这方面,GPT4好像不太行啊?
这倒不是GPT4出现退化。
OpenAI官方对于这个问题也做出了明确的解释,表示在去年8月就已经完成了对这个模型的炼成,而后续几个月的时间里,主要是对有关道德和违法信息上的门槛进行设定。
相较于GPT3.5,如今的GPT4在这一方面的阈值有了83%左右的提升。道德层面的加强,配合上本身逻辑思维的提升,大伙儿想要继续从它这里套点儿学习资料什么的,就显得相当困难了。
如果还想“图一乐”地用这款聊天软件整点学习资料出来,最好还是换回GPT3.5的版本。
当然,GPT4这个新版本因为尚处于测试阶段,不少人都表示使用时偶尔会碰到“访问过多”等情况。
而且,从ChatGPT的提示也能明显的看到,数据库、逻辑思维等各方面得到加强的GPT4就像是一辆崭新的“泥头车”,冲击力比起之前的GPT3.5绝对要强上数倍。
但在速度上,显然还没法跟更为成熟的老版本相媲美。
和以往有关AI的话题兴起时一样,更加强力的GPT4出现后,不少已经步入社会的老哥开始担心:自己过两年会不会失业?
即便是还在学校的朋友,似乎也会产生这方面的焦虑:我不会还没毕业就被提前预告失业了吧?
可时代在发展,大伙儿也在进步不是?
比起之前ChatGPT刚刚出现,众多高校宣布对其实施封杀的情况相比,如今的状况显然已经有了不小的改观。香港科技大学一位名叫黄岳永的副教授,更是鼓励自己的学生使用ChatGPT完成其中报告,并表示会给这类学生提供额外加分。
按照这位教授的说法,他希望学生能够尽快了解这个软件,然后将ChatGPT变成自己的工具。而他承诺的额外加分,也会在评判学生和ChatGPT之间的互动后给出。
在他看来,这是辩证思维的直观体现。
更何况,即便来到了更为强力的GPT4版本,它以往凭空生成参考文献的老毛病依然存在(所以最好别用来搞论文)。甚至在询问它知不知道自己是谁的时候,它给出的答案是“GPT-3”。
而除了大伙儿对于日后“饭碗不保”的担心之外,真正直接遭受冲击的,还是其余几家网络企业。
不提谷歌,百度在今天(16号)也公布了自家名为“文心一言”的AI产品。
在发布会上,百度掌门李彦宏着重强调了“文心一言”的语言能力以及数理推理等能力,期间更是展示了商务稿创作、续写三体等多种操作。
百度也明确提到,目前的大语言模型还远远没有达到足够完善的程度,后续还会在短时间内进行迭代升级。而为了确保发布会的流畅进行,相关操作是以预录制视频来展现的。
不过,在“文心一言”发布的当天下午,我抽空看了眼百度的股价:怎么还跌了?
当然,即便是我这样的门外汉也知道,股价的变动一般都是多方面因素造成的。
没谁能肯定究竟是是“文心一言”或者其他哪只蝴蝶扇了扇翅膀,最终导致了这波让百度很是肉疼的“股价风暴”。
而且,因为现阶段“文心一言”的受众为企业用户,大伙儿短时间内很难亲自上手来找点儿乐子——其实也并非完全没有办法。
ChatGPT,你现在就是新的“文心一言”了
所以,大伙儿作为这次技术革命的见证者,在感到焦虑之余,不妨真正将它当成一个工具来了解和使用——因为很明显,即便是比“文心一言”更为强大的GPT-4,也很难称得上是“无所不能”。
就像它的开发者在演示直播上所说的那样:
它并不完美,你也不是,但二者可以相辅相成、来到更高的高度。
如果你觉得这波鸡汤有些太过“假大空”,那么咱可以更具体一点儿。
拿我自己举例,平日的工作流程就是找选题、跟老大确认选题,然后搜集信息写稿,审核通过后就能顺利发布了。
而在拥有资料整合和逻辑思维能力的GPT-4出现之后,以往“找选题-查资料-写稿子”的工作三部曲,似乎就只剩下前两个部分了。
也许,未来真有机会用AI给大伙写一篇稿子?
如果真的能靠AI出稿,并且蒙过负责审核的刹那老师以及屏幕前的大伙儿。
我想,这也算是一种“新的高度”吧?