GPT-4恐怖如斯!文心一言紧随其后
3月14日晚,OpenAI 正式发布GPT-4。
ChatGPT4.0是基于OpenAI正在创建的GPT-4模型,该模型可以生成比GPT-3更精确和多样化的文本。ChatGPT4.0将使用微软自己的数据集和算法来优化GPT-4模型,并且将提供一个用户友好的界面来让用户输入文本提示和选择视频风格。GPT-4模型也将以API的形式,提供给付费版ChatGPT Plus的订阅用户。开发者可以注册,用它打造应用。微软此后表示,新款的必应(Bing)搜索引擎将运行于GPT-4系统之上。
GPT-4一经发布就引起了巨大轰动,不少人直呼“强的离谱!”,哈佛教授更是声称程序员职业3年内可能会被终结。OpenAI老板Sam Altman直接开门见山地介绍说:这是我们迄今为止功能最强大的模型!
究竟是什么新变化让业界如此轰动?下面就为大家一一道来。
差生一跃成为优等生
OpenAI表示,团队花了6个月的时间使用对抗性测试程序和ChatGPT的经验教训,对GPT-4进行迭代调整,从而在真实性、可控性等方面取得了有史以来最好的结果。根据OpenAI的介绍,虽然ChatGPT4.0在许多现实世界的场景中能力不如人类,但在各种专业和学术基准上表现出人类水平的性能。
OpenAI 官网公布的数据显示,在完成 GRE(留学研究生入学考试)的数学和口语方面,尤其是口语部分,满分 170 分的考试,GPT-4 可以考 169 分。包括美国律师资格考试 Uniform Bar Exam、法学院入学考试 LSAT、SAT(美国高考)数学部分和证据性阅读与写作部分的考试在内,GPT-4 的得分可以超过 90% 的人类考生,到了可以申请哈佛、麻省理工、斯坦福大学的水平。
而早期版本未能通过统一律师资格考试,并且在大多数大学先修考试中的得分也没有那么高,GPT-4 与之前的 GPT-3 相比,分数有了明显的提高。可以看出GPT-4的人类考试能力和推理能力突飞猛进,可以说从差生一跃成为了优等生,而这个过程,GPT只花了不到一年的时间。
史上最强大的模型
正如之前传言,GPT-4 确实拥有多模态能力,可以接受图像输入并理解图像内容,并且可接受的文字输入长度也增加到 3.2 万个token(约 2.4 万单词)。
首先是识图能力,根据输入的图片生成标题、分类,并且分析图片内容给出有逻辑的回答。
例如:
再例如:
甚至只需要简单在纸上画一个网站的草稿图,拍一张照片上传给GPT-4,它就可以立马生成网站的HTML代码!
而能看懂图片,也意味着GPT-4变得“更聪明”了。按照OpenAI说法,GPT-4比GPT-3.5更可靠、更有创意,更能够处理细节指令,并且在某些专业问题上发挥得更好。
文字输入长度限制的增加,也大大扩展了GPT-4的实用性。
人工智能语言模型一直受限于它们能在短期记忆中保存的文本数量(即:用户的问题和系统的答案中所包含的文本)。但是OpenAI已经为GPT-4大幅扩展了这些能力。它现在可以一次性处理整个科学论文和长篇小说,使其能够回答更复杂的问题,并在任何特定的查询中连接更多的细节。
发布会直播上,OpenAI总裁Gregman现场表演了一波GPT-4给代码修Bug。出现问题啥也不用想,直接把1万字的程序文档一股脑扔给GPT-4就行。格式也不用管,你只需要Ctrl+A、Ctrl+C、Ctrl+V。
将一整篇论文上传给GPT-4,GPT-4可以在极短时间内完成了阅读,并给出清晰的总结摘要。
敲响警钟
GPT4 可以达到60秒创建乒乓球游戏、20 分钟内编写和调试了一整个的贪食蛇游戏,更专业的开发者正在利用 GPT-4 强大功能的 AI 代码编辑器、 能将 Python 函数转换为深奥但正确的 C++ 代码、可以处理 Bazel 的复杂性帮助我们以 10 倍的速度编写 Bazel 代码、能将 Kube 部署转换为使用 Terraform、还能为常见和深奥的任务编写 CLI......
拥有如此强大的编程能力,AI 真的会取代程序员?
前段时间,前哈佛大学计算机科学教授、谷歌工程主管 Matt Welsh 还曾对此发出断言,表示“生成式 AI 将在 3 年内终结编程”,放在当下来看,也许 Welsh 所言非虚。
Welsh 认为,由于 ChatGPT 和 Copilot 等技术的出现,编程正处于从人类工作转变为机器人工作的转折点。在他看来,程序员需要演变成 AI 程序的“老师”——或者产品经理,或者代码评审人员。他认为这两个人类角色相对来说不那么受机器人的影响。“不要指望你的程序员职业生涯会一直持续下去,因为机器正在取代这个角色。”Welsh 说道。
他认为,具有编程能力的人类将承担“评审和阅读 AI 生成的代码,并确保它们能够正常运行以及做正确的事情”的任务。至于程序员,以及那些即将加入这一领域的人,他们将需要成为 AI 的老师,而不是程序员本身。Welsh 说:“这是关于如何教会 AI 写代码,而不是自己写。”
“文心一言”紧随其后
同样,就在今天,“中国互联网的领头羊”百度也不甘示弱,推出“文心一言”。它是百度基于文心大模型技术推出的生成式对话产品,被誉为“中国版ChatGPT”。
据悉,“文心一言”是百度基于文心大模型技术推出的生成式对话产品。“文心一言”目前包含以下五类落地场景:文学创作、商业文案创作、数理逻辑推送、中文理解、多模态生成。
发布会现场李彦宏出现了罕见的紧张情绪,说话屡有颤音,出现表达梗塞的情况,在功能演示部分,李彦宏表示,为了追求准确率使用的是提前录制好的视频,于是不可避免缺少了一些现场感,甚至真的会让一些小白相信网上的一些梗图
随着发布会的召开,百度股市反应不佳,股价短线下挫跌超7%
也许是期望过高,文心一言的发布似乎并没得到大众的认可,网友评价说:“乏善可陈的展示让现场甄选好的媒体像是打了麻药,掌声、哇噢都欠奉,现场氛围僵化,不像是目睹一场革命性产品的诞生。”
但正如李彦宏所说,文心一言还存在很多不完美的地方,但由于市场的需求必须要推出。
对于多模态上的进展,文心专家称跨模态这一块目前来说和GPT类似产品相比大概有一代到两代的差距,比如今天GPT-4做的事情百度至少要半年以后才能做,视频、图片生成要半年以后大概能有一个相对比较稳定、高质量的输出。文心一言在高质量的文本形态生成上比较有把握。
文心一言专家说目前发布会只是一个小小的时间点,是中国市场类ChatGPT产品空白的填充,4、5月份还会有下一个版本或者新功能的发布。还达不到GPT-4生成内容的质量和水准,对标的是3.5,后续以月或双月的频率发布新功能或新版本。
尽管文心与GPT还存在一定差距,但是我们仍对其发出展望,期待文心一言的更进一步。