能读图、考高分、1秒生成网站……火爆全网后,ChatGPT撕掉“Chat”的标签再次进化。3月15日凌晨,OpenAI正式发布了升级后的GPT-4。与之前相比,GPT-4不仅展现了更加强大的语言理解能力,还能够处理图像内容,在考试中的得分甚至能超越90%的人类。不过从商业应用角度而言,目前GPT-4没有免费版本。与此同时,压力也再一次给到正加班加点鏖战“中国版ChatGPT”的各家大厂这边。
“大人,时代变了”
发给聊天机器人一张图表,它不但能看懂,还能给你如此这般做一番运算,发来一段对图表的解读。你不服气,又扔过去一张无厘头的梗图,它不但能看懂这张图里有车有人,还能告诉你之所以好笑是因为“这个男人在出租车上面熨衣服”。
这不是畅想,而是OpenAI最新发布的大型多模态GPT-4已经具备的能力。在官方演示视频中,OpenAI总裁兼联合创始人格雷格·布罗克曼(Greg Brockman)用笔和纸画了个网站展示给GPT-4,后者仅用1到2秒的时间,就生成了网页代码、制作出了几乎与图中一模一样的网站。
目前,ChatGPT的Plus订阅用户已经可以使用GPT-4,其他用户需要排队申请内测。当晚,大批新订用户涌入,以至于OpenAI的付款系统被挤爆了。 “GPT-3或3.5像一个六年级学生,而GPT-4像一个聪明的十年级学生。”有美国初创企业人士这样评价。
而在国内,即便发布时间在凌晨,依然有不少用户不眠不休地测试:或用来出营销策划、写广告词;或用于解答逻辑题、数学题;甚至还有用来调侃脑筋急转弯。GPT-4均对答如流,并展示出其强悍的处理能力,用户直呼“强得离谱”“牛啊”。
天使投资人、资深人工智能专家郭涛对北京商报记者表示,GPT-4在此前的基础上对训练数据、模型结构和生成方式等方面都进行了改进,支持图像和文字多模态输入、训练数据更加丰富和多样化、模型结构也更加复杂和高级等,智能问答和文本生成等领域优势更加突出,应用场景也更加广泛。
不过,OpenAI也在官方网站上给出了目前GPT-4存在的不足,如其仍然存在包括社会偏见、捏造事实、对抗生成等已知限制。OpenAI对此表示,随着社会对AI模型的接受,将增加透明度,鼓励并促进用户教育和更广泛的人工智能素养,并致力于扩大人们在培养AI模型方面的输入途径。
当北京商报记者提问ChatGPT是否了解GPT-4,ChatGPT回答道,“我了解的知识只截至2021年4月,此时还没有关于GPT-4的官方公告或发布日期。但预计OpenAI将继续开发和改进其语言模型,这最终可能导致将来发布新版本的GPT。作为一名语言模型,我一直在学习和适应新的数据和技术进步,所以我将继续随着这些发展而发展”。
变现不是问题
从商业应用角度而言,目前GPT-4没有免费版本。用户可以申请使用GPT-4的API,定价为每输入1000个字符(约合750个单词),价格为0.03美元;而GPT-4每生成1000个字符,价格为0.06美元。
与前一代模型相比,新推出的GPT-4 API价格提高不少。3月2日,OpenAI刚刚放出ChatGPT API,比之前的GPT-3.5模型便宜10倍,每生成1000字符,价格为0.002美元,即2美元就可输出100万个字符。
越贵越不愁卖。浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林指出,GPT-4一经发布,支付渠道就出现了拥堵,用户热情是足够的,“这也就意味着当前OpenAI实际上没有商用落地的忧虑,这款产品已经可以实现变现”。
不过,微软方面宣布,目前全新必应预览版中已经搭载了定制版本的GPT-4。“如果您在过去五周内的任何时间使用过新的必应预览版,那么您已经体验过这个强大模型的早期版本。”
此前,微软已经将ChatGPT整合进云平台Azure Open AI 中,企业和个人开发者均可借助Azure。 “微软有望在产业中通过GPT-4不断拓展下游新兴领域,应用于更多的场景中,并利用其多模态模型成本改变传统AI客制化与定制化的特点,逐步向通用化方向发展。”华鑫证券计算机研究团队分析称。
不可忽略的是,成本依然是一个掣肘。根据中信研报测算,ChatGPT生成一条信息的成本在1.3美分左右,是目前传统搜索引擎的3-4倍,成本问题中短期内或只能等待硬件成本的继续下降。
AI的“iPhone时刻”
此前有业内观点认为,GPT-4的发布有望成为生成式AI向超级AI快速演变的关键节点,而此次GPT-4真正亮相后,也引爆了业内讨论。
美国银行战略分析师预测,人工智能正迈入“iPhone时刻”,预估到2030年会为全球经济带来15.7万亿美元的增长。正如iPhone带来的智能手机变革,GPT模型的出现又将影响未来AI领域的发展方向。
一片蓝海面前,国内外创业公司和互联网大厂都在迅速跟进,不愿成为新技术掉队者。在OpenAI发布会前几个小时,谷歌刚刚宣布推出一系列生成式AI功能,用于其各种办公软件中,包括谷歌Gmail、Docs(文档)、Sheets(表格)和 Slides(幻灯片)。
在外界看来,这是谷歌意图抢在微软3月16日预期官宣GPT接入Office之前,展现自己的成果。作为直接竞争对手,谷歌已走在“对抗”微软与OpenAI的最前列。
在国内,BAT等大厂也在摩拳擦掌。3月16日,百度将正式发布“中国版ChatGPT”文心一言。在王兴、王慧文再度携手、开启AI领域创业的同时,快手前AI核心人物李岩也投身“多模态大模型”创业。
郭涛认为,ChatGPT主要基于英文环境训练,中文语料库内容还较少,对中文的语言特点和文化背景理解程度不够,短期来看在中国市场竞争优势并不十分明显。另外面临的合规监管风险也较大;而百度文心一言等本土化的AI大模型,优势在于其对中文的语言特点和文化背景的深入理解和适应,更适合中文和中国市场。
郭涛进一步表示,随着国外巨头基于智能对话机器人应用产品或服务快速进入中国市场,以及百度、阿里巴巴等国内企业相关产品的相继问世及日趋成熟,智能对话机器人市场竞争将空前加剧,缺乏生态体系支撑的企业或将最先被淘汰出局,竞争方式也将从技术竞争转向品牌、价格和服务等综合实力的竞争。
如今,兵家必争的不只是当前的市场,还有未来AI时代的定义标准与话语权。正如英伟达CEO黄仁勋表示,“你知道你今天做不到,但是当然,它总有一天会做到的”。
北京商报记者 方彬楠 赵天舒 实习记者 李想
实测
北京商报记者分别向GPT-4和ChatGPT-3.5输入“帮我出一个北京一日游的攻略”,发现GPT-4相较于旧版本更加具备规范和精确的语言能力,同时也具备更精确的知识。GPT-4的行程可以精确到以小时计算,游览路线也更为具体。
● ChatGPT-3.5:
好的,以下是一个北京一日游的攻略:
早上可以先去天安门广场,欣赏一下国家升旗仪式。不过要注意的是,这个活动时间比较早,一般在早晨6点左右开始,所以需要提前安排好时间。
接着可以前往故宫博物院,游览一下这个中国最著名的古建筑群。建议提前预订门票,以免浪费时间排队。
中午可以到王府井大街附近的小吃摊或者餐馆尝尝北京特色美食,如烤鸭、炸酱面、豆汁等。
下午可以前往颐和园游玩,颐和园是中国古代皇家园林之一,被誉为“万园之园”,是北京市最大的皇家园林。在这里,你可以欣赏到各种精美的古建筑和风景,同时也可以了解一些有趣的历史故事。
晚上可以到三里屯或后海一带逛逛,感受一下北京夜生活的热闹氛围。这里有各种洒吧、餐厅、小吃摊等,可以满足你的各种需求。
以上就是一个北京一日游的攻略,当然如果你时间充足,建议多留几天,体验更多北京的文化和历史风情。
● GPT-4:
当然可以!这里是一个建议的北京一日游攻略。请注意,这个行程比较紧凑,如果您想更加深入了解某个景点,请相应调整时间。
天安门广场(06:30-07:30)
早上6:30左右,您可以在天安门广场观看升国旗仪式。天安门广场是世界上最大的城市广场,是中国政治和文化的象征。
故宫博物院(07:45-11:00)
从天安门广场步行到故宫博物院,游览中国古代皇家宫殿。建议提前在线购票,以避免排队等候,游览时间可能较长,因为故宫博物院规模庞大且景点众多。
王府井大街(11:30-13:00)
乘坐地铁前往王府井大街,这里有许多购物商场和特色小吃。您可以在此品尝北京烤鸭、炸酱面等北京美食。
天坛公园(13:30-15:30)
参观天坛公园,游览祈年殿、皇穹宇和回音壁等历史建筑。天坛是古代皇帝祭祀祈福的地方,也是中国最重要的皇家祭祀建筑群之一。
南锣鼓巷(16:00-17:30)
漫步南锣鼓巷,欣赏北京传统胡同的风貌。您可以在此品尝各种特色小吃、购买工艺品或参观胡同文化展览馆。
鸟巢与水立方(18:00-19:00)
参观2008年北京奥运会的标志性建筑:鸟巢(国家体育场)和水立方(国家游泳中心)。在这里您可以拍照留念。
什刹海地区(19:30-21:30)
晚上,您可以去什刹海地区品尝美食、逛酒吧或听听现场音乐表演。这里是北京著名的夜生活区域,也是感受传统与现代交融的好地方。