今天凌晨,OpenAI发布多模态预训练大模型GPT-4,增加了识别和理解图像的能力,同时文本处理能力提升至2.5万字,且回答准确性进一步提高,还拥有编歌曲、写剧本等更创造性的写作能力。同时,微软也确认Bing Chat聊天机器人已升级使用OpenAI的GPT-4技术。此前,微软还宣布,已可以在基于Azure智能云平台上的OpenAI服务中使用ChatGPT。
微软中国相关负责人告诉《科创板日报》记者,微软会侧重于企业级OpenAI模型在各个行业场景的落地。“在全球范围内,微软Azure OpenAI商用服务的用户增长量是非常大的,零售、汽车、金融、互联网、游戏等领域的企业,均在探索ChatGPT的服务如何在企业场景里产生价值。”
360创始人兼董事长周鸿祎也对记者表示,ChatGPT真正的能力在于其作为强人工智能的雏形,而不是智慧搜索引擎。“ChatGPT是一个人类助手的角色,推动人机协作,未来在客服、营销、医疗等都会有很好的应用前景。”
“曲率引擎已经吹动了发丝。”民生证券计算机分析师吕伟用《三体》里的热词来形容GPT-4的智能与进步。
在他看来,官方发布相较以往版本主要三大突破,本质上都是更接近“真人”的通用智能:
第一,像人一样更具备创造协作输出能力,具备更有创造性的写作能力,包括编歌曲、写剧本、学习用户写作风格等;第二,像人一样具备视觉输入处理分析能力,可以图文等多模态同时综合分析,给出答案;第三,像人一样具备超长文本的处理分析能力。
微软公司副总裁、微软大中华区首席运营官康容在采访中对《科创板日报》记者表示,OpenAI是微软的第三方的策略合作伙伴,从四五年前开始密切合作。OpenAI并非微软智能云Azure的首个大模型的AI服务,却引发了巨大关注,是在以下两方面实现了突破。
首先,其使用培训的数据量,远远超过包括微软在内的各个厂商模型数据量。“你可以想象AI是一个很聪明的小朋友,虽然有很多潜力,但也需要好好培养,要用大量的数据来培训。” 康容说。
其次,GPT是辅助写作(Generative Pre-trained Transformer ),从机器学习、做语言翻译的基础开始,会自己收集大量的数据,做出包括文字、图片、视频等在内的新内容。
“我们跟某国内手机厂商聊,他们希望挑战OpenAI,希望生成的图片是一个25-30岁女士模特,金头发、蓝眼睛站在稻田上,蓝天无云,拿着品牌手机。” 康容说,“GPT竟然听懂指导,把那个图片画出来了。一般来说,设计图片需要找代理公司,沟通客户需求,但有时做出来的东西不是想要的,但GPT可以提供不同版本,而且都是全新的、没有看过的东西。”
微软大中华区Azure事业部总经理陶然介绍,目前OpenAI和微软Azure服务的合作主要在三个方面。“第一,是GPT模型。要强调的是GPT模型并不等同于ChatGPT,而是一个数据模型;第二,是DALL-E 2图像生成模型,第三,是Codex代码生成模型。”
康容以医疗领域为例,“医疗会涉及很专业的深度内容。所以,某个客户如果用企业级OpenAI 做出医疗的ChatBot(聊天机器人),那个ChatBot会回答的问题,是另一个ChatBot听不懂的,因为都是通过内部企业级数据进行培训,内容会很专业。”
康容认为,未来OpenAI的模型会被应用在各个领域,生成完全不同的图片和视频,通过更聪明的机器人小助理或者ChatBot,协助员工在内部做快速、大量的数据分析,产出报告。
“比如,企业想要看国内过去三年疫情期间,国内不同地区的汽车行业或者半导体客户的成长率。这在以前,需要花个两三周、一个月的时间,整理出来的内容也不是特别完整。但借助OpenAI,可能几分钟就能整合了外部信息产出报告,效率大大提升了。虽然不一定百分百准确,但打了一个很好的基础。这是未来企业级OpenAI的价值,重点在业务上服务客户和员工。”
此前,多家国内企业都纷纷宣布已与微软开展合作。其中,创意软件A股上市公司万兴科技已对接Azure OpenAI开通商用服务权限。据了解,Azure OpenAI 服务于2023年1月推出,万兴科技是国内首批获得 Azure OpenAI商用服务权限的企业。
万兴科技证券部相关负责人对《科创板日报》记者表示,目前所使用的Azure OpenAI服务为英文版本,主要给海外用户进行体验,目前对营收暂无贡献。据悉,万兴科技已推出万兴喵影、万兴优转、万兴录演等视频创意软件。“对我们而言,会更期待可支持视频生成的GPT版本的推出。”上述负责人表示。
蓝色光标则在互动平台表示,蓝色光标旗下蓝标传媒已正式宣布与微软广告达成战略合作,并成为其官方代理商;同时,公司将与微软开展基于OpenAI的技术产品合作,通过敏锐地洞察与过硬的实力使更多出海客户享受到AI发展的红利。
此外,百度、商汤科技、360等企业也在探索类ChatGPT和大模型的开发。3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,其图文跨模态开放任务处理能力可为自动驾驶、机器人等通用场景任务提供感知和理解能力支持。
利用多模态多任务通用大模型辅助完成自动驾驶场景中各类任务
据商汤方面透露,“书生2.5”具备了AIGC“以文生图”的能力,可根据用户提出的文本创作需求,利用扩散模型生成算法,生成写实图像。例如借助“书生2.5”的以文生图能力帮助自动驾驶技术研发,通过生成各类真实的道路交通场景,如繁忙的城市街道、雨天拥挤的车道、马路上奔跑的狗等,生成写实的Corner Case训练数据,进而训练自动驾驶系统对Corner Case场景的感知能力上限。
360则在互动平台表示,公司的人工智能研究院从2020年开始一直在包括类ChatGPT技术在内的AIGC技术上有持续性的投入,但截至目前,仅作为内部业务自用的生产力工具使用,各项技术指标只能做到略强于ChatGPT 2。360方面称,计划尽快推出类ChatGPT技术的demo版产品。
中信证券指出,长期来看以GPT为主的生成式预训练大模型持续升级,多模态带来更大的数据支持需求,模型计算精度逐渐提升,开放API后应用场景持续落地,对于算力的总体需求料将持续提升。
国内多家公司也在积极布局大语言模型,但是国内高端算力芯片目前比较依赖海外厂商,在高端芯片国产化背景下,中信证券建议关注国内推出及布局AI芯片/GPGPU芯片的相关公司,包括:寒武纪、龙芯中科、海光信息、景嘉微、澜起科技等。
针对在中国市场的规划,康容介绍,目前中国区正在与总部进行探讨。“微软在全球有70多个数据中心区域,只有三个数据中心区域部署了企业级的Azure OpenAI服务。未来,这个覆盖范围会扩大,但是以什么速度部署、在哪里部署,是需要看各个区域客户的需求有多高。因为OpenAI的服务在落地前,需要部署很多的底层服务。这件事情我们还在跟总部探讨。”
从整体应用趋势来看,零售、汽车、金融、互联网、游戏等领域的企业,均在探索ChatGPT的服务如何在企业场景里产生价值。“在全球范围内,我们看到微软Azure OpenAI商用服务的用户增长量是非常大。” 陶然说。
360创始人兼董事长周鸿祎对《科创板日报》记者表示,ChatGPT真正的能力在于是强人工智能的雏形,通用人工智能发展的奇点,“它不是为了解决某一专有领域问题,而是为了解决对人类知识进行存储和知识化。”
在具体的应用场景上,周鸿祎认为,ChatGPT更准确的定位是个人助手,在办公场景里很好用。“比如写大纲、写报告、写文章。又比如做题,甚至写代码,就算是编程的初学者也能在其帮助下写出高质量的代码。现在,ChatGPT已经具备了一定的逻辑推理能力。未来,在客服、营销、医疗等诸多场景下,都是ChatGPT很好的应用场景,能够大幅提升脑力劳动者的工作效率。”
谈及国内类ChatGPT产品的代差落后,周鸿祎指出,对中国而言,从语料上、从技术上、从战略上都可以做,中国互联网公司的工程化能力强,技术落地能力强。在国家鼓励性政策的支持下,用两三年的时间赶上ChatGPT现在的水平是绝对有机会的。
“现在,ChatGPT已经做出了样本,有开源技术做基础,并不存在难以逾越的障碍,剩下的就是时间问题。我们需要在机制上进行创新,建设更加开放的生态,加强产学研各界的合作,充分发挥中国千万级大学毕业生的优势,利用众包模式进行知识标注,去做基于人工标注的强化学习训练。此外,必须效仿App Store模式,去建设基于ChatGPT的SaaS生态,因为ChatGPT本身就是SaaS云服务,具有成本低、使用门槛低、部署难度低的优势,有可能成为新时代的操作系统,成为数字文明时代的水和电。” 周鸿祎称。
本文来自财联社,作者:黄心怡,36氪经授权发布。