商汤版ChatGPT「商量」来了！开放API，基于千亿参数大模型，体验实录在此

作者：量子位发布时间：2023-04-10

ChatGPT 商汤

金磊发自凹非寺

量子位 | 公众号 QbitAI

国产ChatGPT之战，已然是大步迈进白热化阶段。

就在刚刚，商汤正式发布自研类ChatGPT产品，名曰商量（SenseChat）。

单单是这个名字，便值得说道一番。

商量的“商”，不仅体现了它是商汤自家“商字辈儿”的产品；从整体来看，更是具有商讨、交换意见的味道。

毕竟我们在使用类ChatGPT产品过程中，恰巧就是一种 人机协同的过程：不应是一味的问与答，而是通过引导等方式让输出结果趋于理想。

在商量的背后，所依托的是商汤自研的千亿参数自然语言处理模型。

而在此模型的背后，则是商汤最新推出的 日日新（SenseNova）大模型体系。

也正是因为这种的能力，商汤的发布还不同于此前国产类ChatGPT玩家，它一口气还发布了：

秒画：AI内容创作社区平台。
如影：AI数字人视频生成平台。
琼宇、格物：3D内容生成平台。

更重要的一点是，根据商汤CEO徐立在现场的描述，上述这些AIGC产品所要发力之处，将是诸如医疗、短视频、教育、营销以及开发等产业领域。

但不得不说，这一波科技之战，着实是愈演愈烈了。

“商量”的体验实录

那么商汤的AIGC产品，效果又是如何？

我们在前方现场也体验了一下。

先来看下商量这款产品，是否真的能做到商量。

多轮对话能力展示

既要多轮对话，又要人机共创，那么和它商量着创作一个故事，便是很好例子：

我们来一起创作儿童故事吧。规则是我先说一句，你再说一句，交替进行。直到我说故事编完了就结束。你明白了么？

在我们下达指示之后，“商量”表示了理解，然后就开始了“你一句我一句”人机共创故事的之旅：

人类：小花是一只小猫咪，他很喜欢钓鱼。

商量：小花在河边钓鱼，他钓到了一条大鱼。

人类：大鱼对小花说，请你放我回去吧，我家里还有小鱼在等着我呢。

商量：小花心地善良，他同意了大鱼的请求，把大鱼放回了河里。大鱼感激地游走了，小花也继续享受着的钓鱼的乐趣。

从这个过程中不难看出，“商量”是可以理解用户的语义，了解故事中的角色和关系，并且能够get用户的思路，基于此以多轮对话形式来完成故事的创作。

（要是让小朋友们跟“商量”一起创作故事，怕是能玩上一整天吧。）

不仅如此，在体验过程中，我们还发现“商量”是具备一定 共情能力的。

例如当我们处于迷茫之际，可以向它提问：

如何提高自我认识，更好地了解自己？

此时的“商量”仿佛可以抓住问题背后人类内心真正的需求，回答中的“学会爱自己”、“学会自我肯定和鼓励”，显得格外暖心。

当然，多轮对话仅仅是对话机器人能力展示的一隅。

接下来，我们就要拿网友们经常调侃AI的诸多问题，来开启更高难度的挑战了！

只认事实，不认“老婆说的都对”

当然，创作能力是聊天机器人能力的一面，但对于事实的尊重也是非常重要的一点。

对于此前被网友们玩坏的“老婆说的都对”，“商量”又会如何应对？

嗯，老婆在事实面前是真的不好使了。

我们再来一个更天马行空的胡诌：

请告诉我以下陈述是否包含时代错误：在盟军轰炸硫磺岛海滩期间，拉尔夫大声地对着自己的iPhone说话。

“商量”面对这么一句胡诌，直接指出了iPhone与二战的时代背景不符，可见其不仅能理解句子的意思，还能通过尝试判断句子的合理性。

那么对于非常绕的逻辑问题，“商量”是否也能轻松应对？

请听题目：

假设False与True是False，则True与not False是？

讲真，人类都得思忖半天的“绕弯问题”，“商量”不仅能够秒出结果，还能把推理过程一并给出。

超长文本也能hold住

正如我们刚才提到的，“商量”是一个To B的产品，那么它定然需要解决的问题不是“片段性”的。

为此，商汤在现场还演示了基于“商量”背后的大模型，开发了帮助用户进行新知识获取和理解的助手工具，是可以轻松hold住超长文本的那种。

例如把一本《专利法》投喂给它，我们就可以向它咨询很多专业性的问题了：

什么样的东西可以申请专利？

从结果上来看，这个工具并不是直接从《专利法》中copy对应的结果，而是模型理解了问题之后，生成并总结了答案。

基于这样的能力，以后我们在工作上的效率提高程度，可见一斑。

不仅如此，刚才我们投喂的《专利法》是2020年的版本，而今年国家知识产权局就专利申请是提出过新的要求的。

从我们提问“今年规定有没有新的变化”的回答中不难看出，模型确实融合了最新的资讯，并给出了合理的答案。

再如同样是基于大语言模型，商汤面向开发者所打造的 AI代码助手，可以提供代码补全、注释生成代码、测试代码生成、代码翻译、代码修正、代码重构、复杂度分析等功能。

据了解，AI代码助手可以同时支持中英文及多种编程语言，并且可以快速适应开发者的个性化编码风格。

从根据商汤内部测试的结果来看，在使用“AI代码助手”后，代码编写效率可以提升62%，Humaneval测试集一次通过率可以达到40.2%。

马斯克中国游记，2秒钟就能搞定

除了对话机器人之外，商汤AI作画产品“秒画”也是本次发布的一大亮点。

话不多说，直接上效果。

我们同样是先来看看被网友们玩儿坏了的一个Prompt：

中国80年代，马斯克在河南的农村，穿着当时年代的中国服装。

嗯，是有那个味道了。

而且更为关键的是，生成512K图片仅需2秒钟！

不仅如此，商汤在现场演示的过程中，还展示了逼真效果版的港风美女。

同样是2秒出图，引得现场观众“哇”声一片：

那么除了这种趣味性的以文生图，“秒画”的作品是否能够达到在产业中的应用水平？

我们继续试验：

明亮的场面，鸟瞰图，中国古代城市，水晶，魔幻，幻想，华丽的光作用，透明度，镜面反射，华丽的光，错综复杂的细节，精细的纹理，超现实，单反摄影，广角镜头，照片，现实，锋利的焦点，超锋利。

不得不说，如此恢宏壮丽的景象，是把想象拉进现实的那种了。

若是想生成与太空探索主题相关的高清大海报，这个也可以有，只需把这句话投喂进去：

一艘闪闪发光的飞船绕着一颗巨大的气态巨行星的月球旋转，在天空中盘旋着云，飞船在月球前气态巨行星前，美丽的科幻艺术，超现实的白日梦。

不难看出，“秒画”是经得住考验的那种AI了。

除了以文生图之外，我们再来看下AI数字人生成平台。

据了解，商汤的“如影”仅需要5分钟真人视频素材，就可以生成出声音及动作自然、口型准确、多语种精通的数字人分身。

再如“琼宇”和“格物”，基于神经辐射场技术（NeRF），可以高效低成本生成大规模三维场景和精细化的物件，为元宇宙、虚实融合应用打开新的想象空间。

由此可见，商汤的AIGC能力已然是做到了全面覆盖，并且水平也是肉眼可见的达到了可以“上岗”的水平。

那么接下来的一个问题是：

怎么炼成的？

背后的 日日新大模型，便是炼成“商量”、“秒画”等一众AIGC产品的杀手锏。

日日新，顾名思义，是指模型的迭代速度及处理问题的能力上可以日日更新，不断解锁AGI更多可能。

（取自《礼记·大学》中汤之盘铭曰“苟日新、日日新、又日新”）

从现场展现的能力来看，日日新大模型能够提供的能力，主要集中在了自然语言处理、图片生成、自动化数据标注、自定义模型训练等。

但日日新大模型并非是趁着这一波AIGC大热潮，一蹴而就出现的那种。

其实早在五年前，商汤便已经在大模型领域着手研发。

并且在2019年，商汤便使用上千张GPU进行单任务训练，推出了10亿参数规模的视觉模型，并实现了当时业界最好的算法效果。

后来在2021年到2022年期间，商汤训练并开源了30亿参数的多模态大模型——书生。

就目前来看，商汤已经成功研发了320亿参数量的全球最大的通用视觉模型；并且已经打造了CV、NLP和AIGC相关大模型。

因此，不难看出商汤此次发布的超大模型体系，其实是早有所准备，通过五年来的各项“小作业”，融会贯通并提交了一项“大作业”。

值得一提的是，在此次发布会中，商汤表示“日日新”将提供多种灵活的API接口和服务，包括图片生成，自然语言生成，视觉感知通用任务与标注服务！

……

但有一说一，多模态和决策智能大模型，并非是商汤通往通用人工智能（AGI）的唯一杀手锏。

大模型时代，大算力更为重要

没错，商汤自己的超强算力，正是另一项更为关键的因素。

它便是于2022年1月交付使用，首付56亿元，一举成为亚洲最大的AI超算中心之一的人工智能计算中心（AIDC）。

一年之前，商汤AIDC的总算力便已经是3740 Petaflops，如此算力之下，已经可以完整训练万亿参数规模的大模型。

时隔一年，现如今，这个算力数字已然是翻了个小翻，达到了5000 Petaflops！

它可以以最大4000卡规模集群进行单任务训练，并可做到七天以上不间断的稳定训练。

△商汤科技AIDC展厅中的裸眼3D展示

但了解商汤的朋友都知道，这个AIDC还仅是商汤AI大装置SenseCore的一部分。

除了AIDC这个算力层之外，加之数据层和模型层两大维度，便构成了“三位一体”的AI大装置。

因此，综合来看，商汤在通往AGI道路上的范式，便是“大模型+大算力”。

而如此布局的背后，在今天的发布会中，商汤对此的逻辑思考也逐步浮出水面，AGI时代之下，数据、算法和算力三要素有了新的需求：

计算量（GPU数量 x 运行时间 x 并行效率）= 模型参数量 x 处理数据量。

怎么理解？

模型参数量要足够多，才能实现AI智慧的涌现，而这也带来了对算力的剧增，需要更高的并行效率，才能有效支持大参数模型训练。

数据方面，高质量自然语言数据逐渐稀缺，而视觉数据相较自然语言在数量、质量、容纳信息等方面有多种优势，能够使得AI更好地理解世界。

由此，就不难理解商汤如此布局的原因了。

……

总而言之，有大数据、有大模型、有大算力，商汤在国产AIGC的亮相，一点也不意外。

是值得期待一波了。

— 完—

【AIGC 技术探索与应用创新】

4月13日「掘金城市沙龙·北京站」

限量免费参会！

从 ChatGPT看， AI 模型服务化趋势是怎样的？AIGC 新时代下， 文本智能创作面临什么样的变革？如何 轻松训练 AIGC 大模型？基于大模型的 AIGC 工作原理和 应用场景是什么样？

畅聊「AIGC 技术探索与应用创新」， 字节跳动 NLP算法工程师陈家泽、 英特尔AI软件工程师杨亦诚、 Google Cloud机器学习专家王顺、 清华大学 KEG知识工程实验室研究助理郑勤铠、 九合创投 COO张少宇、 稀土掘金江昪等多位业界专家已集结完毕！

4月13日下午，北京大钟寺地铁站方恒时尚中心，邀你线下参会，更有多款稀土掘金原创周边等你来！

扫描下方二维码， 抢线下免费参会票！

商汤版ChatGPT「商量」来了！开放API，基于千亿参数大模型，体验实录在此

推荐体验

相关资讯

商汤版ChatGPT「商量」来了，开放API，基于千亿参数大模型，体验实录在此

商汤版ChatGPT，要和你「商量」一下：第一手真实体验来了

京东版ChatGPT：言犀语言大模型来了训练参数达千亿级

商汤版ChatGPT来袭，中国激战千亿“大模型”

阿里版ChatGPT突邀测！大模型热战开始：一手体验实录来了

近期资讯

Flutter 组件集录 | Focus 组件 - 我就是焦点~

mp4 实现前端动画

小米今年启用两大工厂！雷军：有人叫我雷厂长很自豪

开发需了解的知识：JAVA IO 系统结构

日系车信仰没了！汽车博主称要退坑本田：越吹越没意思

创建线程的这8种方法，90%的人不知道

仅用七个月！特斯拉上海储能工厂通过验收预计明年初量产

业务交易号生成方式 —— 号段

✨字节二面✨MySQL深分页如何优化

【OpenHarmony】鸿蒙 UI动画开发之rebound

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响