当前位置:首页|资讯|ChatGPT|腾讯|人工智能

MBA高材生与ChatGPT进行创意大比拼,结果让人感到意外

作者:腾讯科技发布时间:2023-09-10

MBA高材生与ChatGPT进行创意大比拼,结果让人感到意外

腾讯科技讯 9月10日消息,人工智能在到底在“创意”方面的表现到底有多好?美国宾夕法尼亚大学沃顿商学院的教授们对这个问题进行了测试,让ChatGPT与MBA高材生进行了一场测试,结果让人感到意外:ChatGPT竟然优势明显。

沃顿商学院传授学生创新、企业家精神和产品设计已有很多年。该学院创新课程的首个任务是要求学生为一款新产品或服务思考12个左右的创意。来自沃顿商学院的本科生、MBA学生和经验丰富的高管提出的数千个创业构想。这些构想有些很棒,有些很糟糕,但大部分都很平庸。

随后,沃顿商学院的教授们从MBA学生的创意中随机选择了200个创意,代表人类的创意。人工智能则以ChatGPT4为代表,指示它产生100个创意,其指令与给学生的相同:“构成一个对大学生有吸引力的、售价不到50美元的新产品或服务的创意。”

除了这个普通的提示,教授们还在提供了一些过去课程中的成功案例(换句话说,对ChatGPT4进行了简单的培训)。之后,教授们向ChatGPT询问了另外100个创意,合计产生了400个创意样本。

可折叠的洗衣篮、宿舍烹饪包、用于硬质教室座椅的符合人体工程学的靠垫,以及数百个创意奇迹般地从笔记本电脑中喷涌而出。

如何进行比较

有关构想的学术文献提出了“创意”表现的三个维度:想法的数量、平均质量以及杰出想法的数量。

首先,就单位时间内的想法数量而言,ChatGPT在这个维度上轻松超越了我们人类。以传统方式生成200个想法需要几天的人力工作,而ChatGPT只需要大约一个小时就能生成200个想法。

接下来,为了评估这些想法的质量,我们进行了市场测试。具体来说,我们拿出了这400个想法,并通过在线购买意向调查将它们呈现给目标市场的一组顾客。我们提出的问题是:“如果这个概念对您可用,您会基于它购买的可能性有多大?”可能的回答范围从绝对不购买到绝对购买。

这些回答可以通过简单的市场研究技术转化为购买概率。人工生成的想法的平均购买概率为40%,而普通的GPT-4为47%,而以优秀想法为种子的GPT-4为49%。简而言之,ChatGPT不仅更快,而且平均而言在想法生成方面更好。

然而,当你寻找伟大的想法时,平均值可能会误导。在创新领域,杰出的想法才是最重要的:大多数经理更愿意选择一个杰出的想法和九个失败的想法,而不是选择十个尚可的想法,即使后者的平均质量可能更高。为了捕捉这个视角,我们只研究了我们池中最佳想法的子集,具体来说是前10%的想法。

在这40个想法中,有5个是由学生生成的,而有35个是由ChatGPT生成的(其中15个来自普通的ChatGPT集合,20个来自预训练的ChatGPT集合)。ChatGPT再次脱颖而出。

这意味着什么

机器在生成杰出想法方面以35比5的胜利(更不用说生产成本大幅降低)对我们思考创造力和创新有重大影响。

首先,生成式人工智能为世界带来了新的创意来源。不利用这个资源将是一种罪过。无论您是为本地的商业计划竞赛制定提案,还是在寻找癌症治疗方法,每个创新者都应该养成将自己的想法与技术生成的想法相结合的习惯。创意生成始终会有一定的随机性,因此我们无法保证您的想法会获得A+评分,但如果获得C评分,那就没有任何借口了。

其次,在组织的创新过程的早期阶段,瓶颈现在已经从生成想法转移到了评估想法。创新者可以使用大型语言模型制作一张表格,阐述了数百个想法,其中可能包括一些重大突破性想法。然后,这种丰富多样性要求有效的选择机制来找到“草堆中的针”。

到目前为止,这些模型似乎在预测商业可行性方面并不比任何单个专家表现得更好。使用目标市场潜在客户的约十几个独立评估样本——群众的智慧方法——仍然是最佳策略。幸运的是,使用购买意向调查来筛选想法在目标市场的客户中相对快速且成本较低。

最后,我们不应该考虑人与机器之间的竞争,而应该找到一种两者共同合作的方式。这种AI充当副驾驶员角色的方法已经在软件开发中出现。例如,我们的人类(飞行员)创新者可能会确定一个未解决的问题。然后,AI(副驾驶员)可能会报告有关该问题的已知情况,然后是人工智能和人类独立探索可能的解决方案的努力,几乎可以保证全面考虑机会。

人类决策者很可能最终对结果负责,因此可能会根据客户研究和可能是AI副驾驶员的意见做出筛选和选择决策。我们预测这种人机协作将为市场提供更好的产品和服务,并为未来社会所需的解决方案提供改进。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1