6月16日消息,据外媒报道,OpenAI去年3月份推出的大语言模型GPT-4,在研究人员所进行的实验中的表现虽然还不及人类参与者的平均水平,但已达到了图灵测试的通过标准,在GPT-4之前推出的GPT-3.5,在最新的测试中也达到了通过标准。
GPT-4通过图灵测试,是源自加州大学圣地亚哥分校的研究人员所进行的实验,他们在实验中选定参与实验的还有上世纪60年代的人工智能系统ELIZA,另有一组人类参与者,研究人员让500人与他们进行5分钟的对话,然后判断对话的是人还是人工智能。
而最终的结果表明,GPT-4在54%的时间里被误认为是人类,GPT-3.5则是在50%的时间里被误认为是人类,没有大语言模型或神经网络支持的ELIZA,则是在22%的时间里被误认为是人类。
GPT-4和GPT-3.5在实验中的表现虽然不及人类参与者67%的平均水平,但根据现在普遍认同的有30%回答被测试者误认为是人类,就算通过测试的标准,它们就都通过了图灵测试。
不过,由于加州大学圣地亚哥分校的研究人员在进行实验时,OpenAI尚未宣布新一代的旗舰模型GPT-4o,可以利用语音、视频和文本信息进行实时推理的这一模型,如果参与测试,被误认为人类的结果可能就会更高。
图灵测试源自被称为人工智能之父的英国数学家、逻辑学家艾伦·麦席森·图灵,他在1950年的论文《计算机器与智能》中提出,测试的流程是由一名测试者写下自己的问题,随后将问题以纯文本的形式发送给另一个房间中的一个人与一台机器,测试者根据他们的回答来判断哪一个是真人,哪一个是机器,所有参与测试的人或机器都会被分开,这个测试旨在探究机器能否模拟出与人类相似或无法区分的智能。
除了图灵测试和在人工智能上的贡献,图灵为广大科学领域的关注者所熟知还有图灵奖,由美国计算机协会(ACM)在1966年设立的这一奖项,旨在奖励对计算机事业作出重要贡献的个人,是计算机领域的国际最高奖项,被誉为“计算机界的诺贝尔奖”,一般每年仅颁发给一人,清华姚班和智班的创立者姚期智,就是2000年的获得者。