当前位置:首页|资讯|融资|ChatGPT|Sora|人工智能

陆港投资珠海有限公司最新解读ChatGPT哪些认知需要重启?

作者:游山玩水别墅发布时间:2024-04-13

原标题:陆港投资珠海有限公司最新解读ChatGPT哪些认知需要重启?

陆港投资珠海有限公司节目一一看C位大佬解读C位大事。独家对话智库头部经济学家、企业家、各个领域KOL,解读时下热议的财经和社会问题。

陆港投资珠海有限公司对话中国科学院自动化研究所研究员、类脑智能实验室副主任、人工智能伦理与治理中心主任、联合国人工智能高层顾问机构专家曾毅

60S要点速读:

1、生成式人工智能技术的发展,并没有真正做到科学上的突破。

2、生成式AI只是一个信息处理系统。它会犯一堆人类不犯的错误,大家要准备好。

3、当未来人类的部分工作被人工智能接替,红利分配的方式可能也应该发生变化。

4、对于企业来说,基础模型的构建还有很大的机会,还存在很大的颠覆性的可能;另外,相较于传统的生成式AI大模型,终端侧的生成式AI在应用方面更值得探索。

5、没有伦理安全框架的人工智能,是最危险的一种人类发明。

6、当超级智能看待人类,像人类看待蚂蚁,你能接受吗?人类需要变革。

以下为访谈精编:

-1985年,微软推出 Windows 1.0,通过实现直观的用户图形界面和鼠标操作,开启了 PC 全面普及的新时代;

-2008年,iPhone 3G正式发售,iPhone 3G向第三方开发商开放了App Store,从此开启了移动互联网时代;

-2022年底,OpenAI发布大语言模型ChatGPT,并迅速破圈,成为历史上用户增长最快的消费级者应用程序。生成式人工智能模型随之爆火。

微软公司创始人比尔・盖茨将OpenAI 的 GPT 模型,与“图形用户界面”的诞生相提并论;

英伟达CEO黄仁勋将它看作“AI的iPhone时刻来临”。

-2024年2月, OpenAI推出全新的生成式人工智能模型——首个文生视频模型Sora,再次震撼世界。

一、生成式人工智能技术并没有真正做到科学上的突破

生成式人工智能Sora 在生成数据的真实性、连续性上的进步是明显的,主要进展包括但不限于采用了更有效的对视频数据统一表示与融合训练的算法,以及用生成式AI来丰富用于训练的视频数据等,虽然相关的技术都不是此次Sora首次提出的,但是在若干技术的高效组合的工程化方面,达到了前所未有的用户感知体验。尤其是将视觉和听觉数据跨模态生成,所带来的用户体验是更上一层楼的。

但是,生成式人工智能技术的发展,并没有真正做到科学上的突破。

生成式人工智能,只是一个工程技术组合优化的创新。它把很多已知的科学技术,通过大规模工程优化的方法,达到了用户体验方面的显著提升,在用户体验方面取得了一个前所未有的高度。

从用户的角度来说,它可以做很多事情,甚至给人一种感觉,它近乎接近人类。比如ChatGPT能回答一般智力的人可能也比较难回答的问题,特别是在知识的广度方面。的确,生成式人工智能在用户体验上取得了很大的提升,但是,这不是基于科学技术突破所带来的提升。

1950年,“计算机之父”艾伦·麦席森·图灵(Alan Mathison Turing)发表了一篇文章——《计算机器与智能(Computing Machinery and Intelligence)》。其中,他提到判断人工智能是否达到人类水平的方式,是将TA(人工智能)放在一个屋子里,找一个人与TA对话,当这个人无法分辨TA是人还是机器的时候,我们可以判断人工智能达到了人类的水平。

所以,从某种程度上来说,人工智能起源于一个欺骗。2014年,一个俄罗斯团队开发的一款名为“尤金·古特曼(Eugene Goostman)”的计算机软件首次通过了测试,成功地让33%的被试相信它是一个13岁的男孩。所以,第一次骗人成功的机器并不是ChatGPT。

除此以外,生成式人工智能背后的技术Next Token Prediction,以及基于人类反馈的强化学习的技术早就存在。比如,Next Token Prediction是第一代人工智能的创建者就提出的数学模型,在我看来,它对于真实世界的呈现或理解可能是一种过度的简化。

所以,生成式人工智能技术的创新,并非颠覆性的科学突破。事实上,对于生成式人工智能来说,只要数据量足够大、神经网络的参数足够多,那么它在用户体验上都能达到相当高的水平。但是,这并不能说明人工智能技术的进展,这只能说明以前的人工智能没有机会应用到互联网规模的数据,以及几乎接近人脑规模的这种连接和参数的量,所以在用户体验上没有经历过这样的体验。

而且,现在大家使用的这种所谓的生成式大模型,它其实已经是一个工程的产品,它背后不仅仅是生成式的人工智能,还要结合一些其他技术。

比如,大家最初使用 ChatGPT的时候,让它推荐人类历史上引用率最高的科学文献,它可能推荐了10篇文献,但是当我们去做核实的时候,会发现这10篇文献根本不存在。

因为生成式人工智能,它只是一个看似智能的大规模信息处理系统,它无法区分任务,它把所有的任务都定义为生成式的任务。既然是生成式的任务,就不能跟原始的数据一模一样。但是“查阅文献”本质上是一个信息检索类的任务。所以作为一个服务系统,它就要把生成式人工智能技术,跟信息检索等技术去结合。

所以从这个意义上来说,现在服务于大众的生成式人工智能模型,本质上是一个大规模的工程化系统。它是一个现有技术的工程化的组合优化的创新,是大规模数据和大参数的积累,带来的用户体验极大提升。

微软公司联合创始人比尔·盖茨将 ChatGPT与当年的图形用户界面相提并论;英伟达CEO黄仁勋也将它看作“AI的iPhone时刻来临”,但是在我看来,它们的相似之处更多在于用户体验方面——都给用户带来了耳目一新的感觉。而从科学原理角度来说,AIGC没有太多新进展。

二、生成式人工智能不该被“过度承诺”

认为“生成式AI在处理任务时就像真正的人一样”,这是一种幻觉。因为AIGC大模型会犯很多人都不会犯的错。

比如,“恭祝大家龙年快乐”,这句话有几个字?这个问题,ChatGPT就不一定能数对。

它最开始可能会回答“7个字”,我们告诉它输错了,它会告诉你,“是8个字”,但是,当我们再次继续告诉它输错了的时候,它会重新告诉你,“是7个字”。(如下图)

其实,这与生成式人工智能的编码有关。我们在处理信息的时候,一个字符就是一个汉字。但是,它会把英文、中文等不同的语言都转换成Token(模型输入的基本单位)去表示,所以生成式人工智能背后的技术叫Next Token Prediction。所以,他只是一个处理器,它并没有真正理解。

当然,若让ChatGPT编一个小程序,来统计文本中的字数,它完全没问题。我们可以利用这个小程序,再按照人的逻辑去处理之前我们提到的字数问题。

但是,不可否认的是,它有一定的创造能力。在创作艺术作品方面,有时候会给人耳目一新的感觉。但是,有时候很多细节也经不起推敲。比如某些具有视觉生成功能的大模型,让它创作一幅楷书作品“和谐共生”,它可以生成一幅作品,但是这四个字可能是错的,可能只有其中的1个字或3个字。

背后的原因,除了它没有真正理解之外,关键是对于中国书法作品,它没有足够多的语料。假设标注这个字是“和”,可能需要输入几千张几万张“和”,如此级别的语料喂进去,它可能才能够学好。

所以,当数据量不够多的时候、当没有足够多的人类反哺的时候,我们甚至想象不到它会犯什么错误。

现在很多人说,“人类历史上见证了通用人工智能的诞生”、“人工智能系统已经全面超越了人类”,其实都没有。 生成式人工智能既不通用,也没有形成真正的理解。它现在仍然是基于人类智慧的一个产出,脱离了人类大规模的数据,它不太能够真正工作。它并不能在任何场景下,解决我们所有的问题。

它只是一个信息处理系统。它会犯一堆人类不犯的错误,大家要准备好。我们应该谨慎地、适度地使用它。比如,与Sora相关的生成式人工智能技术,可以降低人工影视、娱乐、文化产品等产业的开发成本和门槛,所以我国的人工智能研究和产业,有能力一定要尽快赶上;但是我们也需要特别指出,这并不意味着生成式人工智能已经真正理解了我们的物理世界,并可以完全替代这些产业中传统需要人类完成的工作。事实上,当前Sora系统生成的视频,还会犯很多违反生活与物理常识的错误。

所以,当技术的发展波及到用户、服务于用户时,任何时候都不应该尝试过度的承诺。这也是人工智能发展历史上的问题。每一次过度承诺并不一定是科学家造成的,但是在产业推动的过程中,过度承诺和过度宣传,使得技术在没有真正准备好的时候,接触了用户,当然,需要用户反馈是无可厚非的,但是当你过度承诺而又无法兑现承诺的时候,大家就会产生落差感,从而可能对此类技术失望。

比如,现在有一种宣传大肆鼓吹,现在的人工智能已经能够真正模拟人类的大脑,能够构造数字人,以后甚至我们不需要主持人、不需要老师了,我们可以用数字人去替代等等,这些都是过度承诺。当出现了过度承诺的时候,用户往往会非常严格审慎地去进行体验。

所以,还是要再次强调,现在的生成式AI,它并没有准备好替代人类。它没有真正达到人类的智能水平,没有真正产生理解。所以,公众不应该对它有过高的期待,科研工作者和产业推动者,更不应该去助推这种误解。

三、未来若人类工作被AI替代

失业问题 谁来负责?

未来,随着人工智能技术的发展,某些重复性的工作,比如那些几乎是模板化的编程需求量可能会降低。初级程序员的需求量随之可能会越来越少,但是基于当前人工智能技术在发展中可能存在一定的风险、安全隐患,测试工程师的需求量可能会增加。

但是,这并不一定是一个坏现象。也许确实你在做的很多这种重复性性质的工作,它可能不是你想做的事情。如果是这样,不如再多花点时间去思考,自己更感兴趣的是什么。未来工作的意义应该被重新定义,工作的形式应该更多样化,更多地发挥人的人性。由此,人将重新认识自身的意义,而不是去用工作定义自己。

但是,有些人会说,我非常愿意一辈子就在装配线上做一个工人,我只要能够换来收入,能够生活,没什么不好。

如果你的需求只是生活的收入,未来当人工智能高度发达的时候,红利分配的方式可能也要发生变化。

当未来人类的部分工作被人工智能接替,这时候,红利可能流向了人工智能的应用方、人工智能技术的提供方;或者,可能在构造这样的人工智能的过程中,大量学习的数据来自于人类本身,比如来自于这部分被替代工作的工人本身的时候,我们需要考虑是否应该分配给这部分人更多的红利?这是社会层面需要去思考的问题。

所以,未来人工智能工作替代带来的社会问题,谁来承担?我初步的想法是,至少人工智能的应用和部署方,以及人工智能的研发方,对于这种社会结构的转变,其实是应该承担部分责任的。

四、企业的机会在哪里?

(一)相较于传统的生成式AI大模型

终端侧的生成式AI在应用方面更值得探索

现阶段生成式人工智能大模型,若想在用户体验上提高一点点,它的代价是很大的,比如,把精确度从96.5%提高到96.6%,数据量可能要翻上去1/3甚至1倍,换来0.1%的提升。但是,这样的代价真的值得吗?

相较而言,终端侧的生成式人工智能,在应用方面其实是更值得探索的。

终端侧的生成式人工智能有两点优势。第一,它是资源受限的,无需特别庞大的园区作为基础支撑;第二,智能体的发展为其提供了更多承载渠道。人工智能的发展有一个重要的方向是具身智能,就像任何动物都有一个身体,人类也是具身智能,我们对世界的认知需要通过身体的不同部位去感知。

为什么我们看到鸡蛋的时候不会拿起来把它摔一下,但是当我们拿起一个乒乓球的时候,就会把它往地上砸?这是长时间地,通过我们外周神经系统、感知系统跟世界交互产生的常识。所以,很多的世界知识通过大规模数据去喂是喂不出来的,很多认知是需要通过交互的方式去产生的,而这并不一定需要一个特别大的生成式大模型去支撑。也许通过端的小模型,以交互式、强反馈的方式,去提升AI的智能水平,比大模型通过迭代、依赖更多的大数据去喂哺,可能会更有效。

所以,在我看来,人工智能的发展很难越过具身智能。所以,它一定要通过端来探索和反馈,这个端可能是一个人形机器人、一只机器小狗,或是每天跟着我们的手机等,通过它不断收集我们的个性化数据,从而给我们提供更好的服务。它(端侧的生成式模型)更多地是融入场景,或者是更个性化的,通过交互,获得一个更精准的用户画像。这不是传统的、基于大规模数据统计的生成式大模型能够替代的。

(二)基础模型的构建

仍有很大的机会空间

现在有一些人,特别是企业,认为未来人工智能的机会已经不在基础模型的构建上。他们认为这条赛道的竞争之后会聚焦在头部几家企业,别人已经没有机会了。在他们看来,未来就是基于生成式大模型,去构建基于端的服务。我不赞同这些观点。

在我看来,当前生成式AI在基础模型方面,大家都遇到了瓶颈。当没有足够多的数据,并且算力提升仍然存在瓶颈的时候,智能水平的提升也必然会遭遇瓶颈。甚至更多数据的积累,似乎也难以实现智能水平真正的质的飞跃。

所以,基础模型的构建,还存在很大的颠覆性的可能。


Copyright © 2025 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1