人工智能的下一次飞跃:从数万亿词元到每一个文字
文/John Werner,撰稿人
今天,在麻省理工学院的“人工智能影响”(AI for Impact)课程上,人工智能的发展轨迹以一种令人叹为观止的方式得到了展示。以下就是行业专家眼中的人工智能的未来:
图片来源:GETTY
资源的爆炸式增长:在这十年里,我们见证了用于人工智能的算力资源增长了1万倍。这不仅仅是一次增长;这是一场革命。
以前也发生过:根据摩尔定律,计算机的处理能力每两年翻一番。英伟达首席执行官黄仁勋声称,在过去10年里,英伟达的GPU将人工智能的处理性能提高了不少于100万倍。黄仁勋预测,它们的算力还将再增长100万倍。
万亿词元:现代人工智能模型正在以惊人的万亿词元(token)为基础进行训练。从这个角度来看,整个美国国会图书馆的文本大约有20TB,或者3.6万亿词元。作为参考,GPT-4被认为有1.75万亿个参数。
美国国会图书馆主阅览室。图片来源:GETTY
有史以来的所有文字:AI的雄心壮志不会止步于国会图书馆。它的下一个训练模型有可能囊括人类历史上书写过的每一个单词。
大到可怕的数据集:当我们谈论AI正在处理的这些大到可怕的数据集时,“大数据”这个词似乎已经变得过时。
多模态学习:AI不仅是关于文本。未来的人工智能将是多模态的,可以处理图像、声音等多种模态的输入和输出。
个人AI:你将能够与你的个人AI聊天和通话,它甚至可以是一个克隆人,就像你自己一样。
跨模型:人工智能系统也将是跨模型的,根据所需的专业知识和信息,将各种模型混合在一起。
基础巨头:未来的人工智能模型是巨大的。它们不仅规模庞大,而且是重新定义了巨型基础模型的规模。
约等于一本书体量的上下文:想象一下,一个AI使用10万个词元(相当于一整本书),只是为了提供回答一个问题的上下文。你不需要想象这一点:Anthropic公司的Claude.ai已经能够这样做了。
语境为王:这种内容广泛的上下文不仅是为了展示。这对于帮助AI避免出现“幻觉”或错误输出至关重要。
人工智能的未来不仅仅是在于更多的数据或更强的处理能力。它是关于重新定义知识、理解和背景的结构。当我们站在这个新时代的悬崖上时,有一件事是明确的:人工智能革命才刚刚开始。
拥有大数据的服务器机房。图片来源:GETTY
以下是基于麻省理工学院人工智能课程分享的对即将到来的人工智能革命的见解:
人工智能正处于爆炸式增长的风口浪尖,它将重塑我们的生活和工作方式。今天在MIT课堂上提出的一个观点是,它可以与蒸汽机和微芯片媲美,成为互联网规模的另一场革命。该校的学生正在寻找人工智能改变主要行业的巨大机遇。
从这个项目中产生的想法有可能成为未来的突破性独角兽企业,但它们应该首先立足于解决人类的实际需求,其次才是技术。学生们介绍了农业科技、教育科技、废物处理和老年人护理等领域的创业公司。发言者强调,考虑到市场的时机,大胆而专注是非常必要的。
关键是将这些强大的技术与真正的市场需求相匹配。托尼继续说,“这项技术让我很兴奋,但如果你不从市场入手,你只会造出一些没人用的东西。”这门课程促使学生深入了解他们的客户,绘制生态系统,并阐明人工智能如何实现价值的阶跃式变化。在麻省理工学院的人工智能创业工作室,人们关注的重点是AI对现实世界的影响。
麻省理工学院教授拉梅什·拉斯卡尔(Ramesh Raskar)表示:“尽管人工智能的努力似乎被局限在大型中心化公司的手中,但这个领域的未来是数以百万计的微型模型,它们将相互协作,开创去中心化人工智能领域。
本文作者是MIT资深研究员,也是福布斯撰稿人,文章内容仅代表作者本人观点。译自https://www.forbes.com/sites/johnwerner/2023/09/14/ais-next-leap-from-trillions-of-tokens-to-every-word-ever-written/?sh=63dc88d8773b