2023年科技界谁得热度最高?我想AI大模型能肯定能排在前列。那么它到底是什么?跟我们普通人又有多大关系?会对人类造成什么影响?那么今天我们就来盘点一下关于AI大模型的各种事儿。
当下,如果打开一个资讯类APP,那么你看到的内容很有可能就是AI生成的,并且不局限于文章,有的是图片,有的是音频,甚至是视频。并且,在创作方面,AI已经体现出了超越人类的效率和能力,而这一些都得益于AI大模型的高速发展。
一、什么是AI大模型?
它是大规模语言模型的简称,英文叫Large Language Model,也可以缩写为LLM。其中的大字,特指模型结构容量大,结构中的参数多,用于预训练大模型的数据量大。所以,大规模也可以称为具有庞大的参数规模和复杂程度的机器学习模型。
由于大模型够大,通常具有更强的表达能力和更高的准确度,在很多应用场景中都有巨大的发展潜力。
那么按应用领域来看,目前大模型主要可以分成三类,分别是语言大模型(NPL)、视觉大模型(CV)和多模态大模型。
语言大模型,是自然语言处理领域中的一种深度学习模型,使用大量文本数据进行训练,可以生成自然语言文本或理解语言文本的含义,例如年初火遍全球的ChatGPT。
视觉大模型利用大量的数据和算法,构建具有高度识别、分析和表达能力的视觉系统。它可以模仿人类视觉系统的工作原理,对图像进行处理和分析,并通过机器学习来不断优化自身的算法。在移动互联网时代,视觉大模型的应用场景非常广泛,常见的有图像分类、目标检测、图像分割、姿态估计、人脸识别、智能安防等等。例如,美图的奇想智能。
多模态大模型指的是能处理来自不同模态,例如图像、语音、文本等多种信息的大模型,具有上面两种大模型的能力,能够实现图像生成、图像理解、3D生成和视频生成等应用。例如,华中科技大学的Monkey大模型,它就具备了“观察”世界的技能,可对图片进行深入问答交流和精确描述。
另外,还有一类叫科学大模型。顾名思义,与科学研究和应用有关,它可以从海量的数据中提取出数理规律,通过人工智能技术,更快更准的解决科学计算问题,应用领域包括气象、医药、水务、机械、航天航空等等。例如,华为的科学计算大模型。
二、通过前面的讲述,我们对AI大模型已经有了初步的了解,那么这些大模型,对于我们普通人来说,具体能做什么呢?
1、自动写作
例如,自动写文章、写新闻,写小说、写故事,写剧本、写工作总结,只要是你想写的,AI基本都能帮你完成。另外,还可以在已有内容的基础上,进行改写、扩写,丰富文章长度和信息增量。
当然了,逆向操作也是可以的,扔给AI一篇文章,一个报告,一份文档,让它总结一下精华,或者成多个标题都是没有问题的。
那么AI具备的这个能力,在我们日常工作和学习场景中,可以发挥出巨大的作用。如果能加以利用,势必可有效提高效率。
并且,当下这方面的应用已经相当成熟,具有代表性的有文心一言,Notion,ChatGPT等等。
2、生成图片
主要有两种方式,以文生图和以图生图。
以文生图就是先输入文字,也就是想要图片的描述,然后由AI生成。
以图生图是先上传一张图片,在这张图的基础上进行创造,可以是扩充图片,也开始更换背景,更换指定元素,也可以更换风格,例如真人照片变成卡通风格,竖版照片扩充为横版照片,给图片中的人物更换服装等等。
目前,这方面的技术也相对成熟,在动漫制作、小说推文、海报创意、包装设计、电商等领域,AI生图已经获得了极大的应用。具有代表性的平台有文心一格,Midjourney,Stable diffusion等等。
3、音频合成
一种是语音合成,也就是输入文字,生成多种角色和风格的音频解说。这类音频在各个内容平台很常见,包括影视解说、小说、有声书等领域。另外,现在很多知名的视频剪辑软件,都自带文字转语音功能,用起来很方便。
另一种是音乐创作,根据相关描述生成一段音乐作品。例如,Google的Magenta,可以根据用户的输入条件生成独特的旋律、和声和编曲。
4、视频生成
跟音频合成类似,只需要输入文字,就能自动匹配相关画面,然后生成视频。当下很多工具都集成了这个功能,例如百度的度剪,抖音的剪映,并且已经可以做到一定质量和水准。
另外,在视频领域,通过人工智能技术还可以实现静态图片变视频,自动去除或替换某个部分、自动更换风格、自动视频剪辑等高级功能,例如Runway等等。
5、编写代码
编程其实跟写作类似,但相比起来,编程具有更多的规律性,所以经过大量训练的AI,其实是非常适合用来编写代码的。如果从事的是程序员的工作,利用好AI,效率可以得到极大的提升。除了代码的编写,还可以让AI帮助测试、优化、查找错误。
6、教育与培训
同样基于海量数据,人类可以把AI当做一位老师,一门课程,甚至一个学科来互动。可以问它具体的问题,可以让它提供学习方法、策略和思路,可以让它给孩子出题,配孩子做测验,玩知识性的互动游戏。以及现实场景下,较难实现的学习形式,例如让AI与你进行口语对话练习,这远比传统外教的方式省钱,而且随时随地都能开展,效率高,效果也不差。
7、充当客服
通过前期特定知识的训练,AI可以快速掌握所有与企业、行业、产品等相关的信息,进而实现高效率回复用户提出的各种问题,远比传统客服高效。而且人工方式不仅需要招人,还涉及到培养等各项工作,并且人类是很难做到24小时不停工作的。
总之,上面几个例子,只是AI实际应用的几个场景而已。严格来说,AI大模型的应用范围非常广泛,其实绝大部分非体力劳动的工作,都可以利用AI技术完成。或者说,在AI技术的加持下,可以显著提高效率和效果。所以,此时此刻我们需要清楚的认知到,这些AI大模型已经与我们的日常生活和工作息息相关,自然也无法摆脱AI技术对我们的影响。当然了,也无需各种各样的担心。毕竟AI只是人类发明的工具而已,只要我们能利用好它,就不会被取代。
三、国产AI大模型有哪些?
由于美国在底层架构上,例如芯片行业,具有很强的技术优势,其AI行业的发展处于世界领先地位。那么我们中国有没有能打的AI大模型呢?答案是当然有。例如,最有代表性的就是百度度的文心大模型。
百度是国内较早布局AI领域的公司,这些年也取得了很多成绩,不仅有AI开放大平台,还有自研AI芯片昆仑,以及当下最为火爆的AI大模型。
目前,也形成了NLP大模型、CV大模型、跨模态大模型、生物计算大模型以及行业大模型的产品线。尤其是文心一言、文心一格已经全面开放,并获得大量应用。
文心一言是基于文心大模型推出的生成式对话AI,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。
文心一格是AI作画产品,依托飞桨、文心大模型,只需输入文字描述,就能快速生成各种风格的精美画作。
除此之外,国产的还科大讯飞的星火大模型、智谱的ChatGLM大模型、 商汤的中文语言大模型商量、360的通用认知大模型智脑、阿里的通义千问大模型,北师大的悟道语言大模型,清华大学的智谱AI大模型等等等等。
也就是说,我国在AI大模型领域,正处于高速发展阶段,那么关键的问题来了,国产大模型与ChatGPT等国外大模型相比,水平到底如何呢?
根据SuperCLUE发布的10月份测试结果显示,OpenAI的GPT4排名第一,第二名是前OpenAI员工创办的Claude2,以及其自家的GPT3.5,第四名是来自vivo自研的vivoLM大模型。后面还有文心一言、云雀、讯飞星火等国产大模型,并且大家与GPT3.5的差距已经不大。
另外,根据人工智能大模型体验报告中的数据显示,在综合指数方面,GPT4和GPT3.5的得分分别为1246和1148,排名前两名,文心一言为1112,与GPT3.5非常接近,位列第三名,并且后面的通义千问、星火等,与GPT3.5的差距也不大。
总之,相信随着时间的推移,国产大模型将会很快超过GPT3.5,随着国产半导体产业链的不断突破,尤其是AI芯片领域的崛起,中国AI的水平一定可以达到世界最先进的水平。原因很简单,只有我们才有最适合AI大面积应用的场景,这里不仅仅是AI技术本身,还包括基础设施建设、人口数量、5G6G发展、生活习惯等等等等,这些都是世界独一无二的。而AI想要进化,实际使用,也就是持续的喂它真实数据,才是最核心的。
四、AI大模型引发的安全问题
从ChatGPT火爆开始,对于安全问题的讨论就从未停止过。
一方面,AI大模型是需要通过大量数据进行计算的,那么这些数据是否有错误的信息?将会决定最终给与用户反馈内容的准确性。
同时,AI大模型给出错误回答,甚至是持有偏见的言论、故意说谎、胡言乱语,如果将这样的信息用以学术交流、科学研究等领域,势必会引发严重后果。
另一方面,将隐私数据、敏感信息发送给AI大模型,也极容易造成信息的泄露。例如,企业的订单数据、核心代码、关键文档等等。
并且,AI用以训练的数据的来源是什么?是否合法?是否获得了用户的需求?这也是一个具有代表性的问题。
第三,AI大模型在实际使用过程中,无法判断使用者的个人情况,在较为敏感的问题时,不能针对特定人群给出相应答案,尤其对未成年人来说,是非常危险的,很容易造成不合时宜信息的传递。
所以,AI大模型虽然取得了突飞猛进的发展,但是在安全性方面貌似没有跟上。不过,目前世界各国也都越发重视这个问题了。
例如,今年6月14日,欧洲议会投票通过了《人工智能法案》,禁止实时面部识别,并对ChatGPT等生成式人工智能工具提出了新的透明度要求。
再例如8月15日起,我国的《生成式人工智能服务管理暂行办法》正式施行,针对传播虚假信息、侵害个人信息权益、数据安全和偏见歧视等问题,办法规定了包括使用AI生成内容不得侵害他人肖像权、应对AI生成的图片视频进行标识等具体细则。未来各国对于AI技术的监管,将会越来越严格。
总之,AI大模型虽然在很多领域已经得到广泛应用,但仍然面临着各种各样的问题和挑战。但不可否认的是,人工智能将会引发人类的第四次科技大变革,其带来的影响必将持续而深远。可以说,包括消费、就业、贸易、投资、教育等在内的几乎所有领域,都将受到AI技术的影响,人们的生活、生产方式,都将发生翻天覆地的变化。所以,此时此刻,我们每个人都应该琢磨琢磨,AI高速发展的大背景下,如何更好的利用他们,满足我们不断成长的需要,让自己在竞争激烈的现代社会里,取得更多优势和结果。
当然,作为未来人类世界最重要的技术领域之一,人工智能也是国家持续发展和壮大,以及大国之间竞争的关键所在,这又意味些什么?是时候好好思考一下了。
一览弘观 2023-01-11
AI格子管家 2024-05-13