发展历程:
2012年AI研究宗师杰夫·辛顿带领来自的学生伊利亚·萨特斯基弗和另一位学生研究发明了一个识别图像的准确率极高的ai模型,在学术界引起了轰动,也直接奠定了萨特斯基弗产业泰斗的历史地位。
2012年,杰夫·辛顿和萨特斯基弗的论文让AGI(通用人工智能)的可行性跨出了一大步,但以当代的科研基础,谈论AGI,依旧就像谈论如何长生不老一样民科。所谓AGI,即“超级智能”,接近科幻电影中万能的人工智能;与之形成对比的是人脸识别、翻译、下围棋等只能完成单一任务的人工智能。
2014年,美国硅谷流行“AI取代人类”说法。
2015年夏天,马斯克与创业孵化器Y Combinator的新任掌门萨姆·阿尔特曼掏出10亿美元,筹备一家非盈利导向的AI实验室OpenAI,并将萨特斯基弗从谷歌挖到openAI,研究AGI,“让人类以更接近于安全的方式构建真正的AI”。
2015-2016先后有大量研究人员加入OpenAI,但尚未有明确的研究目标。
2017年是openAI的分水岭。3月,谷歌在一篇论文中开源了“Transformer神经网络架构”。它的革命性在于可以让AI“听懂人话”,而这很可能会是通往AGI的关键钥匙,自此AI进入大模型阶段。所谓大模型,背后支撑的是大算力、大数据以及大算法,也意味着烧大钱。OpenAI以此为基础开展研究。
2018年初,马斯克为避免与特斯拉AI业务有所冲突宣布辞职。
2019年,阿尔特曼将OpenAI改为盈利性组织,微软投资OpenAI十亿美元。OpenAI沿着Transformer路线研发NLP (自然语言识别)预训练四代模型:无监督学习的GPT-1、多任务学习的GPT-2、海量参数的GPT-3,及非开源的GPT-3.5。
2022年12月1日,OpenAI基于GPT3.5推出了衍生产品-ChatGPT。该模型利用AzureAI (微软云为基础)超级计算基础设施、通过有人类反馈的加强学习方法训练而成,即“人工标注数据+强化学习”模式。
2023年1月,Buzzfeed( “美版今日头条”)宣布将用OpenAI提供的人工智能API——甚至不是被一些媒体误传的ChatGPT本身——来协助创作。
2023年2月,Chat-GPT的全球月活突破了1亿。OpenAI发布了ChatGPT的付费版「ChatGPT Pro」,每月42美元(约285人民币)。微软计划在 Word、PowerPoint、Outlook 等软件中,悉数加入 ChatGPT 等 AI,或将ChatGPT应用于Bing,带来搜索引擎革新。
微软希望向OpenAI追加投资100亿美元,如谈判达成,微软将持有OpenAI 49%的股权,OpenAI的非营利性母公司持有2%,其余投资者持有剩余49%。
ChatGPT因用户量激增而频繁宕机,更加体现了ChatGPT对算力层的高度依赖。英伟达CEO黄仁勋称ChatGPT的出现堪称AI领域的“iPhone时刻”
ChatGPT内核:
Chat-GPT本质是以GPT-3模型为框架,通过“对话”这一场景,搭建了一个普通用户也能使用的AI应用,两者之间的技术进步并不算大,没有革命性。爆发是由于C端的强烈关注。
"智能”在哲学上是“记忆”,机器智能的应用对人而言,本质上是让渡了自己的记忆权”,历史上有类似的让渡,如廉价印刷术的发展。记忆栈不能产生意识,更适合用“给出正确答案的能力”来定位它。
ChatGPT的训练:
训练步骤:1. 选择大规模语料库,构建训练集。2. 定义模型架构,通常使用Transformer模型。3. 选择优化算法并设置超参数。4. 训练模型,根据训练损失下降情况和验证集结果决定是否需要调整超参数。5. 使用测试集评估模型性能。6. 如果需要,对模型进行微调,以提高性能。
ChatGPT的基础是Transformer模型,它是一种采用自注意力机制的深度学习模型,自注意力的意思即可以按照输入数据各部分重要性的不同而分配不同的权重。它通过计算词与词之间的相对位置关系来确定注意力的权值,最终生成语句的语义表示。其优势在于其可以并行计算,速度快,精度高,是目前自然语言处理中最常使用的模型之一。
ChatGPT在GPT3的基础上,添加了海量的代码语料库,其可能具有详细的注释,用于帮助AI理解代码功能。
算法:Transformer、GPT-3均为开源,国内企业在大模型上的技术差距仅在半年到两年之间。比如GPT-3发布之后,百度、腾讯、阿里等企业诸如一言、M6、混元等十万亿参数级别的大模型也很快跟进。
算力:AI计算通常采用CPU+加速芯片的形式。通常搭载GPU、FPGA、ASIC等加速芯片,利用CPU与加速芯片的组合可以满足高吞吐量互联的需求。ChatGPT是在GPU上训练的,训练高度依赖英伟达A100、H100等AI专用显卡。常见的消费级显卡通常会将部分算力让渡于光追等功能,相比之下,A100的特点则是从硬件设计到软件配套 all in AI。英伟达A100在BERT等先进对话式AI模型上可将推理吞吐量提升到高达CPU的249倍。从2022年开始,美国已经限制英伟达向中国大陆销售A100/H100显卡,但英伟达推出了A800,成为中国特供版A100平替。
数据:一款通用AI算法所使用的预训练语料库大小为1-10GB之间,而用于训练ChatGPT的前身——GPT-3的语料库达到了45TB。
ChatGPT未来展望
1.具身智能(有物理装置的智能,如人形机器人) 与ChatGPT的结合会非常有想象力。目前特斯拉的人形机器人还是有漏洞: 1)需要想明白具身与环境到底在交互什么? 唯识学认为交互的是”身体的记忆”(可以简单理解为习性);2)神经网络的工作不是简单的“小脑”的工作方式、动力学(自动驾驶) 也不是简单的(像现右这么) 流程化的。
2.GPT-4或不再以“大”取胜,数据在精不在多,依靠提高模型效率和数据质量达成改进。GPT-4的推出对商业应用的潜在影响:1)模型能够生成更有“温度”的文字,对应AI客服、AI心理咨询、营销文本等场景;2)模型能够生成更加“专业”的文字,对应金融、医学、新闻、工业等垂直行业应用。
3.未来算力升级主要路径为CHIPLET、存算一体。短期使用CHIPLET异构技术加速各类应用算法落地,长期来看打造存算一体芯片(减少芯片内外的数据搬运),或将成为未来算力升级的潜在方式。Chiplet异构技术不仅可以突破先进制程的封锁,并且可以大幅提升大型芯片的良率、降低设计的复杂程度和设计成本、降低芯片制造成本,但需要牺牲一定的体积和功耗,因此将率先在基站、服务器、智能电车等领域广泛使用。存算一体就是存储器中叠加计算能力,以新的高效运算架构进行二维和三维矩阵计算。存算一体的优势包括:(1)具有更大算力(1000TOPS以上)(2)具有更高能效(超过10-100TOPS/W),超越传统ASIC算力芯片(3)降本增效(GPU通常为万量级,存算一体一般百万量级等效计算核心)
4.产业数字化方面,TO B和传统行业融合更具优势,汽车、工业、能源等行业是较好的应用场景。我国提出的新型工业化的背后,工业数字化就是很大一块,在投资上的确定性很高。以前投数字化或者投科技就是投TMT行业本身,买做IT、做CT、做芯片的公司。但未来买数字化,很多时候可能也要买传统行业的公司,其与人工智能是一种双向奔赴。
受益标的
1.推出类ChatGPT产品的公司:
谷歌:Bard机器人
百度:宣布推出智能机器人“文心一言”ERNIE
京东:京东云旗下言犀人工智能平台宣布将推出产业版ChatGPT「ChatJD」
阿里巴巴:达摩院正在研发类ChatGPT的对话机器人,进入内测阶段
字节跳动:字节AI实验室正开展类似ChatGPT和AIGC相关研发,未来或为PICO提供支持
网易有道:近期将推出教育场景下的ChatGPT模型
科大讯飞:类ChatGPT技术将于5月落地,率先用于AI学习机。2023年将正式发布软硬一体机器人。NLP能力公司。
2.接入AI系统的公司:
微软:推出整合OpenAI技术的新版必应(Bing)搜索引擎和Edge浏览器
汤姆猫:目前公司团队已尝试应用ChatGPT模型进行AI交互产品开发的初步测试
捷成股份、天地在线:参股子公司世优科技数字人“阿央”已经接入世优科技目前正在开发的ChatGPT小程序
昆仑万维:旗下Opera浏览器计划接入ChatGPT功能
天娱数科:下属子公司元境科技虚拟数字人已经接入ChatGPT等模型,并已在Tik Tok跨境电商直播、虚拟主播直播互动等场景实现应用,并形成产品化解决方案。
初灵信息:以Chatbot方式面向用户提供多媒体智能应答服务,但营收贡献不大
风语筑:接入百度文心一言,布局虚拟人
博彦科技:微软小冰AI助理相关软件外包
慧博云通:对话机器人
3.算力优势公司:
英伟达:ChatGPT的GPU供应商
胜宏股份:国内英伟达的供应商
鸿博股份:与英伟达合资成立北京AI创新赋能中心,有ChatGPT相关产品在研发测试阶段中。
汉王科技:在NLP技术领域的全面性以及长期在行业端的深耕,已经形成自身独有的算法模型
浪潮信息:在人工智能服务器领域的市占率位居全球AI服务器市场第一,在中国市场份额已连续五年保持50%以上。
拓尔思:NLP能力及语义处理
神思电子:NLP能力公司
汉邦高科:数字水印
海光信息:国产CPU+GPGPU
天孚通信:CPO技术提升光模块性能
宇通通讯:CPO明年量产
寒武纪:国产GPU
景嘉微:国产GPU
龙芯中科:国产CPU
格灵深瞳:现有业务的技术和算法模型训练与ChatGPT的理念一脉相承,大型沉浸式交互体验产品灵境将利用ChatGPT相关技术
首都在线:首个国际数据服务和算力服务中心,提供100p算力
兴森科技:chiplet技术
4.数据优势公司:
知乎:问答型互动平台,具有数据优势。
三六零:搜索引擎具有良好的数据基础。此外计划推出基于类ChatGPT技术的demo版产品。
海天瑞声:专注为AI产业链提供算法模型开发训练所需的专业数据集,NLP类项目占总业务10%。
视觉中国:与百度旗下AI作画平台“文心一格”合作,AICG数据源供应商。
沪电股份:国内PCB龙头,提供路由器、数据存储、AI加速计算服务器产品等数据中心基础设施
中文在线、中信出版、果麦文化、科华数据、润泽股份、奥飞数据:提供训练数据
5.算法优势公司:
昆仑万维:9日下午在宣布,昆仑万维与奇点智源合作,将在今年内发布中国版类ChatGPT代码开源,防止大公司技术垄断。
云从科技:在视觉、语音、NLP等多个领域开展预训练大模型的实践,提升了核心算法性能效果和算法生产效率,以实现各领域全面打通整合。来自网络分享,仅供参考。