在切入正题之前,有少数人应该不知道什么是大模型,在这里我要简单科普一下:如果你想要让一个机器学习模型识别一头猫,你可以向这个模型提供一堆猫的图片进行训练,让模型学习什么样的图片是猫。在深度学习中,往往是通过神经网络来完成这种训练的过程。如果我们使用一个较小的模型,它能够学习到一些猫的特征,比如猫嘴巴、耳朵等,但是有时候这些特征可能不太够,模型可能无法识别出更复杂的形态,比如一只猫的脸或者瞳孔。如果我们使用一个大模型,它的参数量就更大了,这意味着该模型可以学习到更复杂、更抽象的特征,能够更好地识别出一只真正的猫。另外举个例子,在语言模型领域,大模型能够更好地理解和处理自然语言,这使得它们在自然语言生成、对话问答等领域中表现出了更加出色的性能
好了这就大模型的简单科普啦!
雷军于4月14日晚间在微博发文,首度谈及小米对大模型和AIGC(利用人工智能来生成你所需要的内容)的看法。雷军还透露,对于大模型,小米“正在研发一些有趣的技术和产品,等我们打磨好了,再给大家展示。”
4月14日,据澎湃新闻报道,小米集团发布内部邮件,任命栾剑担任技术委员会AI实验室大模型团队负责人,向技术委员会副主席、AI实验室主任王斌汇报。
公开资料显示,栾剑现任小米技术委员会AI实验室语音生成团队负责人,曾任东芝研究院研究员、微软工程院高级语音科学家、微软小冰首席语音科学家及语音团队负责人等职位。
作为一名从事AI领域近20年的从业者,栾剑在4月5日发表的文章中提出了关于ChatGPT能力涌现成因的猜想。他认为,产生“涌现”能力的三个重要要素包括:
大数据:如果数据不足,就可能无法挖掘出“概念”与“常识”;
大模型:如果模型参数量不够充分,模型便没有足够的空间去完成“层级结构”;
多任务:如果任务过于单一,模型没有动力去做结构调整,因而“平行结构”会成为模型的“偷懒”选择。
随后,他在4月8日又发表了一篇题为《ChatGPT的训练过程对“鸡娃”的启示》的文章,通过类比尝试定性地探讨儿童教育可以从ChatGPT的训练过程中得到哪些启示。栾剑出身于微软,拥有丰富的AI语音技术储备和工作经历,目前任职于小米大模型团队负责人一职。他如何发挥自身的优势,并在与小爱同学的碰撞中探索出怎样的火花,让人期待不已。
事实上,小米入局大模型领域可谓“水到渠成”。
从内部人才储备来看,小米目前已拥有超过1200人的AI团队。如今,雷军也终于为大模型团队选定了栾剑为“舵手”。
而且还有金山云这个王牌
小米还拥有金山云这个云计算服务平台,能够为小米的大模型提供更强大的计算和存储能力,使小米在人工智能领域的发展能够更快、更稳健。金山云作为一个可靠、高效、安全的云计算服务平台,为小米提供了全面的云计算解决方案,从虚拟化、存储、网络、安全和大数据分析等多个维度优化了小米的人工智能应用体验,并提升了小米在业内的竞争力和声誉度。可以说,小米与金山云的结合,使其在人工智能领域更具备竞争优势,对整个行业的发展具有积极影响。
然而大家不用想就知道,目前国内大模型和GPT相比还是比较鸡肋的,网友们经常调侃“人工智障”。
小爱同学的产品能力,与基于GPT-3.5训练而来的ChatGPT仍有不小差距。何况,OpenAI也已发布了更为先进的GPT-4大模型。其实小爱同学从呱呱落地到现在已经六年多了呢,在没有chatGPT这个概念以前,其实像小度和小爱这种“人工智障”其实已经很了不起了,起码在我们普通老百姓眼里让他放哪首歌,问它几个科普类的问题,只要我们发音不是很方言它们都能给我提供比较正确的答案。但是没有对比就没有伤害啊。
此前,微软CEO萨蒂亚·纳德拉最近在接受英国《金融时报》采访时表示,苹果的Siri、亚马逊的Alexa,微软自家的Cortana(中文名:小娜)以及公认拔尖的Google Assistant,这些语音助手有一个算一个:都笨得跟石头一样。
随后,微软在2021年就正式宣布停止支持iOS和Android上的Cortana应用,仅保留对Windows平台的支持。
直到OpenAI带来了ChatGPT,微软直接“满血复活”,战斗力爆表。(钢铁侠的贾维斯都出来了,钢铁侠还会遥远吗?)
Siri联合创始人Adam Cheyer也在近期表示,ChatGPT理解复杂信息的能力让现有的语音助手看起来很蠢。
作为小米的“前辈”,早在今年2月,百度旗下人工智能助手“小度”就宣布,小度将融合“文心一言”的全面能力,打造针对智能设备场景的人工智能模型“小度灵机”,并应用到小度全系产品。
可以看得出来小米今后也会走上这条路
随着大数据和人工智能的快速发展,大模型成为了新时代的热门话题。在这个趋势下,百度、腾讯和阿里等科技巨头已经在大模型领域拥有了不俗的表现,而如今,小米公司创始人雷军也加入了这一行列。雷军强调,大模型不仅要具备超凡的计算能力和大规模数据处理能力,还需要具备跨领域的知识结构和经验积累能力。小米将通过这种跨领域的创新方式来打造更加智能和高效的产品,推动人工智能技术的发展并为消费者提供更好的服务。雷军的加入进一步证明了大模型已经成为了科技行业的主流趋势,未来必将在各个领域形成新的商业模式和竞争格局。