当前位置:首页|资讯|ChatGPT|微软

AI掘金再扩散 ChatGPT如何赋能机器人行业?微软早已给出方向

作者:科创板日报发布时间:2023-03-27

《科创板日报》3月27日讯(编辑 邱思雨) 今日早盘,机器人板块震荡走高。截至发稿,远大智能、京山轻机涨停;华大智造、拓维信息、天智航涨超9%;绿的谐波、哈工智能、巨轮智能等纷纷走高。

消息面上,随着ChatGPT等大语言模型技术的成熟,AI在机器人领域的应用愈发受到关注。

早在2月底,微软官网消息显示,ChatGPT已能操控机器人。

通俗来说,在语言大模型ChatGPT的帮助下,工程师不需要手写代码,只需要用人类的语言描述想做的事情,ChatGPT可以将其转化为计算机代码。

而在语言大模型诞生之前,工程师调试机器人的方式是通过手写新代码。此外,不同的机器人可能需要不同的编程语言。因此,这不仅效率低下,且人力成本昂贵。

从微软给出示例来看,用户可以通过ChatGPT操控多个机器人。

例如,指挥机器臂拼出一个微软的Logo、让无人机检查货架、指派摄像头找出能加热午饭的电器等等:

从原理上来看,首先,微软开发了一系列API和高级函数库。这些函数库能够连接到机器人控制系统中管理底层硬件,以及执行基本运作的代码和功能模块。

设计好函数库和API后,微软给ChatGPT编写了提示词(Prompt),用于描述目标任务。

值得注意的是,当用户给出的提示、指令越明确,AI生成内容/代码的效果就越好。因此,微软开发了一个协作开源平台PromptCraft,任何人都能在此分享不同类型的机器人的Prompt策略。

最终,用户能够直接通过人类语言指挥ChatGPT输出计算机代码,从而操控机器人。

微软指出,基于人类语音操控机器人是一大技术进步。这能够让机器人技术走出实验室,并走进日常用户的生活场景中。“我们的工作只代表了机器人领域的语言大模型研究工作的一小部分,我们希望能够激发未来更多的应用。”

谷歌也对大模型抱有同样的期许。谷歌和柏林工业大学团队的视觉语言模型PaLM-E不仅可以理解图像,还能生成语言,能够执行各种复杂的机器人指令而无需重新训练。谷歌研究人员计划探索PaLM-E在现实世界场景中的更多应用,例如家庭、工业机器人等。

多家机构的分析师也对大语言模型在机器人领域的应用前景十分看好。国盛证券在近期的研报中指出,大模型在1-5年内,能够应用于智能家居、工业视觉、行业化机器人等领域。展望5-10年后的发展,随着复杂多模态方案的成熟,AI大模型或将能够应用于通用机器人。

浙商证券亦指出,ChatGPT作为AIGC领域顶尖的模型,有望对现有生产力工具进行变革,其商业化有望加速推动语言AI及AI领域整体的显著进步。人机交互系统作为人形机器人的“大脑”,语音语义分析作为人机交互核心途径,可帮助机器人具备听、说、理解和思考的能力。伴随人机交互技术逐渐成熟,人形机器人商业化未来可期。其中,核心零部件在机器人成本中占比约70%,人形机器人相较于传统工业机器人,自由度大幅提升,预计将使用比工业机器人更多的减速器与电机,核心零部件(减速器、伺服电机等)需求有望大幅提升。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1