在酒店遇到不知道如何使用的咖啡机、给孩子辅导作业碰到不会讲的数学题、面对屏幕前看不懂的数据文件时心情烦躁……当人们遇到这样的难题,给大模型助理“小智”打一通视频电话,都能马上得到解答。8月29日晚,智谱AI发布基座大模型 GLM-4-Plus,清言APP升级视频通话功能,这也是国内大模型行业首个面向个人用户开放的视频通话功能。
进入清言APP,点击页面右下角的电话图标后,记者以内测使用者身份进入了与智能助理的视频通话。这个名叫“小智”的助理,能够通过手机镜头中的画面认出阳台上的绿植是发财树,并在记者询问发财树为何叶子发黄时给出养护建议。
在过去,人们与大模型AI助理沟通时,通常依次需要输入文字、语音来进行一问一答式的交流。而记者体验发现,和“小智”通话的过程就如同与一名真人朋友视频通话一样,即便频繁打断“小智”的话,它也能迅速反应。
AI助理甚至像人类助理一样开始具备记忆能力,在前一天与“小智”交流过多次绿植养护的话题后,当记者第二天再次与“小智”通话时,它先是向记者打了个招呼,随后还主动提起了话题——“我记得你对园艺养护很有兴趣,有什么新的心得吗?”
智谱相关负责人介绍,清言的视频通话功能能够识别文本、音频和视频等多种模态的交流,并具备实时推理的能力。基于此,AI助理在提供足够实用性的帮助方面也变得越来越智能。
例如,在与“小智”通话时,当手机镜头对准一款咖啡机,工作人员提问“这个机器怎么用”后,它立刻识别出了咖啡机的品牌与型号,并说出了详细的使用步骤。当镜头中出现了一只猫,“小智”立刻识别出这是一只美国短毛猫并熟知它的习性,并看出猫正在打量周围的环境。当工作人员问道“它最近不爱喝水怎么办”,小智给出了专业的建议,例如可以利用自动饮水机吸引猫的注意,也可以通过调整饮食结构来帮助猫补充水分,比如选择高湿度的罐头食品等。当工作人员将镜头对准一台电脑屏幕上的英文文献,并询问“这篇论文里的两条曲线是什么意思”时,小智很快就讲解起文献中曲线图的含义。
据悉,清言APP视频通话功能将于8月30日上线,首批面向清言部分用户开放,并同时开放外部申请。
来源:北京日报客户端
记者:孙奇茹