当用户可以打开摄像头,通过视频通话窗口与AI“清言”交流,清言不仅能“看”到用户画面,还能听懂指令并准确执行。即使用户频繁打断,清言也能迅速反应,带来如同真人视频通话的流畅体验。这是清言App近期重磅推出的“视频通话”功能。9月12日,在2024年中国国际服务贸易交易会上,智谱诸多AI黑科技亮相引发广泛关注。
清言作为首批上线的C端大模型产品,过去一年中以文字和语音形式与用户互动。如今,清言迎来重大升级,解锁了“眼睛”, 这是全球首个面向大众用户开放的视频通话功能,让用户体验到目前最前沿的AI/大模型技术,正式进入视频通话时代。
清言视频通话功能跨越文本、音频和视频三大模态,具备实时推理能力。用户可以打开摄像头,通过视频通话窗口与清言交流,清言不仅能“看”到用户画面,还能听懂指令并准确执行。即使用户频繁打断,清言也能迅速反应,带来如同真人视频通话的流畅体验。另外可以用右下角小画笔在画面上划重点,清言可以知道你着重让它看的地方是哪。
清言视频通话功能可以成为你生活、学习和工作中的得力助手。在生活方面,小智可以提供穿搭技巧、机器的使用方法、识别场景讲述背景故事。
当大语言模型解锁了“看见”和“说话”的能力,AI在学习和生活中的应用更广泛了。
比如,孩子们可以用视频拍摄环境,并且让清言解释环境中陌生的物体叫什么、能做什么、英语怎么说等等。此外,清言还可以为孩子们阅读绘本故事、玩你画我猜等游戏,成为孩子们益智启蒙的最佳玩伴。
当然,有了视频通话功能后,清言还可以成为旅游时随时讲解景点故事的导游,也能为视障人士提供识别环境的帮助等。
此外,智谱近期推出的视频生成模型CogVideoX以及在智谱清言App上线的“清影”功能也吸引了不少观众驻足打卡。据了解,清影面向所有用户开放,只需输入文本或上传图片,30秒内即可生成6秒视频。今年7月,清影上线清言App,六天时间用户生成超过100万支视频。
文/北京青年报记者 温婧
编辑/樊宏伟