当前位置:首页|资讯|苹果|OpenAI|腾讯

苹果复活Siri不能只靠OpenAI

作者:腾讯新闻深网发布时间:2024-06-12

苹果复活Siri不能只靠OpenAI

当地时间2024年6月10日,美国加州,2024苹果全球开发大会举办。图片来自视觉中国
作者丨安然 
编辑丨虞尘
出品丨深网·腾讯新闻小满工作室
在苹果封闭且垂直整合的生态系统中,只有自研大模型才可以根据用户需求做任何产品的优化和修改,把AI能力架构在OpenAI底层技术之上或许不是长久之计。
在刚刚落幕的苹果2024年全球开发者大会(WWDC24)上,苹果官宣了iPhone通话录音功能、iOS 18、macOS 15 Sequoia、Vision Pro在中国等市场发售时间等一波亮点,但重头戏还是落在苹果的AI能力上。
苹果此次推出的AI“大礼包”主要包括两个,一是与OpenAI达成合作,苹果整合GPT-4o能力,用户无需关联账户即可免费调用ChatGPT;二是推出一套基于个人情境的AI能力——Apple Intelligence。
有媒体将Apple Intelligence解读为苹果推出的首个生成式AI大模型,而《AI光年》更倾向将其看成一个集成的智能增强功能套件,基于GPT-4o的AI能力,让苹果设备能够更好地理解、解析并执行用户的指令,从而提升用户AI体验。
和OPPO、vivo、荣耀等国内头部手机厂商AI路径类似,苹果手机的AI进化之路也从语音助手Siri切入。比如,Siri可以直接调用ChatGPT,也可以通过语音提取上下文信息进行回复等。
按照苹果CEO库克的预期,未来苹果产品会升级为个人智能(personal intellegence),被GPT-4o赋能的Siri 会成为一个协助用户采取行动AI智能体。   
不过,目前苹果的AI能力主要靠和OpenAI绑定实现,而苹果生态系统又相对封闭,这意味着,苹果在维护iOS生态独特性的同时又要和其他平台的协作,以推出创新应用,这本身就是挑战。
回到Siri本身,全面接入GPT-4o的Siri其智能程度也受OpenAI底层技术开放程度的掣肘。Siri前CEO 戴格·吉特劳斯(Dag Kittlaus)日前也曾预测,苹果和 OpenAI 合作或是权宜之计,为自研大模型争取时间。
01 Siri“智障”背后是数据博弈
Dag Kittlaus是 Siri 公司的创始人之一,有“Siri 之父” 之称。
2007年,Dag Kittlaus与斯坦福研究院CALO项目首席架构师 Adam Cheyer等共同创办 Siri 公司。3年后,Siri首次作为iPhone的第三方应用出现在苹果的App Store里。
Siri上线三周后,Dag Kittlaus收到史蒂夫.乔布斯希望“聊一聊”的电话。苹果收购Siri后,Dag Kittlaus加入苹果,从事语音应用研究。
2011年10月,Siri首次出现在苹果推出iPhone 4S手机上。但用户真正使用Siri后,对它的评价却褒贬不一。
苹果的联合创始人史蒂夫·沃兹尼亚克曾公开批评苹果版Siri:Siri最初得到他的青睐,是因为它能准确地理解诸如“加利福尼亚的五大湖泊是什么”和“大于87的下一个素数是什么”这类问题,但在苹果推出的版本里,它对湖泊的询问调用了湖滨物业的链接,而对素数问题的回答则是关于素食的内容。
而在苹果推出Siri不到一年的时间里,Dag Kittlaus就离开苹果,和朋友创办了一家名为Viv的人工智能公司,后者被三星以2.15亿美元的价格收购。   
很长一段时间内,不太灵光的Siri一度被调侃为“人工智障”。原因之一是,Siri要提供准确、个性化回复需要理解用户意图,而理解用户的意图依赖高质量的训练数据,比如用户交互数据、情境信息和个人偏好等。
这与苹果公司实施严格的用户隐私保护政策相悖。比如,苹果强调用户所有Siri数据、地图数据都不会发送到苹果服务器上,并且在处理用户请求时会采用随机标识符而非关联到个人账户。这个做法虽然保护了用户隐私,但也影响了Siri基于用户特定数据进行深度学习和个性化回复的能力。
现在,苹果整合GPT-4o可以直接提升Siri的智能水平。对于用户可在iOS系统中免费调用ChatGPT,有海外用户在X上表示,“如果你不用付费,那你不是用户,你是产品本身。”
“对于已经拥有ChatGPT付费账户的海外用户而言,Siri集成ChatGPT为他们提供了一个额外的、更为便捷的交互途径。用户可以通过语音指令直接与ChatGPT互动,而不需要手动打开应用程序,这简化了使用流程,提高了效率。”IDC中国高级分析师杨雯对《AI光年》表示。
02 复活Siri不能只靠OpenAI
将GPT技术整合进Siri在提升其智能水平同时,也面临如何在保护用户隐私的前提下使用个人数据的难题。
为此,苹果提供了两种解决方案。一是基于M系列芯片及A17 Pro芯片强大的NPU算力,让多数AI功能通过端侧AI运行,以保护用户隐私;二是如果用户需要调用云端大模型能力,这些模型会在Apple Silicon专门创建的服务器上运行。   
在苹果看来,以端云协同方式调用大模型,既可以保护用户隐私,也可以让苹果产品的AI能力发挥到极致。
苹果这种看似两全的方式引起了特斯拉创始人马斯克的不满。其在X上旗帜鲜明的表态,“如果苹果在操作系统层面整合 OpenAI,那么苹果设备将被我的公司禁止使用。这是不可接受的安全违规行为。”
在马斯克看来,“苹果不够聪明,无法开发自己的AI,但却有能力确保OpenAI将保护你的安全和隐私,这显然是荒谬的。一旦将你的数据交给 OpenAI,苹果就不知道到底发生了什么。他们正在出卖你。”
马斯克只说对了一半。
自研大模型才可以根据用户需求做任何产品的优化和修改,把AI能力架构在OpenAI底层技术之上或许不是长久之计,但苹果并非没有自己开发AI的能力。
去年7月,就有消息传出,苹果正在推进“Apple GPT”项目,基于谷歌的Jax 机器学习框架,自研了大模型“Ajax”;今年3月,苹果发布论文公布自研的MM1多态大语言模型,提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。
况且,ChatGPT不是唯一一个和苹果合作的大模型公司。苹果表示,它准备整合多个AI外部模型,避免用户需要在不同App间切来切去。
需要指出的是,虽然目前iOS版ChatGPT应用更新已经支持了iPhone 15 Pro以上版本Siri和快捷指令,但ChatGPT服务在国内受到限制,国内用户无法直接享受到完整的服务。   
“按照历来情况,国内用户可能需要通过特定的访问方式(如使用代理服务器)来正常使用ChatGPT的受限功能。但目前并未有真实的体验数据所以更多的是猜测。”IDC中国高级分析师杨雯对《AI光年》表示。
个人观点,仅供参考

Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1