苹果公司正准备加入硅谷的人工智能竞赛,其倚重的核心优势在于:拥有3400万名应用程序开发者。
预计在本月稍后时间,iPhone用户将首次体验该公司的人工智能系统——Apple Intelligence。苹果正寄望于Apple Intelligence能成为其最新旗舰产品iPhone 16的一大卖点。
值得注意的是,苹果的人工智能技术尚未达到OpenAI的ChatGPT、谷歌的Gemini或Meta的Llama等顶尖实验室的先进水平。苹果并未采用最大的模型,也无法实现某些更为引人注目的尖端模型所具备的功能,例如OpenAI最新推出的能唱歌的语音模型。
苹果期望其人工智能的独特之处在于,Siri或许能真正在用户的手机上执行一系列实用操作,比如发送电子邮件、解读日历信息、拍摄并编辑照片等,这些是目前其他公司的人工智能聊天机器人尚不能实现的。为了达成这一目标,苹果正积极调动其庞大的第三方开发人员队伍,对各自的应用程序进行微调,以与Apple Intelligence实现协同工作。苹果公司在6月透露,其长远愿景是让Siri能够触发用户在任何应用程序中可能采取的行动。
苹果机器学习主管凯尔西·彼得森(Kelsey Peterson)在Apple Intelligence发布视频中强调:“Siri将具备在应用程序内部及跨应用程序执行数百项新任务的能力。”
虽然苹果为自己的应用程序实现这一功能相对容易,但要让Apple Intelligence与数百万非苹果应用程序实现互动,则需要开发者采用一种创新的编程方式,这要求开发者创建大量名为App intent的额外代码片段。
苹果在吸引开发者支持其新平台倡议方面有着丰富的历史经验,并且它总是运用一套行之有效的策略来吸引他们——提供开发者关系方面的个性化关注,营造公司年度开发者大会上的欢快氛围,以及最为关键的是,通过App Store的推广为加入该平台的开发者带来数以百万计的下载量。
如果第三方开发者积极响应并加入进来,使得Siri系统能够如宣传所述般高效运作,那么它极有可能会成为苹果在人工智能领域竞赛中的一大核心且持久的竞争优势。
“你应当能够将各种功能串联起来,在某种程度上实现我们一直憧憬的未来——通过Siri进行对话的同时,还能完成诸多任务,”iOS开发人员乔丹·摩根(Jordan Morgan)说道,他曾撰写过一本关于App intents的教程。
苹果能否成功说服数以百万计的开发者加入这一行列,成为了一个至关重要的问题,对于公司而言,其意义深远。
苹果正将Apple Intelligence视为推动升级热潮、提振iPhone销量的关键驱动力。值得注意的是,Apple Intelligence目前仅支持去年推出的iPhone 15 Pro系列以及今年新发布的iPhone 16系列。若苹果改良后的Siri未能获得开发者的广泛支持,或者未能给用户留下深刻印象,这或将对iPhone的销量产生不利影响,导致消费者转而通过应用程序使用竞争对手的语音助手,而非内置的Siri。
什么是App Intent?
举例来说,在音乐应用程序中,苹果已经设计了大约10个App Intent,涵盖了如“添加到播放列表”、“播放音乐”或“选择音乐”等具体操作。程序员指出,每个App Intent都应明确定义一个特定的动作。
摩根表示,如果你在使用一款咖啡因追踪应用,其中的一个Intent可能就是展示用户当天已摄入的咖啡因量。
一旦App Intent设置完成,苹果的各种“系统体验”功能,诸如小部件、实时活动、控制中心和快捷方式等,就能够迅速展示当前运行的追踪器,并直观显示已记录的咖啡因量,而用户无需再单独打开追踪应用程序。
对于部分开发者而言,系统搜索功能构成了另一大吸引力。App Intent将使得应用程序能够在苹果的Spotlight系统搜索中展示特定的电子邮件或其他更为精细的数据。
开发者们表示,编写App Intent所需的时间并不长,通常仅涉及几行代码的编写。
生产力应用Focused Work的开发者迈克尔·提加斯(Michael Tigas)透露,在早些年,苹果曾建议开发者针对其应用中的核心功能开发App Intent。
提加斯表示:“如今,如果能够通过调整你的应用来执行任何常规操作,那么你就应该为这一操作创建一个App Intent。”
值得庆幸的是,对于开发者而言,他们仍有充裕的时间来编写App Intent所需的所有代码。尽管Apple Intelligence将于下个月面世,但Siri的重大改进计划要等到明年才会正式发布。
苹果必须激励开发者
苹果新推出的Siri系统显著提升了对用户问题的理解能力,即便用户表达时出现错误,这得益于苹果在语言模型领域的深度合作。与OpenAI的ChatGPT等采用的大语言模型相比,Siri展现出了独特的优势。
如今,Siri能够更灵活地捕捉用户表达的多样性,例如,“请给我昨天拍的照片加个滤镜”。
为了确保Siri的精准响应,苹果对其模型进行了严格的训练和测试,使其能够深入理解各类应用程序中常见的命令和问题。
不过,需要注意的是,新Siri的初期支持范围较为有限,主要集中在照片和电子邮件应用上。但苹果透露,Siri的未来版本将扩展到支持书籍、日志、白板、文件管理、文字处理、浏览器、相机以及照片等多类应用程序。
与此同时,开发者们也在积极构想,如何利用声音交互,使他们的应用更加贴近用户需求。
高级电子邮件应用Superhuman的代表透露,该公司计划利用苹果的人工智能系统来查询电子邮件内容,例如询问“嘿,Siri,我的航班何时起飞?”或“嘿,Siri,我与James何时见面以审核他的提案?”。
然而,部分开发者对苹果的计划持保留意见。他们担忧用户可能会减少在自家应用上的停留时间,或者将Apple Intelligence与开发者自己开发的人工智能功能相混淆。
电子邮件应用Spark的开发商Readdle的首席执行官伊戈尔·扎达诺夫(Igor Zhadanov)在电子邮件中表达了他的担忧:“如果仅围绕App Intent展开,开发者可能会顾虑自己的产品沦为Siri的传输管道,从而难以围绕Siri构建可持续的业务模式。”
此外,Apple Intelligence功能的另一个局限在于,它目前仅支持最新款iPhone,而这部分用户仅占iPhone用户总数的少数。有限的iPhone用户市场可能会成为开发者在短期内投入资源和精力支持该技术的障碍。
提加斯指出:“苹果将Apple Intelligence功能限定在2024年新款iPhone及去年推出的高端机型上,因此你很难为大众市场打造产品。”(腾讯科技特约编译金鹿)