当前位置：首页|资讯|斯坦福|大语言模型|GPT-4

可在手机上运行的2B LLMs ,看看斯坦福大学的这个项目

作者：AI研习所发布时间：2024-04-10

斯坦福大语言模型 GPT-4

项目简介

Octopus-V2-2B是由斯坦福大学Nexa AI开发的一种先进的开源大型语言模型，具有20亿参数，专为Android API的功能调用定制。

与需要详细描述潜在函数参数的检索增强生成(RAG)方法不同Octopus-V2-2B采用了一种独特的功能性标记(functionaltokens)策略，用于其训练和推理阶段。

这种方法不仅使其达到了与GPT-4相当的性能水平，还大幅提高了推理速度，超越了基于RAG的方法，特别适用于边缘计算设备。

它能够在设备上直接运行，支持广泛的应用场景，从而推动Android系统管理和设备间协同工作的新方式。其快速和高效的推理能力，特别适合需要高性能和精确功能调用的场景，如智能家居控制移动应用开发等。

功能特点

1.高精度的功能调用:Octopus v2通过引入功能性标记(functionaltokens)，能够准确地选择和调用正确的函数，提高了功能调用的准确性。

2.优化的延迟:相比传统的基于RAG的功能调用方法，Octopus v2大幅减少了延迟，提高了推理速度，适合实时应用。

3.上下文长度减少:通过其独特的设计，Octopus v2在进行功能调用时所需的上下文长度减少了95%，这意味着它能够更快地处理请求，同时减轻了设备的负担。

4.设备上运行:Octopus v2专为边缘设备设计，能够直接在设备上运行，无需依赖云计算资源这样既保护了用户隐私，也减少了使用成本。

性能

1.延迟:在基准测试中，Octopus-V2-2B展示了显著的推理速度，其速度是单个A100 GPU上。“Llama7B+RAG解决方案”的35倍。与依赖A100/H100 GPU集群的GPT-4-turbo(gpt-4-0125-preview)相比，Octopus-V2-2B快了168%。

2.准确性:Octopus v2在功能调用的准确性上超过了包括GPT-4等现有的解决方案，准确率在各类基准测试中接近100%。其功能调用准确率比“Llama7B+RAG解决方案”高出31%。在基准数据集中，其功能调用准确率与GPT-4和RAG+GPT-3.5相当，分数在98%到100%之间。

3.效率:通过有效减少所需的上下文长度和优化推理速度，Octopus v2在不牺牲准确性的前提下提供了高效的性能，特别适合在资源受限的设备上运行。

模型架构及技术原理

Octopus v2使用了Google Gemma-2B模型作为其预训练模型的基础。在此基础上，通过引入特殊的功能性标记(functional tokens)和进行细致的微调，Octopus v2能够理解和执行软件应用中的函数调用，从而实现了在设备上运行时更高的准确性和更低的延迟。这种方法有效地将Google Gemma 2B模型转化为一个更适合在边缘设备上使用的高性能语言模型，同时节省了上下文长度并优化了性能。

1.预训练模型选择：Octopus v2选择了Google Gemma-2B模型作为预训练基础，这是因为Gemma-2B提供了强大的语言理解和生成能力，是构建高性能语言模型的理想起点。

2.功能性标记引入：为了提高模型在函数调用任务上的性能，Octopus v2引入了功能性标记(functional tokens)。这些标记代表了不同的软件操作或功能，使得模型能够通过识别这些标记来准确执行特定的函数调用。

3.模型微调：在预训练模型的基础上，通过对模型进行细致的微调来适应具体的函数调用任务这一步骤涉及将功能性标记及其对应的函数描述加入训练数据中，训练模型以理解和映射这些标记到相应的软件操作上。

4.减少上下文长度：通过优化模型的输入处理方式，Octopus v2能够在进行函数调用时显著减少所需的上下文长度。这是通过直接使用功能性标记来指代复杂的函数调用过程，从而减轻模型处理负担并加快响应速度。

5.提高执行效率：微调后的Octopus v2模型能够快速准确地识别功能性标记，并映射到正确的函数执行过程，无需处理兄长的自然语言指令。这不仅提高了函数调用的准确性，也大大缩短了执行时间，降低了设备上的运算需求。

6.边缘设备部署：优化后的模型特别适合在边缘设备上部署，如智能手机、汽车、智能家居设备等。这些设备通常资源有限，但通过Octopus v2，它们能够本地执行复杂的语言处理任务，实现快速响应和高度隐私保护。

7.实现多样化应用：凭借其在设备上执行的能力，Octopusv2可以支持多种应用场景，包括但不限于智能家居控制、车载系统交互、离线语音助手等。

推荐体验

相关资讯

斯坦福大学对人工智能状况的看法

?谷歌承诺巴德升级：巴德要反击了 ?斯坦福大学对人工智能状况的看法：2023年人工智能指数报告 ?超现实的视频游戏：LumaLabs 发布虛幻引擎阅读时间：四分钟 ?谷歌承诺对巴德进行升级谷歌于 3月21日推出Bard，旨在ChatGPT和Bing Chat 相抗衡。然而，Bard没有达到预期，许多人工智能爱好者给它贴上了 “失败 "的标签。在最近接受《纽约时报》Hard Fork播客的采访时，谷歌首席执行官 Sundar Pichai承认了这种批评，并分享了未来的增强计划：更先进的PaLM模型

斯坦福人工智能谷歌 ChatGPT Bard

i无亦忧 2023-04-05

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上运行的版本

一边是OpenAI的高层又又又动荡了，另一边被誉为「真・OpenAI」的Meta对Llama模型来了一波大更新：不仅推出了支持图像推理任务的新一代Llama11B和90B模型，还发布了可在边缘和移动设备上的运…

机器之心Pro 2024-10-09

对标GPT-4！谷歌发布大语言模型PaLM 2，可在手机上运行！

5月11日凌晨，谷歌召开 “2023 Google I/O”技术大会，生成式AI成为本次大会的重要主题。会上，谷歌首席执行官Sundar Pichai介绍了最新发布的大语言模型PaLM 2，主要功能

GPT-4 谷歌大语言模型生成式AI

AIGC开放社区 2023-05-11

应对学生通过ChatGPT生成论文，斯坦福大学推出DetectGPT

IT之家 1 月 29 日消息，大型语言模型（LLM）的使用正在激增，尤其是 ChatGPT 最近非常火爆，然而由于其太过强大，甚至可以为学生生成论文。正因为如此，现在需要有检测机器生成的文本的系统。

ChatGPT 斯坦福

IT之家 2023-01-29

防止学生用ChatGPT写论文斯坦福大学推出DetectGPT

【CNMO新闻】前段时间，由人工智能研究实验室OpenAI所发布的全新聊天机器人模型ChatGPT在全球范围内引起了一股热潮，不少人被这款新的人工智能软件强大的功能所折服，它不仅能够跟人顺畅的聊天，甚

ChatGPT 斯坦福人工智能 OpenAI

手机中国 2023-01-29

近期资讯

我国新规：司机驾年龄延长至63岁摩托车放宽至70岁！

快科技12月31日消息，据国内媒体报道称，新修订的《机动车驾驶证申领和使用规定》明天开始（2025年1月1日）实施。新规中显示，大中型客货车驾驶证的申请年龄上限由60周岁延长至63周岁，大中型

雪花 2024-12-31

马斯克评论文章激怒德国：炮轰世界首富干预大选

财联社12月31日讯（编辑史正丞）就在距离德国大选还剩8周之际，世界首富、美国当选总统特朗普的亲密顾问、特斯拉CEO马斯克又成了德国政府的炮轰对象。当地时间周一，德国政府的副新闻发言人C

2024-12-31

Windows本地AI开发神器！微软推出并开源AI Dev Gallery

快科技12月31日消息，微软针对Windows 11 AI+ PC设备推出了一项名为AI Dev Gallery的新功能，旨在帮助开发者在其应用中融入端侧AI功能。该功能已在GitHub上开源，为开发者提供了一个强大的本地

黑白 2024-12-31

创维新款23.8寸显示器上市：2K 180Hz屏仅899元

快科技12月31日消息，创维推出了23.8寸显示器——F24G52Q Pro，首发899元。新款显示器采用23.8寸的Fat IPS面板，2560x1440分辨率、180Hz刷新率、400nits峰值亮度。同时，该显示

鹿角 2024-12-31

1000nits亮度显示器标准来了！专门针对OLED HDR

快科技12月31日消息，VESA标准组织宣布，针对HDR、Clear Motion规范增加两项新的认证标准，相关显示器产品也会在CES 2025期间亮相。一个是DisplayHDR True Black 1000，专门针对OLED显示器，H

上方文Q 2024-12-31

爱奇艺副总裁陈伟再被曝离职：曾成功打造《中国有嘻哈》

快科技12月31日，据媒体报道，今日，传爱奇艺高级副总裁陈伟已经离职。对此，爱奇艺方面暂无回应。据以往报道，这并非陈伟首次被曝出离职的消息。早在2022年3月，当时外界就有传言称爱奇艺要削

秋白 2024-12-31

我国开建全球最大万吨级纯电动运输船：续航可达500公里

快科技12月31日消息，据央视新闻报道，日前，全球最大的万吨级纯电动运输船在湖北宜昌开工建设。该船是三峡集团所属长江电力三峡电能牵头、国内多家科研单位参与的重点项目，是我国万吨级

若风 2024-12-31

免费喝1两：江西老字号春蕾茉莉超特茶5两29元半价大促

江西老字号春蕾茶叶旗舰店，南昌春蕾茉莉超特花茶5两日常售价59元，今日下单可领20元限时券，送茉莉花茶包*2袋。官方立减10元，到手价29元包邮。结算时可见赠品，没有不赠。传统制，免费喝

小晖 2024-12-31

《GTA6》B站预告对比油管女人汗毛妊娠纹细节清晰

近日，国内视频平台哔哩哔哩突然引发了大量海外玩家的关注，其背后的原因是由于一位海外推主发现《GTA6》首支预告在B站的版本要比外国人常用的YouTube版本清晰不少，其中展现的细节也更加丰富。

2024-12-31

泪奔！韩国客机失事最惨一幕：1家9口空难离世家仅剩狗

12月31日消息，当地时间12月29日，一架韩国济州航空7C2216航班的客机在位于韩国全罗南道的务安机场着陆时，偏离跑道后撞上机场围墙。除2人获救外，机上其余179人全部遇难，这是在韩国国内发生

雪花 2024-12-31

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1