从今年开始,大模型厂家纷纷转向智能体,作为大模型落地的新尝试。本文盘点了国内大模型厂家推出的各种类型的智能体,供大家参考。
在当今这个智能化风起云涌的时代,随着人工智能技术的飞速发展,大模型(Large Language Models)作为推动行业变革的关键力量,正逐步渗透到社会经济的各个角落。
从科技创新的最前沿到日常生活应用的细微之处,大模型以其强大的语言理解和生成能力,开启了人机交互的新篇章。在国内,这一领域同样呈现出百花齐放的盛况,众多科技巨头与新兴企业纷纷布局,致力于探索大模型的无限潜能。
本文将带您走进国内智能科技的最前沿阵地,对 16 家领先公司的创新实践进行一次深度盘点。在这场智慧的盛宴中,13 款各具特色的大模型、19 个基于大模型开发的智能体将逐一亮相,它们不仅是技术突破的象征,更是开启未来智能应用的钥匙。
从算法的精进到应用场景的拓展,从技术原理的深入剖析到市场潜力的全面展望,让我们一同揭开这些智能“大脑”的神秘面纱,探索它们如何在复杂多变的市场需求中找到精准定位,又如何携手人类共创更加智能、便捷的未来。
01 对话式服务丨智能体
Kimi
Kimi 作为月之暗面科技有限公司(Moonshot AI)推出的智能助手产品,凭借其在自然语言处理、长文本处理、多语言对话支持等方面的技术优势,为用户提供了高效、智能的交互体验。从初创阶段的基础自然语言理解,到引入先进的 Transformer 和 BERT 模型,再到功能拓展和用户体验优化,Kimi 的发展历程体现了公司对 AI 技术的不断探索和创新精神。
https://kimi.moonshot.cn/
Kimi 在日常工作与生活和学术研究领域中的应用表现突出。如文献管理,Kimi 能够帮助研究人员管理和整理大量的学术文献,通过其文本处理能力,快速提取关键信息和摘要;如论文撰写,Kimi 还能够辅助研究人员在撰写学术论文时提供语言上的帮助,包括语法检查、用词建议等,提高论文的质量;如办公自动化,在办公场景中,Kimi 能够帮助用户处理文档、表格和演示文稿,甚至能够根据用户的需求自动生成报告和总结。
讯飞友伴
科大讯飞推出的“讯飞友伴”是基于讯飞星火认知大模型 V3.0的一项创新应用,它将人类大脑的功能与生成式语言模型相结合,为虚拟人赋予了惊人的对话能力。这些能力包括长期稳定的记忆力、多样化的个性、丰富的情感以及逼真的语气。通过这项技术,用户可以轻松创建自定义的虚拟人,并与之进行深入的对话互动,享受完全沉浸式的体验。通过这项技术,用户可以轻松创建自定义的虚拟人,并与之进行深入的对话互动,享受完全沉浸式的体验。
https://xinghuo.xfyun.cn/
在“讯飞友伴”中,用户不仅可以与官方预设的多种人格进行对话,如与秦始皇聊家国大事,找华世兰聊感情等,还可以自主创建属于自己的人格化友伴,与不同人物性格的角色对话。此外,用户甚至可以通过调试人物性格,以及上传个人背景知识后,创建自己的人格,也就是复刻出自己的电子版本。
百小应
百小应是百川智能于 2024 年 5 月 22 日推出的首款 AI 助手,名称源自“一呼百应”。它基于百川智能最新发布的基座大模型 Baichuan 4,具备以下特点:多轮搜索与定向搜索、文件阅读与资料整理、智能交互、多模态能力、语音交互、Web 端和移动端应用、图标寓意,
https://ying.baichuan-ai.com/chat
百川智能开放了 Baichuan 4 等多款 API,供开发者和企业用户接入体验。百小应不仅仅是信息时代的又一工具,而是借助大模型技术,力求成为能够理解、学习并适应用户需求的新一代智能伴侣,尽管当前技术尚有限制,但持续的进步预示着未来 AI 将更接近人类的思考与情感交流。
02 工作流编排丨智能体
文心智能体
文心智能体平台是百度推出的基于文心大模型的智能体(Agent)平台。它支持广大开发者根据自身行业领域、应用场景,选取不同类型的开发方式,打造大模型时代的产品能力。开发者可以通过 prompt 编排的方式与调用海量工具,低成本开发智能体(Agent)。
https://agents.baidu.com
文心智能体平台是“开发+分发+运营+变现”一体化赋能平台,已打通百度搜索、小度、一言、地图、车机等多场景、多设备分发。平台支持问答对调优、智能体诊断,底座大模型则可通过分发数据反馈进行自主调优,让智能体学习升级、更加聪明。
天工SkyAgents
天工 SkyAgents 是昆仑万维推出的 AI Agents 开发平台,基于昆仑万维自研的”天工大模型”构建,具备自主学习和独立思考能力。用户可以通过自然语言交互,或通过简单的拖拽、配置,就能快速构建出满足需求的 AI Agents。
https://model-platform-skyagents.tiangong.cn/home/agent
天工 SkyAgents 支持模块化设计,用户可以按需拼装各种个性化应用。如企业 IT、智能客服、企业培训、HR、法律顾问等。还支持数据导入,用户可以导入自己的数据来增强模型的知识库,训练出更精准、个性化的AI Agents。并提供了丰富的 API 和 SDK,方便用户进行二次开发和集成,与自己的业务系统深度集成。
智谱清言
智谱清言是北京智谱华章科技有限公司推出的一款生成式 AI 助手,基于智谱 AI 自主研发的中英双语对话模型 ChatGLM2,经过万亿字符的文本与代码预训练,并采用有监督微调技术。2023年8月31日上线,已具备通用问答、多轮对话、创意写作、代码生成以及虚拟对话等丰富能力,未来还将开放多模态等生成能力。
https://chatglm.cn/main/alltoolsdetail
用户能够使用多种编程语言进行开发和调试,可以帮助解释代码、解答编程问题、或提供编程建议。智谱AI还推出了新一代基座大模型GLM-4,整体性能大幅提升,支持更长上下文、更强多模态、更快推理速度等。
03 自主智能体丨智能体
实在Agent
实在 Agent 是浙江实在智能科技有限公司基于 RPA(Robotic Process Automation,机器人流程自动化)和 ISSUT(智能屏幕语义理解技术),结合国产自研垂直大模型 TARS 打造的超自动化智能体产品。
实在Agent 包含了认知、记忆、思考、行动四大核心能力,每次迭代时都会生成自我导向的指令和操作,不依赖人类指导,具备高度可扩展性。现已在运营商、零售、金融等领域落地,钉钉 AI 市场也可以直接体验,是国内探索大语言模型应用落地和AI Agent 的先行者。
https://www.ai-indeed.com/products/agentRpa
实在 Agent拥有”大脑”、”感知”、”执行”三大核心:基于 TARS 大模型做“大脑”,用 ISSUT(智能屏幕语义理解技术)视觉能力做感知的“眼睛”,IPA 做执行的“手和脚”。用户无需编写任何编码,通过简单文本或语音交互,就可以打造个人 AI 助理,操作各种电脑、手机、车载软件自主完成任务,实现“你说 PC/手机做,所说即所得”,是“听得懂、想明白、看得见、动起来”的全能业务专家。
欧姆智能体
欧姆智能体(OmBot)是由联汇科技推出的一款基于大模型能力的自主智能体(Auto AI Agent),OmBot 能够感知环境、自主决策,并具备短期与长期记忆的计算机模型,模仿人类大脑工作机制,根据任务目标主动完成任务。
https://om.linker.cc/omopen/#/robot
联汇科技针对不同场景推出了首批 OmBot 应用。如知识智能体,主要针对知识、数字资产的管理和利用,具备强大的学习和推理能力,能够利用各种领域多模态知识和数字资产来提供决策和解决问题,打造企业全能”数字员工”;如视觉智能体,主要面向视觉图文方向,基于对视觉图文感知、理解,深度分析和推理,并结合专业业务知识,进行决策和行动,打造以视觉图文认知、推理、分析、决策的自主智能体。
BetterYeah
BetterYeah 是斑头雁(杭州)智能科技有限责任公司推出的企业级 AI 应用开发平台,内置 ChatGLM、阿里通义千问、百度千帆等国内外知名模型,根据场景灵活可选。同时提供包括自动向量化、自动分段、混合检索在内的数据处理工具,确保高质量、精准可控的输出。
https://www.betteryeah.com
BetterYeah 提供用户友好界面,支持各类开发节点,自定义自己的业务流程。还有丰富的官方插件,增强 Agent 扩展性,海量业务场景快速落地。也可以通过 API、SDK、Webhook 集成到企业系统中,可以和微信客服、钉钉、飞书集成。
04 多智能体协同丨智能体
Pangu-Agent
Pangu-Agent 是一个由华为诺亚方舟实验室、伦敦大学学院和牛津大学研究人员共同提出的 AI 智能体框架。它旨在解决传统强化学习(RL)在构建 AI 智能体时面临的泛化性和训练数据量问题。Pangu-Agent 作为一个元智能体框架,可以调整或微调以适应不同的应用场景,并能够复用和组合现有的多种方法。
Pangu-Agent 引入了内在函数(intrinsic functions)的概念,这些函数作用于智能体的内部记忆,支持多步“思考”过程,这使得智能体能够进行结构化的推理。Pangu-Agent 的框架受到人类大脑模块化结构的启发,将智能体的决策过程分解为多个可学习的模块或函数,提高了灵活性和可扩展性。
ChatDev
ChatDev 是一个用于构建 AI 代理的工具平台,它支持用户设计和实现各种 AI 代理,无论是在游戏中的 NPC(非玩家角色)还是功能强大的代理工具。用户可以从社区导入或自定义 GPT(预训练生成模型),并利用 PromptIDE 进行自动完成、双屏显示、可视化 PromptFlow 以及 Java 节点支持。
https://chatdev.toscl.com/
ChatDev 不仅支持 ChatGpt,还包括 Bing Chat、Google Bard、Claude、千问、讯飞等超过 10种开源模型。用户可以将自己的提示流导出为 JSON 文件,并导入到另一个设备中。ChatDev 作为一个创新的 AI 代理开发平台,提供了丰富的工具和功能,使用户能够构建和管理复杂的 AI 代理系统,无论是用于游戏、虚拟助手还是其他智能应用。
05 工作流编排+对话式服务丨智能体
腾讯元器
腾讯元器是腾讯混元大模型团队推出的智能体开放平台,作为腾讯全链路自研的通用大语言模型,其参数规模超过万亿,目前提供hunyuan-pro:万亿参数版本、hunyuan-standard:千亿参数版本、hunyuan-lite:百亿参数版本等 3 个版本。
https://yuanqi.tencent.com/my-creation
腾讯混元大模型已在 600多个腾讯内部业务和场景中落地测试,并在腾讯丰富的生态中持续迭代能力。例如微信读书基于混元大模型推出了 AI 问书、AI 大纲等新功能,大幅提升用户的阅读效率和体验。腾讯客服团队基于混元大模型升级智能客服体系,大幅提升智能对话的意图理解准确性和多轮问答流畅性。
AskXBOT
AskXBOT 是澜码科技基于大语言模型自主研发的企业级 AI Agent 平台,由设计器、知识中心、使用端、管理平台四大核心模块构成,集 Agent 与工作流设计、开发、使用、管理,与知识沉淀于一体。AskXBOT 具备高效的文件解析与处理能力,支持PDF、Excel、Word等多种格式,可实现文档问答、内容搜索、信息抽取等。
https://www.xbotspace.com
AskXBOT 可以沉淀专家的知识和行业经验,构建企业知识库,促进知识共享与传承,赋能 Agent 与工作流。同时提供全面的统计日志与审计日志记录,确保 AI Agent 使用的高安全性和可追溯性。AskXBOT 可应用于专家咨询服务、财务审核、合同管理、财报分析、经营分析、供应商资质审查、招聘、核保、智能风控等多个场景。
Gnomic
Gnomic 智能体平台是一款基于大语言模型、第三方 API 和 AI 插件等技术的创新产品,支持多模态 AI Agent 创作,可轻松接入智谱 ChatGLM、文心一言等多种大模型,并在模型间无缝切换。其利用 GPT-4 等大语言模型,为用户提供更智能、更自然的对话体验。
https://www.gnomic.cn
通过 Gnomic 智能体平台,用户无需编写代码即可创建专属智能体,平台提供直观的创建向导和实时预览功能。无论是个人用户、企业客户还是开发者,都能在 Gnomic 智能体平台找到满足需求的解决方案。
06 阿里巴巴
阿里云ModelScopeGPT
阿里云 ModelScopeGPT 是阿里云推出的一款大模型调用工具,基于阿里云 ModelScope 社区,ModelScopeGPT 可以一键调用社区中的其他 AI 模型,实现大小模型的协同工作。ModelScope 社区已聚集 180万 AI 开发者和 900多个优质 AI 模型,覆盖计算机视觉、自然语言处理、音频等多个领域。
https://www.modelscope.cn/studios/iic/ModelScopeGPT/summary
阿里云将开放 ModelScopeGPT 构建所用的数据集和训练程序,供开发者自行使用和定制不同大小模型的组合。ModelScopeGPT 将为开发者和企业提供优质的智能算力和开发工具,推动中国大规模模型生态的繁荣。
钉钉AI助理
钉钉 AI 助理是钉钉平台推出的一款集成了多项AI产品功能的智能助手,旨在以智能化的方式辅助企业的日常工作流程。钉钉 AI 助理能够进行智能对话,帮助用户快速了解聊天背景,生成多主题总结,并通过 AI 助理快速回顾每一段聊天。
https://page.dingtalk.com/wow/dingtalk/default/dingtalk/I0HfYX4QStBIpLgxnZQe
除了网址,在钉钉客户端也可以直接体验。钉钉还提供了 AI 助理市场,里面有超过 200个 AI 助理应用,覆盖了包括小红书爆款笔记创作、竞品分析、EXCEL 助手等多种工作场景。钉钉 AI 助理与钉钉的各种官方、第三方以及企业自建应用无缝结合,可以通过建立工作流,让 AI 助理主动接管完成相应操作。
07 字节跳动
Coze
Coze(国内版名称为扣子)是一个由字节跳动推出的 AI 智能体平台,用户可以在该平台上创建、配置和管理聊天机器人和智能体。Coze 支持“单 Agent 模式”和“多 Agents 模式”,以适应不同复杂度的逻辑处理需求。
https://www.coze.cn
Coze 可以使用字节跳动自家的云雀语言模型,也可以接入其他大模型,如 moonshot 的 Kimi。创建的 Bot 可以发布到不同的平台和应用中,如豆包、飞书、微信等,方便用户在不同环境中使用。Coze 拥有一个活跃的社区和市场,用户可以分享自己创建的 Bot,也可以发现和使用其他人创建的 Bot。
豆包
豆包是由字节跳动公司基于其云雀大模型开发的 AI 工具,提供多种智能服务,包括但不限于聊天机器人、写作助手以及英语学习助手等功能。豆包支持网页 Web 平台,iOS 以及安卓平台,iOS 用户可以通过 TestFlight 进行安装。豆包具备文案创作、PDF 问答、长文本分析、学习辅助、图像生成、信息搜索与整合、AI 智能体等能力。
https://www.doubao.com
2024 年 5 月 15 日,字节跳动在春季火山引擎 Force 原动力大会上正式发布了豆包大模型家族,包括通用模型、角色扮演模型、声音复刻模型、语音识别模型、文生图模型等,进一步丰富了豆包的应用场景和服务能力。豆包 App 自上线以来至 2024 年 5 月,总下载量已经达到 1 亿次,显示出其在市场上的广泛接纳度。
飞书智能伙伴
飞书智能伙伴是字节跳动旗下在线办公品牌飞书在 2023 年 11 月 22 日发布的一款先进的人工智能产品。这款产品是一个开放的 AI 服务框架,设计用于帮助企业用户根据不同的业务场景灵活选择并应用适合的底层大模型。用户可以通过创建角色的方式,为智能伙伴定制专属的名字和头像,使其成为具有个人特色的“ AI 同事”。
https://www.feishu.cn/product/ai_companion
飞书智能伙伴具备知识存储和记忆功能,能够快速获取企业知识库中的信息,基于历史交互和数据为用户提供更加精准和个性化的服务。飞书智能伙伴创建平台使得非技术人员也能轻松创建和配置自己的智能伙伴,降低了使用门槛。飞书智能伙伴已在安克创新、元气森林等公司进行了试用,并在销售、市场营销等多个工作场景展现了显著的效率提升效果。
08 结语
在深入探索与盘点形态各异、功能强大的智能体之后,我们不难发现,人工智能领域正以前所未有的速度蓬勃发展,不断拓宽技术边界,深化行业应用。
每一款模型与智能体的诞生,都是对智慧生活的又一次深化,它们不仅在技术层面实现了突破,更在商业应用、社会服务乃至人类生活方式的变革中发挥着日益重要的作用。
这些智能体和模型,如同数字化时代的“智慧使者”,在教育、科研、娱乐、职场等众多领域播种着智能的种子,促进产业升级,提升社会运行效率,同时也对个人生活带来了更加便捷、个性化的体验。它们的成功案例,为后续的研发与应用提供了宝贵的经验与灵感,激励着更多的创新者投身于人工智能的浪潮之中。
本文由 @阿木聊AI(智能体) 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
财经天下WEEKLY 2024-10-29
光锥智能 2024-09-26