———
近日,红杉资本发布了一篇名为《The New Language Model Stack》的文章,他们采访了 33 家公司,总结出了很多干货信息。
🔗 https://www.sequoiacap.com/article/llm-stack-perspective/
1⃣️ 几乎每家公司都在尝试把 LLM(大语言模型)应用在他们产品中。
2⃣️ 这些应用主要基于 API、检索和编排,其中的关键数据:
✅ 65% 的应用已经进入生产阶段
✅ 91 % 的公司选择使用 GPT 作为基础模型 API
✅ 38% 的公司对 LangChain 等开发框架感兴趣
✅ GPT 并非没有对手,对 Anthropic 模型 API 感兴趣的公司增长到了 15%
3⃣️ 多数公司希望定制化 LLM,以适应他们的产品环境,定制程度越高,难度越高:
🔴 地狱难度:从头开始训练自定义模型
🟡 中等难度:微调基础模型
🟢 入门难度:使用预先训练好的模型并检索相关的上下文
4⃣️ LLM API 技术的堆栈与自定义模型训练堆栈是分开的,但未来两者会融合在一起。【图一】
值得关注的公司和技术:
🔹 LLM API:OpenAI,Anthropic,cohere
🔹 向量数据库:AWS,pgvector,Pinecone
🔹 文字转语音:RESEMBLE.AI,ElevenLabs,WELLSAID
……
5⃣️ LLM 堆栈正在变得越来越便于开发者使用,普通开发者也能调用强大的大语言模型
6⃣️ LLM 应用将朝着多模态发展,但这一切都还是初期阶段。
此前,Newcomer 专栏也整理过一份《AI 地图与资本之争》的文章,分析了生成式 AI 的现状:
🌟【图二】在 LLM 基准平台 Chatbot Arena 上,GPT-4 毫无意外的拿下冠军,而 Anthropic 的 Claude 分别取得第二、三名
🌟【图三】生成式 AI 竞争最激烈的行业分别是
1. 市场营销和销售的文本应用
2. 音频应用
3. 客户支持和聊天机器人应用
4. 图像应用
🌟 【图四】获得 AI 融资的领域
1. MLOps 和平台工具
2. 语义和向量搜索
3. 音频
4. 虚拟形象
5. 图像