相信大家都已经见识到了,开源大型语言模型(LLMs)及其变体(例如LLaMA和Vicuna)在各种任务上取得了显著的进展。原因在于当前LLM的指令调优技术主要集中在基本语言任务上,缺乏对工具使用方面的探索。
清华ChatGPT大语言模型
机器之心Pro 2023-08-02
ChatGPT并不是从AI生成内容的唯一选择。这里分享其他14个大型语言模型,几乎可以与ChatGPT相媲美。ChatGPT视为人工智能的代名词。但它并不是唯一的大语言模型,对于某些任务或领域来说,它甚至可能不是最佳选择。而且它的新竞争对手几乎每天都会出现。似乎每个人都想打造下一代人工智能工具……LlamaFacebook(现在的Meta)创建,任何人都可以下载Llama,并可以将其作为为特定应用创建更精细的模型的基础。(Alpaca和Vicuna都是建立在Llama之上的。) 该模型也有四种不同的规格。
ChatGPT大语言模型LLaMAAlpacaVicuna
来自夜月神器的达人 2023-07-25
大语言模型的启动器text-generation-webui一键整合包text-generation-webui是一个用于运行类似Chatglm、RWKV-Raven、Vicuna、MOSS、LLaMA、llama.cpp、GPT-J、Pythia、OPT和GALACTICA等大型语言模型的Gradio Web用户界面。它的目标是成为文本生成的AUTOMATIC1111/stable-diffusion-webui。这里是它的github链接:https://github.com/oobabooga/te
大语言模型VicunaLLaMAChatGLMMOSS
学术Fun 2023-07-23
【新智元导读】4月底火爆开发者社区的最全LLM综述又更新了!这次,LLM的进化树末端已经从GPT-4和Bard更新到了Vicuna和Falcon。 在4月一经推出就火爆开发者社区的大语言模型综述更新了
提示词GPT-4BardVicuna
新智元 2023-07-09
开源模型真的可以超过 ChatGPT了吗?大模型火了起来,每天我们都能看到各种「大」新闻。今天,又来了个 大新闻:新开源的一个大模型超越了 ChatGPT。具体是什么呢?OpenLLM 是一系列在极小、多样且高质量的多轮对话数据集上进行微调的开源语言模型。这两日,作者们更新了该系列模型,并宣称:OpenChat 模型在 AlpacaEval 上获得 80.9% 的胜率;在 Vicuna GPT-4 评估上,性能达到 ChatGPT 的 105%!也就是上面推特截图中,两位博主宣称的开源模型超越
ChatGPTGPT-4Vicuna
AI研习所 2023-07-05
最近,UltraLM-13B 在斯坦福大学 Alpaca-Eval 榜单中位列 开源模型榜首,是 唯一一个得分在 80 以上的开源模型。ChatGPT 之后,开源社区内复现追赶 ChatGPT 的工作成为了整个领域最热的研究点。其中,对齐(Alignment)技术是最重要的环节之一,来自斯坦福大学、伯克利、微软、Meta、Stability.AI 等多个机构都争相推出相关的模型和方法(如Alpaca、Vicuna、WizardLM 等等)。我们在探索对齐技术的过程中发现,训练出具有基本指令理解和追随能力的
斯坦福AlpacaVicunaChatGPT
OpenBMB 2023-07-02
具体使用情况请参考:https://www.bilibili.com/video/BV1rX4y147mp/配置要求内存:>=32GCPU: 无特别要求显卡:推荐RTX4090 显存最低需要20G以上,低于20G会明显卡顿硬盘空间:>=20G安装说明1、安装package目录下的所有软件(已安装的可忽略)2、python版本>=3.103、mysql-8.0.33-winx64.zip可以不用解压,install.bat脚本会执行安装命令4、vs_BuildTools安装页面中选择 ->使用C++的桌面开
ChatGPTVicuna
从零开始成长的韭菜 2023-06-28
每日AI盘点624 1. 剑桥华人团队发布了PandaGPT,这是首个跨六种模态(图像/视频、文本、音频、深度、热成像和IMU)的基础模型,能够执行指令并处理相关数据。 2. UC伯克利的LLM排位赛近期更新。GPT-4依然保持榜首位置,GPT-3.5紧随其后。UC伯克利团队新发布的拥有330亿参数的vicuna模型进入前五名,成为开源模型中的佼佼者。 3. 一个团队使用规模为7B token的高质量“教科书级”数据训练了一个拥有13亿参数的编码任务模型。尽管模型规模小于竞品,但在HumanEval的pa
剑桥GPT-4Vicuna
每日AI盘点 2023-06-24
近期有很多工作比如Alpaca、Vicuna、Koala等论文宣称通过收集到的大量chatgpt output,在基于开源大模型如LLaMA上进行微调后的模型就接近甚至超过chatgpt效果。有些看热闹不嫌事大的媒体渲染诸如“复制chatgpt,仅需100美元“,”开源大模型超过chatgpt“啦。但事实真的如此吗?来自UC Berkeley的研究团队在The False Promise of Imitating Proprietary LLMs这篇论文中分析的这些模型的效果,并给出结论”还差的
ChatGPTAlpacaVicunaLLaMA
一起学chatGPT一起学ai 2023-06-23
InfoQ 研究中心选取语言模型准确性、数据基础、模型和算法的能力、安全和隐私四个大维度和 12 个细分维度,分别对ChatGPT、Claude、Sage、天工3.5、文心一言、通义千问、讯飞星火、Moss、ChatGLM、vicuna-13B进行了超过 3000+ 道题的评测。另外,本次研究特别关注了技术视角中大模型产品的编程能力,同时也专门设置了关于中文语境的特色测试题目, 如方言测试、中文特色推理、对对联等。InfoQ 研究中心希望可以通过本次测评帮助更多技术领域同仁获得对于中外大模型产品能力的逻辑认知,以帮助大家在 AGI 创业方向选择、工作实际应用等方面获得最新认知。
大语言模型天工大模型VicunaChatGPTClaude
InfoQ研究中心 2023-06-06
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1