基于LLaMA-7B/Bloomz-7B1-mt复现开源中文对话大模型BELLE及GPTQ量化

作者：吃果冻不吐果冻皮发布时间：2023-04-02

最近，ChatGPT、GPT4等大模型的突如其来，但对于普通大众，想要从头开始训练一个上百亿、千亿的大模型成本高昂，因此，开源平替是一个不错的选择。之前，尝试了从0到1复现斯坦福羊驼（Stanford...【查看原文】

相关资讯

全球最强开源大模型一夜易主，谷歌Gemma 7B碾压Llama 2 13B，今夜重燃开源之战

谷歌发布全球最强开源大模型Gemma，7B性能超越Llama 2 13B！谷歌和OpenAI，已经卷出了新高度。这轮番放深夜炸弹的频率，让人不得不怀疑双方都已经攒了一堆大的。

谷歌 OpenAI LLaMA

新智元 2024-02-22

7B超越百亿级，北大开源aiXcoder-7B最强代码大模型，企业部署最佳选择

当下，大语言模型集成至编程领域、完成代码生成与补全任务成为重要趋势。业界已经出现了一批引人瞩目的代码大模型，比如 OpenAI 的 CodeX、谷歌 DeepMind 的 AlphaCode...

北大编程大语言模型 OpenAI

机器之心 2024-04-10

跨设备运行幻方量化大模型 DeepSeek-LLM-7B-Chat

DeepSeek-LLM-7B-Chat[1] 是幻方量化成立的深度求索公司训练的70亿参数大语言模型，它用英文和中文的20亿个token进行了训练。DeepSeek LLM 7B/67B Base 和 DeepSeek LLM 7B/67B Chat 版本已开源，小伙伴们可以下载体验。本文中，我们将介绍：如何在自己的设备上运行 DeepSeek-LLM-7B-Chat如何为 DeepSeek-LLM-7B-Chat 创建一个与 OpenAI 兼容的 API 服务我们将使用 Rust + Wasm

大语言模型 OpenAI

Second_State 2023-12-27

“最强7B模型”论文发布，揭秘如何超越13B版Llama 2

来自“欧洲OpenAI”的“最强7B开源模型”Mistral最近可谓是圈粉无数。它各方面的测试指标全面超越了13B的Llama2，甚至让一众网友觉得羊驼不香了。最新消息是，MistralAI团队已经发布了相关论文，透露背后的技术细节。

LLaMA OpenAI

量子位 2023-10-13

vivo自研70亿蓝心大模型7B开源：中文能力国内第一

快科技11月1日消息，今天，2023年vivo开发者大会如期在深圳举行，在发布会上，vivo 正式发布了旗下的自研通用AI大模型矩阵——蓝心大模型。此次发布的蓝心大模型共包含5款，包括1

AI大模型

2023-11-01

近期资讯

解锁高效布局：Tab组件最佳实践指南

容器组件Tabs 当页面内容较多时，可以通过Tabs组件进行分类展示，以下这些效果都可以通过Tabs组件来实现 Tabs组件的页面组成包含两个部分，分别是TabContent和TabBar。TabCo

梁林烁 2024-12-26

开发常遇见的bug避雷:日期

只能选择下个月之后的日期 picker-options的用法就是控制选择日期的范围，禁用哪些日期, :picker-options="{ disabledDate }" GPT给出的案例禁用特定的日

阿吉拉 2024-12-26

Vite 构建 Vue3 组件库之路: 使用CSS预处理器构建高效且易维护的样式管理体系

本文介绍了使用CSS预处理器（如Sass）构建UI组件库的样式系统，通过预处理器的变量、混合和函数等特性提高样式一致性、可维护性和可扩展性

慢知行 2024-12-26

Flutter是如何处理一次点击事件

前言点击事件从原生给出的回调开始处理，从PointerDownEvent开始收集命中的节点，到PointerUpEvent选出胜利者并响应点击回调结束。在实现自研框架的扩大热区功能时，如何保证被绝

laterlater 2024-12-26

容器化你的React应用

如果你和我一样，你喜欢用React制作响应式的用户界面。但是，设置一致的开发环境并确保顺利部署会变得复杂。这就是Docker可以拯救你的地方。让我们深入了解Docker和React的世界！为什么要

关山月 2024-12-27

常用工具🔧命令（nvm、cgr、npm、yarn、pnpm等）

日常开发中频繁使用的命令行工具，这些工具帮助开发者管理和安装不同版本的Node.js（如nvm），处理项目依赖（如npm、yarn、pnpm），以及高效管理和切换项目镜像（如cgr）

搬砖达人Mya 2024-12-26

Nuxt 开发后端部分前奏：搭建 MySQL 开发环境

前文的结尾我们提到，Nuxt 不单单是一个纯粹的前端框架。实际上，它巧妙地模糊了前端与后端开发之间那道泾渭分明的界限，赋予开发者构建全栈应用的超凡能力。无需大费周章搭建独立后端服务器，只需遵循 Nu

麻爪 2024-12-26

Ant Design X 初体验

前言近年来，随着人工智能（AI）的迅猛发展，数字化转型已经成为各行各业的核心推动力。在这一变革过程中，用户体验和界面设计也在不断地演变和提升。作为一款基于 React 的 UI 组件库，Ant De

小Wang 2024-12-26

TypeScript入门

概述 TypeScript（简称 TS）是微软公司开发的一种基于 JavaScript （简称 JS）语言的编程语言。它的目的并不是创造一种全新语言，而是增强 JavaScript 的功能

dleei 2024-12-26

turbo配合pnpm的食用指南

这是一份关于如何使用turbo新建monorepo项目的食用指南，注意在pnpm>9版本后，我们安装本地包需要使用.npmrc对其进行设置

Manshawar 2024-12-26

基于LLaMA-7B/Bloomz-7B1-mt复现开源中文对话大模型BELLE及GPTQ量化

推荐体验

相关资讯

全球最强开源大模型一夜易主，谷歌Gemma 7B碾压Llama 2 13B，今夜重燃开源之战

7B超越百亿级，北大开源aiXcoder-7B最强代码大模型，企业部署最佳选择

跨设备运行幻方量化大模型 DeepSeek-LLM-7B-Chat

“最强7B模型”论文发布，揭秘如何超越13B版Llama 2

vivo自研70亿蓝心大模型7B开源：中文能力国内第一

近期资讯

解锁高效布局：Tab组件最佳实践指南

开发常遇见的bug避雷:日期

Vite 构建 Vue3 组件库之路: 使用CSS预处理器构建高效且易维护的样式管理体系

Flutter是如何处理一次点击事件

容器化你的React应用

常用工具🔧命令（nvm、cgr、npm、yarn、pnpm等）

Nuxt 开发后端部分前奏：搭建 MySQL 开发环境

Ant Design X 初体验

TypeScript入门

turbo配合pnpm的食用指南

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响