当前位置：首页|资讯|编程|Stable Diffusion|生成式AI

又一个不可错过的编程大模型来了！让你惊呼“码农人生”不虚此行

作者：AI研习所发布时间：2023-08-10

编程 Stable Diffusion 生成式AI

继Stable Diffusion爆火之后，StabilityAI近期又放大招，推出了号称是革命性的编程大模型StableCode。StableCode是其首款用于编码的LLM生成式AI产品，该产品旨在帮助程序员完成日常工作。目前已发布的版本为StableCode-Completion-Alpha-3B，是一个包含30亿个参数的代码补全模型，针对多种编程语言进行了预训练，这些编程语言是基于2023年stackoverflow开发者调查的最常用语言。

StableCode模型特性StableCode模型的特色在于，能够理解和处理长篇幅上下文，也就是模型在做决策时，能够更广泛地考虑前后相邻的数据，也就是具有一次处理更多程序代码Token的能力，进而提供更精确有用的建议。官方提到，StableCode一次可以处理的程序代码Token为16000，是此前开源模型的2-4倍，用户能够一次处理的文件量，约是5个一般大小的Python文件。

StableCode模型训练分为三个阶段
- 最初Stability AI使用来自BigCode项目的stack-dataset v1.2数据集，对基础模型进行多语言训练。- 接着针对热门程序语言，诸如Python、Go、Java、Javascript、C、markdown和C++进行特化训练，总共使用了5,600亿个Token训练模型。- 基础模型创建完成后，官方进一步针对特定用途调校指令模型，以解决复杂的程序开发任务，在基础模型上训练了约12万个Alpaca格式的程序代码指令和回应数据对。

StableCode如何使用
StableCode模型旨在遵循指令来生成代码，用于训练模型的数据集采用羊驼格式。16K上下文

from transformers import AutoModelForCausalLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("stabilityai/stablecode-completion-alpha-3b")

model = AutoModelForCausalLM.from_pretrained(

"stabilityai/stablecode-completion-alpha-3b",

trust_remote_code=True,

torch_dtype="auto",

)

model.cuda()

inputs = tokenizer("import torch\nimport torch.nn as nn", return_tensors="pt").to("cuda")

tokens = model.generate(

**inputs,

max_new_tokens=48,

temperature=0.2, do_sample=True,

)

print(tokenizer.decode(tokens[0], skip_special_tokens=True))

4K上下文

from transformers import AutoModelForCausalLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("stabilityai/stablecode-completion-alpha-3b-4k")

model = AutoModelForCausalLM.from_pretrained(

"stabilityai/stablecode-completion-alpha-3b-4k",

trust_remote_code=True,

torch_dtype="auto",)

model.cuda()

inputs = tokenizer("import torch\nimport torch.nn as nn", return_tensors="pt").to("cuda")

tokens = model.generate(

**inputs, max_new_tokens=48,

temperature=0.2, do_sample=True,

)

print(tokenizer.decode(tokens[0], skip_special_tokens=True))

下面是一个StableCode利用Pytorch深度学习库完成一个相对复杂的Python文件展示（灰色文本显示了StableCode的预测）。

推荐体验

相关资讯

大模型上车，AI的又一个“狼来了”？

就像集度背后的文心大模型，理想基于大模型算法自研的MindGPT，再或者吉利AI大模型的功能释放里，最核心的其实也是语音等交互场景，这也就给到了行业短期未来又将是一场同质化厮杀的隐忧。所以基于AI大模型，比方…

文心大模型 AI大模型

蓝鲸财经 2023-08-07

AI大模型“上车”，又一个狼来了？

自动驾驶开发的核心链路包括：首先，传感器采集的路测数据上传云端；接着，使用这些数据训练自动驾驶算法；最后，进行场景仿真以测试和确保算法在各种环境下的性能和安全性。对这些数据准确地实现数据提起、转换以及加载是实…

AI大模型自动驾驶

财华社 2024-03-26

超越GPT！？又一个史上最强AI大模型来了

hi~大家好我是genji！今天刚睡醒就被一条突发新闻刷屏了——又一个“史上最强”AI大模型诞生了！(⁎⁍̴̛ᴗ⁍̴̛⁎)所以我就麻溜儿写个专栏和大家说道说道～先让我们来看一段视频，一个男子做出后仰并躲避的慢动作，AI马上知道：这是表演《黑客帝国》中的“子弹时间”：当一只手在镜头前不断变化手势，AI也能马上识别手势是在模仿什么东西：当你寥寥数笔勾勒出一只鸭子，AI会根据水波纹来判断这是鸭子而不是鸟：当你给鸭子涂上蓝色，AI会吐槽：蓝色鸭子这种玩意可不多见！让这只小鸭子出现在世界地图上呢？AI甚至会调侃：看

GenJi是真想教会你 2023-12-08

又一个AI大模型来了！CEO李志飞现场演示菜谱推荐

N视频 2023-04-21

室温超导，又一个ChatGPT？

最近，大家也关注到了资本市场上的一些异动。A股法尔胜连续5天3板，金徽股份3天2板，百利电气、创新新材、国缆检测和豫光金铅等股票都纷纷涨停。美股市场上，美国超导公司的股价在连续三天上涨后，第四天盘前

图解金融 2023-08-18

近期资讯

Counterpoint Research发布2024Q3全球智能手机销量报告

近日，市场调研机构Counterpoint Research发布了智能手机最新销量报告。据报告显示，2024年第三季度全球智能手机销量同比增长2%，这是2018年第三季度以来第三季度首次出现同比正增长，同时也实现全球智能手机市场连续第四个季度增长，反映出全球手机市场正在持续复苏。从前五大手机厂商所占份额排名来看：●得益于Galaxy A系列需求和 Galaxy S24系列良好性能表现，三星以19%市场份额保持领先；●在iPhone16系列新机发布的推动下，苹果当季度销量增长1%，市场份额仅次于三

ZAEKE知客 2024-10-16

【新疆无人机培训】高效、精准、安全——无人机农林植保技术的全面解析

新疆保华润天航空无人机培训中心：本文深入探讨了无人机农林植保技术的原理、优势及应用场景，展示了这一技术如何以其高效快速、精准度高和安全性强的特点，在提高农业生产效率的同时减少环境污染，预示着未来农业的发展方向。无人机可以在低空或超低空飞行，这使得药液能够均匀地覆盖在作物表面，从而提高了防治效果。与传统人工喷洒相比，无人机作业速度快，能够在较短时间内完成大面积农田的植保作业，显著提高了农业生产效率。此外，无人机农林植保技术还具有精准度高的优势。通过先进的导航系统和喷洒装置，无人机能够实现精确喷洒，这既减少了

新疆无人机考证中心 2024-10-16

港大开源！8个数据集排名第一！UniMatch V2：突破语义分割的极限

0. 论文信息标题：UniMatch V2: Pushing the Limit of Semi-Supervised Semantic Segmentation作者：Lihe Yang, Zhen Zhao, Hengshuang Zhao机构：香港大学、上海AI Lab原文链接：https://arxiv.org/abs/2410.10777代码链接：https://github.com/LiheYoung/UniMatch-V21. 摘要半监督语义分割旨在从廉价的无标记图像中学习丰富的视觉知识，以增

3D视觉工坊 2024-10-16

【通用规范汉字表】【二级字】【1800/3000】

释义主要来源于字海网，有微调。 [图片]

湉渢 2024-10-16

高光回顾 | CIOE 2024，艾迈斯欧司朗放大招！

放！大！招！CIOE 中国光博会 2024现场艾迈斯欧司朗展台（H6 C55）用新品及新应用的奔涌创新力、以及多款热门应用DEMO的澎湃科技力，再度领衔嗨翻现场！4大重磅发布30+款创新DEMO及应用2场干货直播将艾迈斯欧司朗展台汇集成光电硬科技的集散地全球光电产业的焦点舞台搭配颜值实用双在线的各类好礼走起！我们现场见真章！艾重磅发布创“新”力 Up! Up! Up!三款新品“全高光”现场发布，让艾迈斯欧司朗（H6 C55）的展台再度成为“流量之最”。新一代单区直接飞行时间（dToF）传感器TMF880

艾迈斯欧司朗 2024-10-16

TVS管功率汇总选型so easy

电路保护器件典型代表之一：TVS二极管，这对于新老电子工程师而言并不陌生。国内生产TVS管的厂家有很多，接下来，要介绍的是厂家东沃电子生产的TVS二极管，封装多样，型号齐全，根据功率大小可分为： 200W功率TVS 1）SMFxxA/SMFxxCA：反向截止电压3.3V~440V 最大钳位电压8.0V~713V 封装SOD-123 2）TPSMFxxA/TPSMFxxCA：反向截止电压5V~350V 最大钳位电压9.2V~567V 封装SOD-123 400W功率TVS 1）SMF4LxxA/SMF4Lx

东沃电子 2024-10-16

餐饮系统管理软件哪个好？80%店家都在用餐饮系统小程序接单！

餐饮系统管理软件哪个好？现在越来越多实体店家，都在用餐饮系统小程序接单了。如果你不想被同行甩开差距，那就快跟我一起了解一下吧！ [图片] 一、为什么餐饮系统小程序接单这么火？ 1、符合顾客消费需求现在的顾客都追求高效便捷的用餐体验，而餐饮系统小程序的功能就很好的击中这个需求点。餐饮系统管理软件小程序包含线上预约、扫码点餐、优惠团购等功能。 ✔顾客可以在到店前用手机预约订位，不用排队等叫号； ✔顾客可以到店自助扫描餐桌上的二维码来点菜下单，不用等着服务员拿菜单过来，然后再一笔一划地写下来这么麻烦

盈建云 2024-10-16

传承FOCUS核心导热技术，海韵CORE GX-650 ATX3高性价比电源开箱

海韵经典FOCUS系列电源前阵子经历大改版——升级成ATX 3.1标准，并首次引入OptiSink高效导热技术，牙膏可是一点没挤研发实力尽显。不过FOCUS系列对于大部分玩家来说，价格还是不够亲民，尤其国内攒机硬件目前是处于卷得飞起的状况，因此在临近双十一以及新一代处理器大放光彩之时，推出了比FOCUS系列更有性价比的电源——CORE ATX 3系列。包装设计依然是吸睛的黑金风格，中间区域是型号CORE ATX3的标注，巧妙地把字母“C”和“O”融为一体了，手上这款是GX-650最主流的定位，下方有四个相

中号硬核玩家 2024-10-16

如何选择分光色度仪的波长

与几十年前的早期型号相比，现代技术已经大大改变了分光色度仪的性能。这些设备已成为全球各行业研究、开发和生产的关键。由于多种分光色度仪发挥着不同的作用，因此选择正确的设备并为每种仪器选择最佳设置对于获得最理想的结果至关重要。如何使用分光色度仪分光色度仪由两个主要部件组成——光谱仪和光度计。光谱仪是一种提供特定波长光的仪器，而光度计则测量光的强度。分光色度仪是一个完整的系统，包含一个光源和收集光进行测量的组件。尽管所有分光色度仪都包含光谱仪，但并非所有光谱仪都是分光色度仪的一种。分光色度仪根据波长的函

信联小卫 2024-10-16

LIMS系统的多样化用途及其在各领域实验室的应用实践

一、引言随着科学技术的不断进步和实验室数据量的急剧增长，传统的数据管理方法已无法满足现代实验室的需求。LIMS（实验室信息管理系统）作为一种高效、准确且合规的数据管理工具，正逐渐成为实验室不可或缺的一部分。本文将深入探讨LIMS系统的多样化用途，并通过具体案例展示其在不同领域实验室的应用实践，同时推荐一款优质的LIMS系统。二、LIMS系统的多样化用途1.研究实验室管理LIMS系统能够快速配置复杂的实验室工作流，实现工作流的串联和整体跟踪，从而提高实验室效率。通过自动化样本处理和结果数据，LIMS系统能够

白码科技 2024-10-16

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1