前言 在人工智能领域,大型语言模型(LLM)的研发一直是技术竞争的前沿。最近,Databricks公司推出的DBRX模型,以其1320亿参数的规模和创新的细粒度MoE(混合专家)架构,成为开源社区的焦...【查看原文】
AI大模型得到了前所未有的关注度与蓬勃发展,并在各类应用场景中产生了深远的影响。与之相应的是,对于高效、高可用的AI大模型推理系统的需求逐渐增长,成为许多企业的业务效率和成本挑战。潞晨科技公司为此打造了高效易用的Colossal-Inference推理引擎,可显著提高AI大模型吞吐速度,以应对推理场景中的性能瓶颈和成本挑战。该推理引擎集成了分块显存管理与分页注意力算法,预设与自定义模型优化策略,连续批处理调度。预设中提供高性能手写算子, 第三方的算子加速库;而在预设之外,用户可以通过使用基础算子与模型层,
AI大模型
潞晨科技官方账号 2024-05-22
开源大模型超闭源?Meta重回开源大模型铁王座。
LLaMAGPT-4
智东西 2024-04-20
在ChatGPT时代,AI因为大模型再次面临算力不足的问题,这一次英伟达还有办法吗?CuLitho在GPU上运行,其性能比目前的光刻技术提高了40倍,可以加速目前每年消耗数百亿个CPU小时的大规模计算工作负载。
ChatGPT
机器之心Pro 2023-03-22
3月27日,美国数据和人工智能公司Databricks宣布开源MosaicResearch团队主导开发的通用混合专家(MoE)大语言模型DBRX。DBRX在语言理解、编程、数学和逻辑等方面表现卓越,不仅在性能上超过了开源大模型Llama2、Mixtral以及马斯克新开源的Grok-1,而且在多项评分上已经逼近GPT-4。
人工智能LLaMA大语言模型
钛媒体APP 2024-03-29
【CNMO科技消息】4月19日,Meta公司正式推出了其开源人工智能模型Llama3。Llama3提供两个版本供开发者选择,分别是8B参数版本和更为庞大的70B参数版本,后者拥有超过4000亿参数,拥有强大的计算与学习能力。
人工智能LLaMAGPT-4
手机中国 2024-04-19
飞通过对星火大模型训练与推理性能的极致优化,全面提升了星火大模型底座的核心能力,加速大模型在行业应用落地。融智于算,聚力跃升,本次智享会不仅是一场知识的分享,更是一次心灵的共鸣,激发了对未来智算产业的无限想象。
脑极体 11小时前
【CNMO视频】可以说DJIAction5Pro进行了全方位的升级,无论是参数还是体验都是对得起Pro之名。这期视频,让我们来看看这款更Pro的Action,表现到底怎么样?
手机中国 12小时前
作为PC端处理器的两大巨头之一,AMD前几年凭借在单核性能上以及核显上的持续发力,可以说真的做到了体验很棒,再配合超高的性价比真的完全配得上AMDYES!但是在最近上市的锐龙57600X3D身上我真的对AMD的性价比产生了怀疑,甚至对比自家7800X3D虽然价格上小有优势,但是这性能差距真的不足以支撑这个两千元出头的价位。
数码方式 11小时前
快科技9月19日消息,大疆今天正式发布了OsmoAction5Pro,官方号称是“超旗舰画质运动相机”,定价2598元起。
快科技 11小时前
据阿里巴巴微信公众号9月19日消息,阿里云百炼平台上的三款通义千问主力模型再次降价。Qwen-Turbo价格直降85%,低至百万Tokens0.3元,Qwen-Plus和Qwen-Max分别再降价80%和50%。
中国经济网 11小时前
近日,由上海振华重工为中交一航局研发设计的“内河沉管基床整平及沉放安装一体组合驳方案”顺利交付。该技术合作项目具有开创性的意义,将对沉管隧道在我国广袤内河流域的普及应用带来重要的参考价值和示范作用。
国际船舶网 12小时前
文心智能体平台新近上线了“商业三件套”:链接挂载、线索转化、商品挂载功能,最高支持100个商品挂载,为企业和个人开发者提供了多样化的变现途径。Qwen2.5涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。
蓝媒汇 11小时前
美国电商平台百思买近日上架了PS5Pro的预购页面,同时也曝光了PS5Pro的外包装,整体造型与PS5轻薄款类似,主色调为黑色,考虑到PS5主机有光驱的版本包装为白色,无光驱为黑色,所以PS5Pro应该没有白色包装的版本。
3DMGAME 11小时前
河南昆仑技术有限公司(以下简称:昆仑技术)作为华为计算核心伙伴之一,携领先智算产品与解决方案亮相大会,并参与开放演讲、开发者赛事等环节。大会同期,昆仑技术团队预赛第一晋级昇腾AI原生创新算子挑战赛(S2赛季)【算子性能挑战命题】,纵深关注AI与行业融合,与业界同仁、开发者共探行业智能化的机遇与挑战。
砍柴网 11小时前
9月19日,阿里云CTO周靖人发布全新视频生成模型,可生成影视级高清视频,可应用于影视创作、动画设计、广告设计等领域。
北京商报 11小时前
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1