Qwen 2.5 系列包括从 0.5B 到 110B 参数的模型,针对编程、逻辑推理和自然语言理解等各种任务进行了优化。这些模型包括用于边缘设备的较小模型(0.5B、1.8B、4B、7B、14B)和用于企业用途的较大模型(72B、110B),在指令遵循、逻辑和超过 29 种语言支持方面都有了显著的改进。它们具有长上下文支持(最多 128K 个输入token和超过 8k 个token生成),并且可以生成 JSON 等结构化输出。Qwen 2.5 系列在多模态和音频/视频理解等任务中表现出色。 Qwen2.5
ChatGPT编程
Second_State 2024-10-10
目前,openai的o1系列模式采用了一种新型的推理模型,可以说是和之前版本大不一样的gpt了,之前的gpt4模型基本被开源模型超过, 根据自己的测试,数学方面的质量打八十分,可以用数学推理的算法去改进代码自动编写的质量和可信度, 但是结合实际项目需求自动编写代码的产品,大部分都非常依赖客户自己的行业专属知识库,也就是经验库,每个项目都有自己的历史代码和必须有的行业特定的优化代码,这部分如果没有,是无法完成现实里的辅助开发的 第二,openai提到,最大的失误结果来源是计算错误,而计算错误在大模型更新之后
OpenAIGPT-4编程
信号再生中 2024-10-10
|原文章发布于2024年09月09日端侧 ChatGPT 时刻到来!旗舰端侧模型面壁「小钢炮」系列进化为全新 MiniCPM 3.0 基座模型,再次以小博大,以 4B 参数,带来超越 GPT-3.5 的性能,强得不像端侧模型。并且,量化后仅 2GB 内存,端侧友好。这还是一款瑞士军刀般全面开挂的基座模型,一口气带来:·无限长文本,榜单性能超越 Kimi,超长文本也不崩;·Function Calling,性能比肩 GPT-4o 的端侧最强 Function Calling;·超强 RAG 外挂三件套,中文
ChatGPT
OpenBMB 2024-10-09
|原文章发布于2024年08月13日想到了直升机,没想到的是火箭! MiniCPM-V 2.6 一经发布,火箭登顶全球著名开源社区 GitHub 与 HuggingFace 趋势榜 Top 3。 至此,面壁小钢炮 MiniCPM-V系列,GitHub 星标破万! 小钢炮MiniCPM系列自今年2月1日面世以来,累计下载量已超百万!在众多开发者心中,MiniCPM 渐渐成了一把衡量端侧模型能力极限的标尺,最新的 MiniCPM-V 2.6 再次抬高了端侧多模态的性能天花板:仅 8B 参数,单图、多图、视频理
GitHubHugging Face
一 ChatGLM定义 ChatGLM是由清华技术成果转化的公司智谱AI发布的开源的、支持中英双语问答的对话语言模型系列,并针对中文进行了优化,该模型基于General Language Model(
ChatGLM清华
夏沫的梦 2024-10-09
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1