当前位置:首页|资讯|OpenAI|微软|ChatGPT|AIGC

OpenAI调查ChatGPT错误率升高问题;零一万物上线Yi微调模型丨AIGC大事日报

作者:智东西发布时间:2023-12-04

原标题:OpenAI调查ChatGPT错误率升高问题;零一万物上线Yi微调模型丨AIGC大事日报

1、零一万物上线Yi-34B-Chat微调模型及量化版

2、中科闻歌雅意大模型2.0将于12月15日发布

3、优刻得智算平台“孔明”上线

4、OpenAI就ChatGPT错误率升高开展调查

5、微软CTO发布备忘录:将继续支持OpenAI

6、Adobe收购印度AI视频创企Rephrase.ai

7、Meta新注意力机制:将LLM用作自然语言推理器

8、F1赛车试用AI解决赛道限制违规问题

1、零一万物上线Yi-34B-Chat微调模型及量化版

据零一万物微信公众号发文,11月24日,零一万物Yi-34B-Chat、Yi-6B-Chat微调模型已经在Hugging Face、ModelScope魔搭社区等开源社区平台正式发布上线。同时,零一万物还为开发者提供了4bit、8bit量化版模型,可以直接在消费级显卡(如RTX3090)上使用。

模型地址:

https://huggingface.co/01-ai/

https://www.modelscope.cn/organization/01ai

2、中科闻歌雅意大模型2.0将于12月15日发布

据中科闻歌公众号今日发文,12月15日,中科闻歌将在北京举办雅意2.0发布会,发布政企安全可靠大模型,专注于政府智能、商业智能。据介绍,该模型从零开始预训练、模型架构自主研发,支持百亿/千亿多参数规格,兼容国产算力,支持企业级部署,覆盖10+种主流语种,并将开源开放数据、模型、应用。

3、优刻得智算平台“孔明”上线

据优刻得云计算公众号昨日发文,近日,优刻得推出了智能算力平台“孔明”,面向行业用户提供一站式管理的算力资源和运营服务。据介绍,该平台能够胜任在AI领域内的大部分业务,帮助大模型公司提高训练效率、优化模型性能、降低开发成本,进一步推动AI大模型在各行业领域的发展和应用。“孔明”智算平台支持同构和多种异构卡型的接入,包括但不限于英伟达、AMD、英特尔等品牌,甚至是各类国产GPU卡型,同时支持训练集群的统一调度和管理,并为大语言模型提供分布式训练和断点续训的能力。

4、OpenAI就ChatGPT错误率升高开展调查

当地时间11月23日上午,OpenAI更新运行情况说明称,ChatGPT的错误率升高,正在开展调查。随后官方表示问题已被识别并已实施修复,正在继续监测影响。

5、微软CTO发布备忘录:将继续支持OpenAI

据外媒The Verge昨日报道,微软CTO兼AI执行副总裁Kevin Scott近日发布备忘录,谈论OpenAI动荡一事,并称将继续支持OpenAI,并总结了过去一周取得的三项AI进展:Azure部署了新的AI计算、新成立的微软AI Frontiers发布新研究Orca 2大模型,ChatGPT发布新语音功能。

6、Adobe收购印度AI视频创企Rephrase.ai

据外媒ETtech昨日报道,Adobe已收购印度AI文生视频创企Rephrase.ai。通过此次收购,Adobe寻求把Rephrase的技术堆栈和生成式AI视频功能与其内部视频编辑平台Creative Cloud集成,并增强其产品。知情人士称,作为交易的一部分,Rephrase团队的大多数成员将加入Adobe。

7、Meta新注意力机制:将LLM用作自然语言推理器

据机器之心报道,11月20日,Meta研究者发布论文,指出大型语言模型(LLM)因不相关上下文或者输入提示中固有的偏好做出错误判断的现象,其根本问题在于Transformer本身固有的构建方式,尤其是其注意力机制。因此,研究者提出了一种完全不同的注意力机制方法,通过将LLM用作一个自然语言推理器来执行注意力。具体来讲,他们利用LLM遵循指令的能力,提示它们生成应该注意的上下文,从而使它们只包含不会扭曲自身推理的相关资料。研究者将这一过程称为 System 2 Attention(S2A),将底层Transformer及其注意力机制视为类似于人类System 1推理的自动操作。

论文地址:

https://arxiv.org/pdf/2311.11829.pdf

8、F1赛车试用AI解决赛道限制违规问题

据路透社今日报道,一级方程式(F1)赛车管理机构正在本周末举行的阿布扎比大奖赛上试用AI来解决违反赛道限制的问题。总部设在巴黎的国际汽联(FIA)表示,该机构将使用“计算机视觉”技术,通过形状分析来计算超出赛道边缘的像素数量。AI将对驾驶员四个车轮都越过赛道边缘白线的真正违规行为进行分类,从而减少国际汽联远程操作中心(ROC)的工作量,加快反应速度。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1