当前位置:首页|资讯|OpenAI|英伟达|融资|AIGC|Hugging Face

Open AI创始人赴中东千亿美元融资、英伟达和VMWare合作推出定制化AIGC服务、Hugging Face获2亿美元D轮融资|36氪GPT周报

作者:沈筱发布时间:2023-08-28

作者:子渝

编辑:沈筱

Meta联手CMU打造「通用机器人智能体」RoboAgent

8月21日消息,Meta 和 CMU 联合研究团队耗时两年,成功开发出了一款名为 RoboAgent 的通用机器人智能体。RoboAgent 仅仅通过7500个轨迹的训练就实现了12种不同的复杂技能,通过离线添加不同变化的场景来增加数据集,并使用动作分块 Transformer 模型来处理多任务数据。这些复杂任务包括烘焙、拾取物品、上茶、清洁厨房等,并能在100种未知场景中泛化应用。

https://www.chinaz.com/2023/0821/1552733.shtml

英国计划斥资1.3亿美元购买数千颗高性能人工智能芯片

8月21日消息,据外媒报道,为了在全球计算能力竞赛中迎头赶上,英国首相里希·苏纳克(Rishi Sunak)计划斥资1.3亿美元(1亿英镑)购买数千颗高性能人工智能(AI)芯片。据外媒报道,这笔资金将用于向芯片制造商英伟达、AMD 和英特尔订购芯片。据悉,英国科学资助机构英国研究与创新(UK Research and Innovation)已进入订购5000个英伟达GPU的后期阶段。

http://www.techweb.com.cn/world/2023-08-21/2932344.shtml

英伟达和VMWare合作推出定制化AIGC服务

8月22日,英伟达和软件制造商VMWare周二扩大了合作伙伴关系,两家公司宣布,将合作开发新的软件平台,为更多企业带来更加安全的定制化生成式人工智能(AI)服务。这些模型将使用客户独有的数据来创建供内部使用的私有人工智能模型。英伟达表示,为支持这项服务,戴尔、惠普和联想生产的支持人工智能的服务器预计将在今年年底推出,这些服务器使用英伟达的企业软件、L40S图形处理单元和BlueField-3数据处理单元。

https://blogs.nvidia.cn/2023/08/22/vmware-and-nvidia-unlock-generative-ai-for-enterprises/

钉钉宣布开放 AI PaaS,多产品线与场景接入大模型

8 月 22 日,2023 钉钉生态大会在上海张江科学会堂举行,这次大会,钉钉宣布开放智能化底座能力 AI PaaS,这标志着钉钉智能化进入生态层;同时公布了钉钉智能化的最新进展:已有17条产品线、55个场景全面接入大模型。钉钉还尝试着给出了行业内首个大模型落地应用场景的商业化方案,在原有收费版钉钉的基础上配置大模型调用额度,根据测算,调用一次大模型不到5分钱。

https://www.ithome.com/0/714/406.htm

DeepMind推出强化学习算法ReST,使LLM输出与人类偏好更一致

8月22日消息,DeepMind推出了一种新的强化学习算法ReST,目的是使大语言模型(LLM)的输出与人类偏好更为一致。ReST的核心是将数据集增长和策略改进分为两个离线阶段。实验结果显示,ReST在机器翻译任务上表现卓越,显著提高了翻译质量,且与在线RL方法相比,ReST在人类评分上更胜一筹。

https://finance.sina.com.cn/tech/roll/2023-08-22/doc-imziaace4562397.shtml

昆仑万维发布AI搜索产品"天工 AI 搜索"

8月23日消息,昆仑万维今日宣布,正式推出国内第一款融入大语言模型的搜索引擎 —— 天工 AI 搜索,并开启内测申请。据官方介绍,传统搜索引擎基于关键词匹配,即根据用户输入的关键词识别检索范围,并匹配可能符合用户意图的海量信息。而基于大模型能力的 AI 搜索是一种生成式搜索,用户可通过自然语言清晰表达自己的意图,并获得有效组织和提炼后的答案。

https://www.ithome.com/0/714/236.htm

Hugging Face获 2亿美元D轮融资,Salesforce领投

8月23日消息,开源模型库公司 Hugging Face 获2亿美元D轮融资,本轮融资由Salesforce旗下投资机构 Salesforce Ventures 领投,Salesforce CEO Marc Benioff 在其 X 上证实了这一消息。本轮融资完成后,Hugging Face 估值将达40亿美元,相比去年5月由 Lux Capital 领投,红杉资本、Coatue Management 跟投1亿美元的C轮融资,其估值增长了一倍。

https://www.36kr.com/p/2400225043013763

IBM在中国启动新一代AI与数据平台watsonx

8月23日,IBM在北京召开新闻发布会,宣布启动新一代AI与数据平台IBM watsonx在本地市场落地,为企业级基础模型和生成式AI提供动力。这是继红帽OpenShift开放式混合云技术平台之后,IBM落地大中华区市场的又一个具有里程碑意义的开放式AI技术平台。与IBM混合云平台一样,watsonx也是基于领先的企业级开放技术,也是以平台的方法,通过构建和扩展广泛而强大的生态,把IBM从存力、算力、企业级AI应用到咨询服务的全栈能力,以及源自IBM研究院的前沿AI创新技术(如基础模型与生成式AI),交到企业手中。

https://china.newsroom.ibm.com/2023-08-23-IBM-watsonx,-AI

Meta 发布AI 模型 SeamlessM4T,可转录和翻译近百种语言

8月22日消息,Meta 发布了一种能够翻译和转录数十种语言的人工智能模型 ——SeamlessM4T,可以让说不同语言的人更有效地进行交流,为开发人类通用语言翻译器提供了助力。Meta 声称,SeamlessM4T 将与新的翻译数据集 SeamlessAlign 一同开源,它代表了人工智能驱动的“语音到语音”和“语音到文本”领域的“重大突破”。该模型可以在近 100 种语言之间进行文本到语音的翻译,并支持 35 种语言的完全语音到语音翻译,是迄今为止最大的开放多模式翻译数据集,挖掘的语音和文本对齐总计达 270000 小时。

https://techcrunch.com/2023/08/22/meta-releases-an-ai-model-that-can-transcribe-and-translate-close-to-100-languages/

Meta 推出 AI 编程工具 Code Llama

8月24日消息,Meta 现推出了名为 Code Llama 的 AI 编码工具,号称“最先进的大型编码语言模型”。该模型基于 Llama 2 大型语言模型打造,可以理解为“Llama 2 的写代码专用版”,可用于“生成新的代码并调试人类编写的工作”,目前已上线 Github。Meta 指出,Code Llama 能够根据代码自然语言提示 / 要求生成用户想要的代码和有关代码的自然语言,或者在指向特定代码时进行完善和调试。除了基础版的 Code Llama 外,Meta 还推出了专为 Python 设计的版本 ——Code Llama-Python,以及一个能够理解自然语言指令的版本 ——Code Llama-Instrct。

https://techcrunch.com/2023/08/24/meta-releases-code-llama-a-code-generating-ai-model/

谷歌计划推出针对Google Workspace的AI驱动安全增强功能

8月24日消息,谷歌宣布将大幅增强Google Workspace产品的安全能力,特别是利用人工智能防止企业云数据的泄露。谷歌表示,将在云硬盘Drive中利用AI技术实现对敏感企业数据的自动分类及标记,并可设置基于风险级别的不同数据访问控制,从而有效防止企业敏感数据的泄露。同时,Gmail也将新增数据丢失防护功能,帮助企业管理员更好地阻止用户无意间通过邮件发送敏感数据。

https://techcrunch.com/2023/08/23/google-plans-to-bring-ai-fueled-security-enhancements-to-google-workspace/

OpenAI 与 Scale AI 合作,支持企业使用专有数据训练模型

8月24日消息,OpenAI 近日宣布,和数据标注服务初创公司 Scale AI 展开深度合作,将Scale AI的微调工具和OpenAI的GPT-3.5文本生成模型结合在一起,允许企业使用其专有数据来训练模型并大规模运行,使开发人员能够针对特定任务定制微调 AI 模型。

https://www.ithome.com/0/714/936.htm

Open AI寻求中东千亿美元融资

8月24日消息,据创投圈知情人士透露,OpenAI首席执行官山姆·奥特曼下半年奔赴阿联酋首都阿布扎比等地寻求融资,不低于千亿美元。据悉,山姆奥特曼描述OpenAI的目标可能是要实现比人类更高级的智能。但要实现Super intelligence(超级智能)这一目标,还非常遥远,OpenAI需要的资金规模不可想象。

https://new.qq.com/rain/a/20230824A01F8100

联发科将推出新一代旗舰移动芯片,支持由 Llama 2 模型开发的 AI 应用

8月24日,MediaTek 宣布利用 Meta 新一代开源大语言模型(LLM)Llama 2 以及 MediaTek 先进的 AI 处理器(APU)和完整的 AI 开发平台(NeuroPilot),建立完整的终端侧 AI 计算生态。MediaTek 将于年末推出新一代旗舰移动芯片,采用针对 Llama 2 模型而优化的软件栈(NeuroPilot),与搭配支持 Transformer 模型做骨干网络加速的升级版 AI 处理器(APU),可减少动态随机存取内存(DRAM)的读写消耗和带宽占用,进一步强化大语言模型和生成式 AI 应用的性能。预计年末采用 MediaTek 新一代天玑旗舰移动芯片的智能手机支持由 Llama 2 模型开发的 AI 应用,可为用户带来生成式 AI 应用体验。

https://corp.mediatek.cn/news-events/press-releases/mediatek-leverages-metas-llama-2-to-enhance-on-device-generative-ai-in-edge-devices

韩国互联网巨头Naver推出生成式AI服务平台

8月24日 消息,韩国最大搜索引擎 Naver推出自己的生成式人工智能服务HyperCLOVA X,该产品包含聊天机器人应用程序 CLOVA X,旨在改进网络搜索、在线购物和导航服务,核心是将为用户提供生成式人工智能驱动的搜索功能,并为企业客户提供新的定制服务。Naver将从8月24日开始CLOVA X的公开测试,9月启动Cue的测试。Naver及其国内竞争对手正着眼于美国和中国科技巨头尚未涉足的细分市场。例如, Naver希望为政治敏感的中东国家以及非英语国家和地区如日本和东南亚开发本地化的AI应用。

https://techcrunch.com/2023/08/24/koreas-internet-giant-naver-unveils-generative-ai-services/

好未来正式推出数学领域千亿级大模型MathGPT

8月24日,在好未来20周年直播活动中,CTO田密宣布好未来自研的数学领域千亿级大模型MathGPT正式推出并开启内测。MathGPT是由好未来在今年5月公布的其公司自研数学大模型,面向全球数学爱好者和科研机构,以解题和讲题算法为核心的数学垂直领域的大模型,也是国内首个专为数学打造的大模型。MathGPT在多项基准测试中表现超越GPT-4,刷新了SOTA记录。

https://www.chinaz.com/2023/0824/1553665.shtml

三星计划公布类ChatGPT AI

8月24日消息,近日,根据外媒报道,三星计划在9月12日举办的Real Summit 2023活动中,展示自家的类ChatGPT生成式AI。据悉,该AI现阶段将主要为三星内部员工提供服务,带来诸如化编程代码、撰写电子邮件、记录文档摘要等功能。这将有效提升三星员工的工作效率。

http://www.techweb.com.cn/it/2023-08-24/2932535.shtml

小红书旗下公司新增AI软件业务

8月24日消息,天眼查App显示,近日,小红书科技(珠海横琴)有限公司发生工商变更,经营范围新增数字技术服务、人工智能应用软件开发、人工智能基础软件开发、软件销售、珠宝首饰批发、汽车零配件批发等。该公司成立于今年6月,注册资本5100万人民币,法定代表人为王晓博,由小红书科技有限公司全资持股。

https://www.donews.com/news/detail/8/3660907.html

阿里巴巴国际站发布外贸AI产品

8月24日,外贸行业首个AI应用落地,阿里国际站发布全链路AI产品。据悉,该产品与数字外贸全链路紧密结合,包含生意助手和OKKI AI两大服务,拥有智能商品发布与管理、市场分析、客户接待、视频聊天实时翻译、企业管理等多项功能,覆盖外贸生意所有环节。这是AI在外贸产业中的首次全面应用,将让AI真正成为每个出海企业的帮手。

https://www.sohu.com/a/714430368_114984

阿里云开源多模态视觉模型 Qwen-VL,新增视觉定位等能力

8月25日消息,阿里云推出了大规模视觉语言模型 Qwen-VL,目前已经在 ModeScope 开源。阿里云此前已经开源通义千问 70 亿参数通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat。据悉,Qwen-VL 是一款支持中英文等多种语言的视觉语言(Vision Language,VL)模型,相较于此前的 VL 模型,其除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力。

https://www.alizila.com/alibaba-cloud-launches-open-source-models-that-understand-image-content/

奇安信发布Q-GPT安全机器人和大模型卫士

8月25日消息,奇安信集团发布Q-GPT(奇安信大模型)安全机器人和大模型卫士。据介绍,Q-GPT安全机器人是基于奇安信大模型的“虚拟安全专家”,可以全天候工作,一台机器人等于60多位安全专家,可产生约2000万元的运营效益,极大提升了生产力。大模型卫士集安全风险发现、大模型访问控制、数据泄露管控、违法违规行为溯源、大模型应用分析等为一体,帮助企业更安全的向大模型要生产力。

http://www.techweb.com.cn/internet/2023-08-25/2932616.shtml

澜舟科技正式发布百亿参数大模型“孟子GPT-40B”

8月28日消息,澜舟科技旗下国产百亿大模型孟子GPT-40B昨日正式发布,参数数量达到400亿,各项任务平均提升10-15%。孟子GPT-40B在中文及多语言能力、写作、多轮对话等方面都有提升,接近ChatGPT-3.5的水平。澜舟科技还同步发布了基于孟子 GPT 的金融大模型和会议内容分析平台 “澜舟智会”,未来将提供基础模型、大模型训练框架 / 工具包等服务。

https://www.chinaz.com/2023/0828/1554296.shtml


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1