整理:Ricky 编辑:王与桐
聚焦ChatGPT
OpenAI网站访问量飙升至10亿次
6月5日消息,最新数据显示,3 月份共有 8.47 亿用户访问了人工智能研究公司 OpenAI 的网站,比 2 月份增长了 54%。根据网易科技援引营销机构 VezaDigital 的研究,3 月份总共有 8.47 亿用户访问了 OpenAI 的网站,环比激增了 54% 以上。如果仅从在线访问量来看,OpenAI 已经跻身全球 20 家流量最高网站榜单。
https://k.sina.com.cn/article_1654203637_629924f5020010ovx.html
谷歌发布Google Cloud Skills Boost,提供生成式AI学习路径
6月5日消息,谷歌发布Google Cloud Skills Boost,从大语言模型的基础知识讲起,到如何在Google Cloud上创建和部署生成式AI解决方案,谷歌为全球用户提供了生成式AI学习路径,包括大语言模型、图像生成、编码器-解码器架构、注意力机制和Transformer模型等相关课程。
苹果公布iOS 17无障碍新功能:辅助访问、个性化语音和实时语音
6月6日消息,苹果首秀iOS 17系统,其中开发者Beta当天就已抵达,公测版Beta则是7月上线,而正式版随iPhone 15定档秋季。iOS17 键盘自动纠正迎来全面升级,新增 transformer 语言模型。这是一个用于文字预测的先进设备端机器学习语言模型,能够随着用户每次打字不断改进体验与准确度。http://news.sohu.com/a/683330545_163726
澳第一大行澳大利亚联邦银行禁止员工使用ChatGPT,采用自有AI系统
6月7日消息,据财联社报道,澳大利亚第一大银行——澳大利亚联邦银行已禁止员工使用热门AI聊天机器人ChatGPT,并在内部采用自有AI系统。澳大利亚联邦银行首席数据和分析官Andrew McMullan表示,过去三个月来该行修订了集团AI政策,明确规定员工不能在该行设备上使用ChatGPT,也不能将该行未公开的信息输入外部聊天机器人。
https://www.pingwest.com/w/283497
新加坡国立大学发布AI模型GOAT 算数能力强于GPT-4
6月7日消息,新加坡国立大学研究者推出了Goat模型,称该AI模型“专门用于算术问题”。研究人员表示“在对LLaMA模型进行微调后,Goat在算数上实现了比GPT-4更高的准确度与更出色的性能”。据介绍,研究人员在具备24GB显存的GPU上进行训练,并将最终得到的模型使用BIG-bench算数子任务进行测试,准确率结果较为出众,领先于业内的Bloom、GPT-NeoX、OPT等模型。其中零样本的Goat-7B的准确率甚至一度超过了少样本学习后的PaLM-540模型,在大数计算方面远超GPT-4。
https://new.qq.com/rain/a/20230607A0AF2S00.html
谷歌DeepMind发布新的AI系统 以发现更快算法
6月7日消息,Alphabet (GOOG)旗下的AI研究实验室Google DeepMind的研究人员周三发布了一个新的AI系统,可以提高计算的效率和可持续性。DeepMind表示,发表在科学杂志《自然》(Nature)上的这项最新突破专注于发现更快的计算机算法。计算机算法是软件开发的基础,每天被企业使用数万亿次。
http://www.eeo.com.cn/2023/0608/594366.shtml
英伟达等用GPT-4提高机器人游戏技能
6月8日消息,英伟达、加州理工学院、得克萨斯大学奥斯汀分校、斯坦福大学和亚利桑那州立大学的研究人员联合开发了一种程序化的机器人“Voyage”,它是第一个使用大型语言模型驱动的嵌入式智能体,被用于游戏《我的世界》中。Voyage使用GPT-4技术解决游戏中的问题,不断探索并学习新的技能,走出人工干预,从不断做出新的发现。相较于先前的业界最高成果,它能够利用自身的技能库获得3.3倍的独特道具数量,行驶距离达到了2.3倍构建工具的速度较快,构建工具的速度达15.3倍。
https://www.donews.com/news/detail/8/3541644.html
微软将向美国政府客户提供GPT模型
6月8日消息,近日,微软宣布,将利用其Azure云服务,向美国政府机构提供OpenAI强大的语言生成模型。OpenAI是聊天机器人ChatGPT的开发公司,旗下拥有大语言模型GPT-3以及多模态模型GPT-4等产品。微软是OpenAI最大的投资者,于2019年向其投资了10亿美元,今年1月又追加了第二笔多年投资,投资据称高达100亿美元。微软周三表示,Azure政府客户可以通过微软Azure OpenAI服务使用OpenAI的两个大型语言模型,分别为最新、最强大的模型GPT-4,以及早期模型GPT-3。这是微软首次将GPT技术引入Azure政府服务,也是大型公司首次向政府提供聊天机器人技术。美国国防部、能源部和NASA都是Azure政府服务的客户。据微软介绍,联邦、州和地方政府的客户可以通过GPT-4和GPT-3来完成诸如生成研究问题的答案、生成计算机代码和总结现场报告等服务,可根据具体任务调整语言模型。
https://www.cls.cn/detail/1372703
思科将类ChatGPT集成在Webex产品矩阵中
6月8日消息,全球网络设备领导者思科(Cisco)宣布将生成式AI集成在Webex产品矩阵中,帮助客户提升工作效率和体验,预计将于今年下半年正式上线。Webex成立于1996年,2007年5月被思科以32亿美元全资收购成为其子公司。Webex是全球网络视频会议的鼻祖,主要提供视频会议、云客服、远程办公、即时通讯等企业服务。Webex的Catch Me Up、Vidcast和Contact Center在生成式AI助力下,将提供类ChatGPT功能,用户通过文本便能快速生成各种内容。
https://finance.sina.com.cn/stock/relnews/us/2023-06-09/doc-imywspuf4792252.shtml
Tafi发布文本生成3D角色的AI应用 媲美专业3D软件
6月8日消息,3D软件厂商Tafi发布了通过文本可直接生成3D角色模型的AI平台。目前,该平台处于申请测试阶段。据悉,Tafi生成的3D模型非常逼真,可与玛雅(Autodesk Maya)、C4D(Maxon Cinema 4D)等专业3D软件制作的作品媲美。该产品的最大技术亮点是,生成的模型可原生直接导入到Unreal、Unity、Blender、3Dmax、玛雅和C4D专业开发平台中,进行二次编辑。
https://www.cyzone.cn/article/728730.html
3个月超3000次实验 虎博发布开源国产大模型
6 月 8 日消息,国产多模态大语言模型 TigerBot 近日正式发布,包含 70 亿参数和 1800 亿参数两个版本,目前已经在 GitHub 开源。研究人员陈烨在虎博科技官网表示:“该模型在只使用少量参数的情况下,就能快速理解人类提出了哪类问题。根据 OpenAI InstructGPT 论文在公开 NLP 数据集上的自动评测,TigerBot-7B 已达到 OpenAI 同样大小模型的综合表现的 96%。”
https://new.qq.com/rain/a/20230608A03CHN00.html
AI重写排序算法,速度快70%:DeepMind AlphaDev革新计算基础
6月8日消息,DeepMind 在著名学术刊物 Nature 上,发表了其最新研究成果:一个名为 AlphaDev 的 AI 系统。AlphaDev 是一种通过强化学习来发现增强的计算机科学算法的 AI 系统,它发现了一种更快的排序算法,直接超越了科学家和工程师们几十年来的研究,将排序算法的速度提高了 70%。DeepMind 计算机科学家 Daniel Mankowitz 更是表示:“我们估计,AlphaDev 发现的排序算法和哈希算法每天都会被调用数万亿次。”
OpenAI面临一项诽谤诉讼,因ChatGPT生成了一个虚假的法律诉讼
6月8日消息,OpenAI面临来自乔治亚州一名电台主持人的诽谤诉讼,该主持人声称,该公司大火的人工智能程序ChatGPT产生了虚假的法律诉讼,指控他挪用资金。这是首例此类案件,当前生成式人工智能程序因其传播错误信息和“幻觉”虚假输出(包括虚假的法律先例)的能力而面临更严格的审查。
https://www.360kuai.com/pc/9a7d96abf4a8eda3d?cota=3&kuai_so=1&refer_scene=so_3&sign=360_da20e874
家乐福引进ChatGPT技术,AI搅动零售江湖
6月9日,法国著名连锁超市家乐福在官网宣布,通过OpenAI的ChatGPT、GPT-4打造了一款智能购物助手Hopla,Hopla是一个聊天机器人,目前已经集成到了购物网站carrefour.fr中,目前已经提供使用。据悉,用户可以在短时间获得Hopla响应,比如在1分钟甚至几秒钟获得购物方案。此外,Hopla还支持连续、深度问答,使用方法基本和ChatGPT一样。此次引入ChatGPT家乐福不只创新出购物助手,更重要的是公司还将生成式人工智能还用于丰富家乐福品牌的产品表、内部采购流程中等环节,包括起草招标邀请函和分析报价、产品搜索等,帮助工作人员提升工作效率和节省时间。
https://www.sohu.com/a/683640320_522913
ChatGPT创始人Altman:中国拥有世界上一些最优秀的AI系统
6月9日消息,在2023北京智源大会上,OpenAI首席执行官Sam Altman发表线上演讲,他围绕模型的可解释性、可扩展性和可泛化性给出了见解。他表示:“中国拥有世界上一些最优秀的AI系统,从根本上讲,我认为这使研究人员在解决许多不同的AI系统的问题上面临困难。中国是世界上最好的地方,我真诚希望中国和美国的研究人员能对此做出巨大贡献。“
https://www.360kuai.com/pc/991620cd5842c328b?cota=3&kuai_so=1&refer_scene=so_3&sign=360_da20e874
iOS 版 ChatGPT 获得改进的 iPad 支持和快捷方式集成
6月9日消息,OpenAI 为 ChatGPT app 带来了更新,新增 iPad 版支持。最新版 ChatGPT 应用还包括拖放、Siri 支持和捷径快捷方式集成。自上个月推出移动版本以来,OpenAI 一直在逐步改进其在 iOS 和 iPadOS 上的 ChatGPT 应用程序,在最近的更新中改进了聊天记录和语音输入。该公司还计划在不久的将来发布 Android 版本。
https://www.360kuai.com/pc/9e1e26126dbc906fe?cota=3&kuai_so=1&refer_scene=so_3&sign=360_da20e874
欲对标ChatGPT,千亿AI巨头升级大模型
6月9日消息,距推出大模型时隔仅一个月,科大讯飞又发布首个升级版讯飞星火认知大模型V1.5,称在开放式知识问答、逻辑推理和数学能力、多轮对话能力等方面迎来重要升级。同时,科大讯飞董事长刘庆峰公布大模型年内三次升级时间点,称10月底将整体对标ChatGPT。“我们所有的技术平台都是完全自主研发的,我们对每一个阶段的技术都是可控的,我们非常有信心。”在发布会现场,刘庆峰称讯飞不仅要致敬和追赶OpenAI,更要在源头上做自主创新。
https://finance.sina.com.cn/jjxw/2023-06-09/doc-imywterw8273693.shtml
三星被曝正自研ChatGPT 已经投入所有GPU算力
6月10日消息。据韩国媒体报道,三星电子已经开始全面开发人工智能聊天机器人背后的关键技术——大语言模型(LLM),以供内部使用。多名三星电子官员透露,这家韩国最大的电子工业企业于本月初开始开发自己的大语言模型,由三星研究院主导,已经着手调动所有相关人力和资源,目标是在7月底前完成初始版本的开发。上述官员说道,为了在两个月内完成开发,三星几乎所有的GPU算力资源都已经投入了大模型训练,公司内部其他软件开发部门都被限制使用GPU。他们补充称,主要关联公司也成立了人工智能开发的任务小组。
https://www.360kuai.com/pc/92708de190ca16fae?cota=3&kuai_so=1&refer_scene=so_3&sign=360_da20e874
北京智源发布悟道3.0大模型,进入全面开源的新阶段
6月12日,据北京智源人工智能研究院官微介绍,北京智源人工智能研究院发布悟道3.0大模型系列,包含“悟道·天鹰”语言大模型系列、天秤开源大模型评测体系与开放平台,“悟道·视界”视觉大模型系列,以及一系列多模态模型成果。“悟道3.0”版本涵盖语言、视觉、多模态等基础大模型,现在已全面开源。“悟道·天鹰”的开源属于一系列套餐,包括Aquila·基础模型、AquilaChat对话模型与AquilaCode生成模型。
https://www.nbd.com.cn/articles/2023-06-12/2867677.html
Instagram 正在测试一项类似于 Snapchat 的 My AI 的人工智能聊天机器人:具有 30 种不同个性
有开发人员发现,Instagram 正在开发一种类似于 Snapchat 流行的 My AI 机器人聊天系统。Instagram 用户将能够从 30 种不同的个性中为他们的 AI 对话伙伴进行选择,这些对话伙伴将回答问题并提供建议。
https://www.donews.com/news/detail/8/3539310.html
谷歌StyleDrop引爆AI艺术圈
近日,谷歌最新推出的StyleDrop可称作Midjourney的劲敌,它通过一张参考图片,就能解构并复刻任何复杂的艺术风格,包括抽象作品,不同风格的LOGO等,与"前SOTA模型"相比,StyleDrop在风格一致性和文本对齐方面表现出色。它提供了更可控的绘画过程,并能完成以往难以想象的精细工作。
https://www.thepaper.cn/newsDetail_forward_23403654
阿里达摩院开源Video-LLaMA,帮大语言模型加上“眼睛”、“耳朵”
阿里达摩院的研究人员提出了 Video-LLaMA,一个具有综合视听能力大模型。Video-LLaMA 能够感知和理解视频中的视频和音频信号, 并能理解用户输入的指令,完成一系列基于音视频的复杂任务,例如音 / 视频描述,写作,问答等。目前论文,代码,交互 demo 都已开放。另外,在 Video-LLaMA 的项目主页中,该研究团队还提供了中文版本的模型,让中文用户的体验更丝滑。