欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。
Part1动态
[国内要闻]
美团收购王慧文AI创业公司光年之外
美团于香港联交所发布公告,称已完成光年之外境内外主体100%股权的收购,收购价约为20.65亿人民币。美团在公告中对于并购的解释是,通过收购事项获得领先的AGI技术及人才,有机会加强其于快速增长的人工智能行业中的竞争力。此前,光年之外联合创始人王慧文因身体原因,离岗就医及休养。
小i机器人发布华藏大模型
小i机器人发布了大模型"华藏",可应用于金融、医疗、建筑、零售等多元领域的应用场景。华藏大模型具有"可控、可定制、可交付"的特点,客户使用的最低算力成本是10万元人民币。
2025年中国AI服务器市场规模或达561亿美元
机构预测,未来3年内全球AI服务器市场规模将保持高速增长。到2023-2025年,中国的AI服务器市场规模预计将达到134亿、307亿和561亿美元,同比分别增长101%、128%和83%。
荣耀CEO赵明:正探索把AI大模型引入端侧
荣耀CEO赵明在演讲中表示,消费电子行业是长周期行业,影响最大的因子从来不是经济周期,而是创新周期。他还提到,“端”侧的个人大模型将是未来的探索方向,荣耀将率先尝试把AI大模型引入端侧。
360智脑API平台正式开放
360智脑API平台正式开放,360智脑行业解决方案将率先在安全、传媒、文旅、政务、能源等近20个行业落地,为企业级用户构建包括“办公写作大脑、
百世集团首次启用AI商用功能
百世集团旗下的百世软件旗下的千易ERP接入了自然语言处理工具ChatGPT,以帮助跨境卖家智能生成多种语言的商品标题和描述。这也是百世集团首次将AI功能用于商业用途。
京东将推出言犀AI大模型
京东云事业部总裁曹鹏介绍了即将推出的言犀大规模预训练语言模型,这是一种参数达到千亿级的新一代模型。京东的大模型将面向多模态应用,并深入应用于零售、物流、工业等产业场景。
百度文心大模型3.5新增插件机制
百度首席技术官王海峰表示,文心大模型3.5的最大变化是新增了插件机制。其中,默认的内置插件是“百度搜索”,这使得文心一言具备了生成实时准确信息的能力。此外,还有长文本摘要和问答插件“ChatFile”,支持超长文本输入等功能。在下一个阶段,文心一言将发布更多优质的百度官方和第三方插件,让用户能够更好地应用文心大模型。
视觉中国推AIGC-PAS服务对AIGC内容溯源认证
视觉中国集团宣布,在视觉中国平台上针对AIGC的内容提供溯源和认证服务。此次推出的服务名为AIGC-PAS(全称AIGCProvenanceandAuthenticationService)。AIGC-PAS服务为每一张AI生成或修改的图片生成了一个唯一的身份标识(tsa-token),用户可以通过视觉中国AI平台或访问可信时间戳验证平台查看图片的溯源和认证信息。
李彦宏:百度文心大模型3.5版推理速度提升17倍
李彦宏透露,百度文心大模型已经迭代到3.5版本。与3.0版本相比,训练速度提升了2倍,推理速度提升了17倍,模型效果累计提升超过50%。
AI公司「及时语」获数千万元Pre-A+轮融资
北京及时语智能科技有限公司宣布已完成数千万元Pre-A+轮融资。本轮融资由源渡资本独家完成投资,资金主要用于跨境出海AI客服相关场景的研发。
[国际要闻]
OpenAI涉嫌窃取数据被集体诉讼
加利福尼亚一家律师事务所对OpenAI提起了一项集体诉讼,指控其「窃取」个人数据用于训练ChatGPT。
研究发现,AI生成的推文可能比人工编写的更有说服力
一项将人类创作的内容与OpenAI公司的GPT-3模型生成的内容进行对比的研究中,当推特上发布的内容由AI语言模型编写时,适合更容易获得人们的信任。
Bing聊天测试新功能将可预测未来股票价格趋势
微软正在测试其AI搜索聊天机器人Bing聊天的一项新功能,该功能可以使用期权价格推断未来股票价格的概率。该功能目前仍在开发中,但如果成功,可能会彻底改变投资者的决策方式。
GitHubCopilot采用率飙升用户达一百万
微软旗下代码存储库GitHub透露,在推出一年后,其代码生成工具Copilot已经被一百万开发者使用。Copilot已被超过2万家组织采用,生成了超过30亿行代码。
ChatGPTiOS版应用更新:加入Bing搜索引擎
ChatGPTiOS应用程序再次进行更新,这次加入了微软的Bing搜索引擎,但仅限于付费订阅用户。ChatGPTPlus的付费订阅用户现在可以启用新的「浏览」功能,该功能使用GPT-4与Bing搜索相结合。
OpenAI计划将ChatGPT变成「超级智能个人工作助理」
OpenAI对聊天机器人有了更大的计划:首席执行官SamAltman私下告诉一些开发人员OpenAI希望将其变成「超级智能个人工作助理」。凭借有关个人及其工作场所的内置知识,这样的助理可以执行诸如以该人的风格起草电子邮件或文档以及有关其业务的最新信息等任务。
人工智能生成新闻网站数量激增
新闻网站评级工具NewsGuard的分析发现,不可靠的人工智能生成的新闻信息和新闻网站(UnreliableArtificialIntelligence-GeneratedNews,UAIN)大幅增加,这些网站通过主要品牌的自动编程广告进行资助。
DeepMind表示其下一个大语言模型将超越ChatGPT
谷歌DeepMind首席执行官DemisHassabis表示,其下一个大型语言模型将与OpenAI的语言模型相媲美,甚至是更好。
ChatGPT访问量增速大降6月环比增长率可能为负数
根据网站数据分析工具SimilarWeb数据,前期ChatGPT的访问量增长率惊人,1月份的环比增长率为131.6%,2月份为62.5%,3月份为55.8%,在4月份明显放缓,环比增长率为12.6%,到了5月,这个数字已经变为了2.8%。ChatGPT6月的环比增长率有可能为负数。
特斯拉专为AI机器学习构建Dojo超级计算机
特斯拉表示,备受期待的Dojo超级计算机将于下个月开始投产,这将使其自动驾驶技术达到一个新的水平。Dojo是特斯拉自主开发的定制超级计算机平台,专为AI机器学习和视频训练而构建,利用来自其车队的视频数据进行训练。
近半公司表示AI是未来一年技术投资第一大预算项目
近半数(47%)在CNBC进行调查的公司表示,AI是他们未来一年技术投资的首要任务,而AI的预算是第二大技术投资领域云计算的两倍多(21%)。
Part2热门产品
羊驼家族大模型集体进化!32k上下文追平GPT-4
开源羊驼大模型LLaMA上下文追平GPT-4,只需要一个简单改动!MetaAI这篇刚刚提交的论文表示,LLaMA上下文窗口从2k扩展到32k后只需要小于1000步的微调。与预训练相比,成本忽略不计。
Glaze1.0发布,防止艺术家作品风格被AI抄袭
芝加哥大学的一组研究人员开发了名为Glaze的开源工具。这个工具通过改变原始图像中的像素,防止图片被AI工具用作训练数据。经过几个月的公测,Glaze1.0今天正式发布。简单的说,Glaze分析艺术作品,并生成修改后的版本(几乎看不到变化)这种“隐形图像会扰乱AI模仿过程。
AvatarBooth可用文本生成3D人类化身
南京大学的研究人员提出了一种全新的方法AvatarBooth。该方法可以生成高质量和可定制的化身,能够准确反映特定个体的视觉和文字特征。与之前只能基于简单文本描述生成化身的方法不同,该方法可以根据任意捕获的面部或身体图像生成个性化头像,并支持基于文本的模型生成和编辑。
ChatGLM2-6B中文能力超GPT-4推理提速42%
GLM技术团队宣布再次升级ChatGLM-6B,发布ChatGLM2-6B。ChatGLM-6B于3月14日发布,截至6月24日在Huggingface上的下载量已经超过300w。截至6月25日,ChatGLM2模型在主要评估LLM模型中文能力的C-Eval榜单中以71.1的分数位居Rank0;ChatGLM2-6B模型则以51.7的分数位居Rank6,是榜单上排名最高的开源模型。
视频生成模型Zeroscope开源免费无水印
一款名为Zeroscope_v2_576w的视频生成模型现已开源。Zeroscope_v2_576w基于Modelscope打造,是一个具有17亿个参数的多级文本到视频扩散模型。它根据文本描述生成视频内容。并且提供更高的分辨率,没有Shutterstock水印,并且宽高比更接近16:9。
微软推出微型AI自动编码模型phi-1,击败GPT-3.5
微软的人工智能研究人员发布了一种新的、轻量级的代码生成模型phi-1,并且其性能优于ChatGPT背后的大型语言模型GPT-3.5。这个基于Transformer的模型仅拥有13亿个参数。在性能方面,phi-1在HumanEval基准测试中获得了50.6%的pass@1准确率。尽管模型小得多,但微软模型击败了HuggingFace和ServiceNow的StarCoder(33.6%)、OpenAI的GPT-3.5(47%)和谷歌的PaLM2-S(37.6%)。
ChatPDF帮你智能阅读PDF文档
ChatPDF是一款创新工具,能实现与PDF文件的交互就像进行对话一样简单。通过利用GPT3.5,ChatPDF有效地成为任何PDF文档的聊天机器人,能够回答用户的问题,甚至根据需要重新编写部分内容。
MidjourneyV5.2新增“Zoomout”画面扩展功能
Midjourney推出了最新Midjourney5.2版本,并引入了社区长期以来一直要求的画面扩展功能。"Zoomout"是Midjourney给这一功能起的名字,在其他AI图像生成器中通常称为"outpainting(画面扩展)":AI可以放大已经生成的图像。例如,在肖像图中,可以补全画面,让你看到更多周围环境的细节。
谷歌研发一个能说能听的大型语言模型AudioPaLM
AudioPaLM结合了两个现有模型的优势,即PaLM-2模型和AudioLM模型,以产生一个统一的多模态架构,能够处理和生成文本和语音。这使得AudioPaLM可以处理各种应用,从语音识别到语音转文字。
Part3观点
朱啸虎:不要迷信通用大模型
朱啸虎称,其核心观点为不要迷信通用大模型,“明年3.5就成commodity,3年后4也将是commodity!对于大部分创业者,场景优先,数据为王!”
中国移动董事长:AIGC可能又会引发新一轮的科技革
中国移动董事长兼执行董事杨杰表示,大家已经非常熟悉,近期广泛兴起的AIGC,可能又会引发新一轮的科技革命,我想这只是刚刚开始。
菜鸟集团CEO谈生成式AI:大幅度降低专业软件难度
菜鸟集团的CEO万霖提到生成式AI时指出,生成式AI能够改变交互方式。在物流行业中存在许多专业软件,包括货运车辆、路径规划、优化算法等方面的软件,通过生成式AI,我们可以大幅度降低使用这些专业软件的难度。
阿里云张勇:人工智能技术必须“可用、可靠、可信”
阿里云智能集团董事长兼首席执行官张勇表示,人工智能技术应“可用、可靠、可信”,阿里云目标是让算力更普惠,让AI更普及。
周鸿祎:大模型实现“安全可控”的关键在于要坚持“辅助模式”
面对大模型发展的安全顾虑,周鸿祎认为,大模型实现“安全可控”的关键在于要坚持“辅助模式”,将大模型定位为企业和员工的助手,作为“副驾驶”角色提供帮助,让人的意志在整个决策回路中起到关键作用。“人工智能的发展要‘以人为本’,大模型不能引发大规模裁员,而是要帮助企业员工提升能力和效率。”
Part4深度
AI正在杀死旧Web?
一项新分析显示,由于科技巨头、银行等全球主要品牌的广告预算,他们正在向AI生成的低质量网站提供广告收入,让这些充斥着AI生成的低质量内容网站得到了大量的经济支持,且继续存活下去。TheVerge记者总结道,「现如今,AI正在杀死旧Web,新Web艰难诞生」。而在他看来,这也未必是一件坏事。
零食品牌如何用AIGC做产品?
对未知,有人畏惧,也有人当作机遇。食验室就是后者。在大部分公司对AIGC持观望态度的当下,食验室已经将对AI的探索运用到了实践之中——把AI制作的包装设计投入真实市场之中测试客户反馈、与AI合作进行新品开发、探索AI定制模型输出业务。2022年,食验室销售额增长150%,突破亿元。
你的下一任老板可能是AI
企业对AI面试的需求爆发,HRSaaS服务商和招聘平台们顺势切入,开启了智能化转型。目前,AI已渗透在招聘岗位撰写、面试、人才评估等流程,AI面试作为最核心的一环,成为用户频繁接触的场景。报告显示,近65%的招聘人员在招聘过程中使用了AI,89%的HR认为人工智能将改善候选人的申请流程。
AI改造高考服务
继百度发布知识增强大模型文心一言以来,国内科技巨头跑步入场,高考相继成为自家大模型产品的试炼场。需要指出,相比大模型答题,上线AI助考解决方案,更好地服务用户才是真正考验技术能力的时刻。
99元的AI课,有多少含金量,真能让人月入过万?
无论是最基础的,用AI批量生成内容变现,还是更进阶的,玩概念、做品牌,其商业思路并没有多少神秘之处。AI变现这条路,除了基本的技术熟练度之外,头脑灵活、动作迅速的重要性胜过其他因素。AI已不再是科幻电影中的假设,而是我们触手可及的技术。站在这样一个时间节点,在新旧交替的裂隙中,神话AI,只会让它离你越来越远,不如拥抱它、了解它、改进它,让它真正为人所用。
当高考志愿遇到大模型,文心一言、通义千问和ChatGPT谁最靠谱?
本文测试了向几个主流的AI发起问询,看看AI能否帮助我们挑选一些合适的志愿。通过连续问答的方式,多数高考生估计都可以从AI处获得一些建议和解答,帮助考生更好了解对应的专业细则。
DeepMind自曝:下一代大模型将与AlphaGo合体
谷歌DeepMindCEOHassabis全新爆料:全新Gemini模型将结合进AlphaGo和大语言模型,成本预计是数千万美元,甚至数亿。传说中合并了AlphaGo和类GPT-4大模型的Gemini,终于要来了吗?
格莱美奖与人工智能生成音乐划清界限
讨厌AI创作的音乐人可以暂时松一口气了。最近,格莱美主办方美国国家录音与科学学院更新了一系列评选规则,在涉及AI音乐的条款中给出了答案:参选作品可以使用AI元素,但完全由AI生成的作品则没有资格获得任何奖项。也就是说,至少从格莱美的新规定来看,AI还无法代替人类。