当前位置:首页|资讯|ChatGPT|AI音频|OpenAI

ChatGPT日耗电超50万度;Pika推出AI配音工具Sound Effects | AI日报

作者:新榜发布时间:2024-03-12

原标题:ChatGPT日耗电超50万度;Pika推出AI配音工具Sound Effects | AI日报

国内资讯

1. 李彦宏:文心大模型4.0在中文上超过了GPT-4

近日,百度创始人、董事长兼CEO李彦宏表示,在中文上,文心大模型4.0已经超过了GPT-4。李彦宏称“比如说写首诗,写个藏头诗之类的,很多大模型都能写,但如果我要求写一首《沁园春》词牌的词,那ChatGPT 4.0就完全搞懵了”。在英文生成方面,李彦宏承认两者还有一些差距。他同时还表示,对于“ChatGPT和文心一言有着天壤之别”等负面言论并不感到生气,希望接下来一年能够改变这些人的想法。

2. 爱诗科技获达晨亿元级A1轮融资,目标3-6月内赶超Sora

视频大模型公司爱诗科技今日宣布,已于近日完成亿级A1轮融资,据了解,该轮融资由达晨财智独家投资,光源资本担任独家财务顾问。资金将主要用于底层视频大模型的技术研发及团队搭建等方面。

据悉,爱诗科技由字节跳动前视觉技术负责人王长虎创办,专注于打造全球顶尖的AI视频生成模型及应用。王长虎透露“接下来3-6个月,爱诗最重要的目标是,技术上能够追平甚至赶超Sora,做出更好的产品”。

目前,爱诗科技国际版AI视频生成产品PixVerse已经正式运营,用户可以通过网页端,或者加入Discord-PixVerse服务器进行体验。面向国内用户的爱诗大模型也已通过备案,现已开放内测。(来源:智能涌现)

内测链接:https://aishiai.com/waitlist

3. MovieLLM框架可生成电影级连续帧图片

近日,腾讯和复旦大学提出MovieLLM框架,通过GPT-4和扩散模型生成高质量、多样化的长视频数据和问答数据集。MovieLLM采用“story expanding”和“textual inversion”策略,生成电影级连续帧和风格一致的图片,提升长视频理解能力。

实验表明,MovieLLM显著增强了模型在长视频理解上的性能,同时在短视频理解基准上也观察到性能提升。

4. 阿里投资中国估值最高的5家大模型独角兽

近日,阿里巴巴成为投资中国AI大模型初创企业的最大互联网投资者,参与了包括智谱AI、零一万物等在内的多家公司投资,伴随战略布局增强云计算能力。据悉,其中部分投资以折算算力的方式支付,要求被投企业使用阿里云服务。此举有望促进阿里云业务增长,此前阿里云被曝增速放缓。(来源:财经杂志)

5. 华为发布文生图模型PixArt-Σ

近日,华为发布了最新的文生图模型PixArt-Σ,PixArt-Σ基于DiT,相较于前身PixArt-α,它提供了更高的图像保真度和与文本提示更好的对齐。

据了解,研究团队收集了更高质量的训练数据集Internal-Σ,以及更高效的token压缩。通过上述改进,PixArt-Σ能以尽可能低的训练成本和尽可能少的模型参数生成高质量的4K分辨率图像。(综合消息)

海外资讯

6. ChatGPT日耗电超50万度,是美国普通家庭用电量1.7万多倍

近日,研究显示,OpenAI旗下聊天机器人ChatGPT每天可能消耗超过50万千瓦时的电力,以响应用户约2亿个请求。相比之下,美国家庭平均每天使用约29千瓦时电力。也就是说,ChatGPT每天用电量是家庭用电量的1.7万多倍。如果生成式AI被进一步采用,耗电量可能会更多。

荷兰国家银行数据科学家亚历克斯·德弗里斯在一篇论文中估计,到2027年,整个人工智能行业每年将消耗85至134太瓦时(1太瓦时=10亿千瓦时)的电力。(综合消息)

7. Mistral-7B大模型测试成绩超GPT-4

3月7日,微软和俄亥俄州立大学研究人员提出了可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。该方法协调了试错、想象和记忆三个关键机制。ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

8. 马斯克宣布本周开源AI聊天机器人Grok

3月11日,马斯克在社交平X上发帖,他宣布xAI本周内将开源AI聊天机器人Grok。同时,他还在推文下回复:“OpenAI是一个谎言。”

9. Pika推出AI配音工具Sound Effects

3月10日,知名生成式AI创企Pika宣布推出AI配音工具Sound Effects,支持在Pika上为视频生成配套的音效。

目前,Pika提供两种生成视频音效的方式,用户可以描述期望的声音让AI生成相应的音效,或者是让Pika直接根据视频内容匹配相应的音效。据Pika透露,该功能仅对超级合作者和Pro用户开放测试,很快向所有用户推出。

10. OpenAI CEO Sam Altman重新加入董事会

3月8日,OpenAI宣布该公司CEO Sam Altman即将重新加入公司董事会。OpenAI还同时公布了三位新的董事会成员,比尔及梅林达-盖茨基金会前CEO Sue Desmond-Hellmann,索尼前法律高管Nicole Seligman以及Instacart CEO Fidji Simo。OpenAI表示,公司计划“加强”针对员工的利益冲突政策,但并未详细说明,公司还将为员工和承包商设立举报热线。

11. 汤姆猫正研发AI语音交互陪伴机器人

近日,汤姆猫公司披露了在AI领域的布局。汤姆猫公司国内研发团队与西湖心辰合作的汤姆猫AI讲故事等产品,已初步完成主要功能的测试。公司海外团队研发的首款AI手游《Talking BenAI》已在多地区开启首轮海外测试。

此外,公司AI硬件团队正研发一款基于生成式人工智能技术的AI语音交互陪伴机器人,预计将为公司业务带来全新增长空间。(来源:IT之家)

12. 谷歌推出社会学习框架,让AI模型互相教学

近日,谷歌公开了一项名为“社会学习(Social Learning)”的AI框架,该框架允许AI语言模型能够通过自然语言互相学习,由于不需要直接交换敏感关键信息,因此训练出的AI模型更具隐私保护性。部分AI模型只经过短暂的“社会学习”框架训练,便能够能获得良好的任务解决能力,并且在遵循指令方面拥有强大能力。

今日话题

把画面和音效“一锅端”!

近日,Pika上线Sound Effects新功能,可同时生成画面和音效,告别了文生视频“静音时代”!

网友们借助这个功能,还给一些梗图配上了音效;还有人认为,Pika正在为多模态AI收集“无限宝石”。

现在Pika生成音效的方式有两种,一种是通过提示词描述想要的声音,另一种则是AI通过视频内容自动生成。

不得不说,AI视频领域近期的进展可谓是“日日科技革命”。

3月6日,全球首部AI生成电影首映,也向大家展示了“AI赋予了每一个人创作自己的史诗级故事的能力”。

专业人士已经玩上了长篇巨制,专注于AI短视频的玩家们,可以先蹲一波Pika的新功能。目前该功能仅对超级合作者和Pro用户开放测试,很快向所有用户推出。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1