欢迎收看最新一期的 Hunt Good 周报!
在本期内容你会看到:
4 条新鲜 资讯
4 个有用 工具
3 个鲜明 观点
1 个有趣 案例
Hunt for News|先进头条
🤔 OpenAI 「宫斗」内幕泄露,ChatGPT 将迎来重大更新
OpenAI 创始人 Sam Altman 当地时间 11 月 29 日宣布, 他将重返 OpenAI 担任首席执行官,Mira Murati 将继续担任首席技术官。
新的初始董事会将由 Bret Taylor(主席)、Larry Summers 和 Adam D'Angelo 组成。
Altman 表示,微软将在公司董事会中获得一个无投票权的观察员席位。在罢免事件后,Sam Altman 后首次提到首席科学家 Ilya ,Altman 表达了对 Ilya 的肯定,并希望他留下:
「虽然 Ilya 不再担任董事会成员,但我们希望继续我们的工作关系,并正在讨论他如何在 OpenAI 继续他的工作」。
最近《纽约客》也曝出了此次宫斗大戏的更多内幕信息。简单点说,就是 Altman 和前董事会成员 Helen Toner 之间起了冲突。
起因是 Toner 参与撰写了一篇批评 OpenAI「炒作人工智能」的论文。哪怕 Toner 向董事会解释并道歉了,但 Altman 还是不满意她的行为,想联系其他董事会成员把她踢出董事会,但被 Toner 先发制人。
Helen Toner :乔治城安全与新兴技术中心战略总监,提供人工智能政策和战略方面的建议
Toner 联合其他董事会成员秘密计划解雇 Altman,他们认为 Altman 不够「坦率」还擅长操纵人心,不适合领导一个非营利的 AI 安全组织。
董事会在不告知投资方微软的情况下突然宣布解雇 Altman,这让微软感到惊讶和愤怒。同时董事会还低估了员工和投资方的反应,在多方努力之下,最终 Altman 重新上任,几乎所有反对他的董事辞职。
除了宫斗大戏以外,OpenAI 最近还在发送给 GPT 开发者的邮件中透露了关于 GPTs 应用商店的上线计划。
一句话划重点,本来答应要在上个月上线的 GPTs 应用商店将推迟到明年初。
以下是邮件原文(翻译):
尊敬的 GPT 开发者,
自从我们发布 GPTs 功能以来还不到一个月,我们对您和构建者社区创造的有用且有趣的 GPT 感到惊喜。
我们正在根据您的反馈不断改进 GPT。为了改进操作,我们更新了配置界面,启用了一键测试功能,增加了预览中的调试信息,并允许使用多个域名。
关于上传文件也有一些问题。使用代码解释器时,上传的文件可以下载,因此我们把此功能设置为默认关闭,并增加了消息提示以更好地解释这一点。如果您有其他反馈,点击这里,我们很乐意听取。
关于接下来的计划,我们现在计划明年初推出 GPTs 商店。尽管我们打算本月上线,但一些意外的事情一直让我们忙碌! 与此同时,我们很快还会对 ChatGPT 进行一些其他的重大更新。感谢您投入时间来构建 GPT。
🔗 https://twitter.com/OpenAI/status/1730030975931846939
👩🎤 首位全能 AI 创作歌手出道
安娜·印第安纳(Anna Indiana)是一位全能创作型 AI 歌手,包揽了图像、演唱、配乐、歌曲,无需人类参与。
她最近在社交媒体 X 上发布了首个作品,获得了 2500 多万次的观看量,影响力堪比当初的 AI 教皇(也是 2600 万多次)。她表示,无论是旋律音符、歌词、还是形象等等,所有的一切都是使用 AI 自动生成。
已关注
关注
重播分享赞
关闭
观看更多
更多
正在加载
正在加载
退出全屏
视频加载失败,请刷新页面再试
刷新
视频详情
背后的制作者并未露面,但提到在她的创作中使用了一系列工具:开源 Python 库编程和弦,GPT-4 生成歌词,并部署代码匹配 Synthesizer V 中的旋律和合成声音,使用克隆软件 Musicfy 将其转换为无版权的声音。
安娜·印第安纳也遭到了很多专业人士的冷嘲热讽,YouTube 音乐评论家安东尼·范塔诺(Anthony Fantano)说这首歌「很糟糕」,喜剧演员凯西·格里芬(Kathy Griffin)说「我们注定要失败」。你听完之后,感觉怎么样?欢迎在评论区分享。
🔗 https://www.businessinsider.com/ai-artifical-intelligence-musician-anna-indiana-pop-chatgpt-spotify-music-2023-11
🤩 研究发现,ChatGPT 会比专业人士提供更好的建议
据 PsyPost 报道,最近发表在《心理学前沿》杂志上的一项新研究表明,ChatGPT 的最新版本能比专业专栏作家提供提供更好的建议。
提供个人建议需要展现一定程度的同理心。而基于 GPT-4 的最新版本聊天机器人允许用户对同一问题请求多个答案,然后选择其更喜欢的回答。
这种反馈使得模型逐渐产生适合社交场景的反应,并帮助它显得更有同理心。
研究人员向 400 名参与者每人提出一个社会困境问题,以及来自 ChatGPT 和专业专栏作家的回应,但没有透露每个回复的来源。
结果显示,大约四分之三的参与者认为,相比专业人士,ChatGPT 的建议更加平衡、完整、富有同理心、有帮助且整体效果更好。
研究人员表示,这并不是建议 ChatGPT 应取代专业顾问或治疗师,不仅是因为聊天机器人本身会对此发出警告,还因为聊天机器人过去曾给出过潜在的危险建议。
尽管如此,这一研究结果表明,只要解决了一些问题,设计得当的聊天机器人有一天可能会被用于辅助治疗,并为专栏作家提供相关的改进建议。
🔗 https://www.psypost.org/2023/11/new-study-finds-chatgpt-gives-better-advice-than-professional-columnists-214738
👏 阿里云开源通义千问 720 亿参数模型
通义千问发布会上,阿里云开源通义千问 720 亿参数模型 Qwen-72B。
据了解,Qwen-72B 在 10 个权威基准测评创下开源模型最优成绩,性能超越开源标杆 Llama 2-70B 和大部分商用闭源模型。
未来,企业级、科研级的高性能应用,也有了开源大模型这一选项。
通义千问当天还开源了 18 亿参数模型 Qwen-1.8B 和音频大模型 Qwen-Audio。
至此,通义千问共开源 18 亿、70 亿、140 亿、720 亿参数的 4 款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现「全尺寸、全模态」开源。
Hunt for Tools|先进工具
⌨️ SDXL Turbo 发布:你的打字有多快,AI 生图就有多快
本周,Stability AI 推出了新一代图像合成模型 Stable Diffusion XL Turbo。与其他模型相比,SDXL Turbo 在同等提示下生成的图像质量更高,同时计算量也更低。
已关注
关注
重播分享赞
关闭
观看更多
更多
正在加载
正在加载
退出全屏
视频加载失败,请刷新页面再试
刷新
视频详情
更重要的是,SDXL Turbo 的推理速度也有了很大提升。在 A100 上,它可以在 207 毫秒内生成一个 512x512 的图像。
以往 AI 生图往往需要等待一会,而 Stable Diffusion XL Turbo 的推出意味着我们将进入 AI 生图实时生成时代,你的打字有多快,AI 生图就有多快。
🔗 https://stability.ai/news/stability-ai-sdxl-turbo
🥰 翻译保留原汁原味,实时语音翻译模型 Seamless 推出
最近 Meta 基础人工智能研究(FAIR)团队迎来了十周年庆典。庆典期间,Meta 推出了实时语音翻译模型 Seamless。
Seamless 包含一系列的语音模型:
SeamlessM4Tv2:一款基础的多语种模型
SeamlessStreaming:提供实时翻译功能
SeamlessExpressive:能在翻译过程中保留原声的表情和风格
Seamless:将以上所有模型集成在一起
已关注
关注
重播分享赞
关闭
观看更多
更多
正在加载
正在加载
退出全屏
视频加载失败,请刷新页面再试
刷新
视频详情
传统的翻译模型一般是在说话者说完句子后才进行翻译,而 SeamlessStreaming 在说话者仍在说话时进行翻译,这意味着与他们交谈的人可以更接近实时地听到翻译。
值得一提的是,SeamlessStreaming 还支持近 100 种输入输出语言的自动语音识别和语音转文本,以及近 100 种输入语言和 36 种输出语言的语音转语音翻译。
🔗 https://ai.meta.com/blog/seamless-communication/?utm\_source=twitter&utm\_medium=organic\_social&utm\_campaign=fair10&utm\_content=video
😍 文生视频平台 Pika 1.0 开启测试
近日,初创公司 Pika 创建了一个 AI 驱动的平台, 可以根据字幕和静态图像编辑和生成视频。
Pika 由两位斯坦福大学人工智能实验室的博士生 Demi Guo 和 Chenlin Meng 共同创办,近日宣布在由光速创投领投,Homebrew、Conviction Capital、SV 参与的一轮融资中筹集了 5500 万美元。
11 月 28 日,Pika 宣布 Pika 1.0 已向公众开放注册,支持 3D 动画、动漫卡通、以及电影等各种视频风格。
只要你的文本提示词给到位,无论是穿着太空服的马斯克、太空中漫步的奶牛,还是行走的机器人,它都能生成你想要的效果。
🔗 https://twitter.com/pika\_labs/status/1729510078959497562
🤖 亚马逊推出一款面向企业的 AI 聊天机器人「Q」
亚马逊推出一款名为 Q 的聊天机器人,旨在帮助企业客户搜索信息、编写代码及审查业务指标。
当地时间周二,亚马逊云科技首席执行官 Adam Selipsky 在拉斯维加斯举行的亚马逊年度云计算会议上表示:
由生成式 AI 驱动的现有聊天机器人「对消费者来说确实非常有用,但在很多方面,这些应用程序并不能真正在工作中发挥作用」。
聊天机器人 Q 的预览版现已推出。开发者可以用 Q 在 AWS 上创建 app、研究最佳实践、改正错误、获得为 app 编写新功能的帮助。
用户可以通过对话式的问答功能与 Q 进行交互,学习新知识、研究最佳实践以及了解如何在 AWS 上构建 app。
此外,亚马逊还发布了新一代的 AWS 自研芯片,其中包括专为 AI 应用而设计的芯片,并加深了与领先的 AI 芯片供应商英伟达的关系。
🔗 https://aws.amazon.com/cn/blogs/aws/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/
Hunt for insights|先知
🤙 图灵奖得主 Yann LeCun:AI 基础框架必须开源
Meta 首席科学家、图灵奖得主 Yann LeCun 在《AI: Grappling with a New Kind of Intelligence》上的精彩发言在 AI 圈引起了不小的关注。
他表示,或许在几十年后,我们将拥有能媲美人类智能的人工智能系统,这些系统不仅在特定领域更加专业化,而且在人类擅长的所有领域都可能比人类更聪明。
对于「这样的系统会不会掌控世界」,他认为:「智能与控制欲之间并无必然的联系,以人类为例,虽然有些人有控制欲,但并非所有人都是如此...不够聪明的人需要依赖他人,因此会试图影响他人,而聪明的人可以独立生存」。
在他的畅想中,未来人类与数字世界、信息世界所有交互都是通过 AI 智能体来完成的,这些 AI 智能体将成为人类知识的宝库,类似于一个能进行对话和推理的「超级维基百科」。
他表示,解决少数人控制超级 AI 的最好方案就是开源基础架构,这也是 Meta 开源 Llama2 的原因之一。在他看来,AI 基础框架必须是开源的,无论听起来有多危险,但这是未来的必然趋势。
🔗 https://www.youtube.com/watch?v=EGDG3hgPNp8
😱 英伟达 CEO 黄仁勋:AI 将在 5 年内赶超人类
英伟达 CEO 黄仁勋当地时间周三在《纽约时报》年度 DealBook 峰会上表示,人工智能正在超越人类。
他表示,如果将通用人工智能(AGI)定义为能够以与人类智慧一较高下的方式完成测试的计算机,那么,「在未来五年内,你显然会看到能够完成这些测试的 AI」。
黄仁勋认为,科技行业距离实现 AGI 还有数年时间的原因之一是,尽管机器学习目前擅长识别和感知等任务,但它还无法执行多步推理任务,而这是公司和研究人员的首要任务。
他说:「每个人都在为此而努力」。
黄仁勋还回忆了他向 OpenAI 交付「世界上第一台人工智能超级计算机」的情景。当时,作为 OpenAI 联合创始人的马斯克还尚未离开。
「马斯克听到了我的介绍,他说,「我也想要一个」,他告诉我关于 OpenAI 的情况。当天,我向 OpenAI 交付了世界上第一台人工智能超级计算机」。
🔗 https://cafef.vn/ceo-nvidia-ai-se-canh-tranh-duoc-voi-con-nguoi-sau-5-nam-nua-188231201144109137.chn
💡 Hugging Face CEO 关于明年 AI 行业的 6 条预测
近日,全世界最大 AI 开源平台 Hugging Face 联合创始人兼 CEO Clement Delangue 对 2024年 AI 行业的发展做出了 6 条预测:
1.某家爆火的 AI 公司将会倒闭,或者以极低的价格被收购;
2.开源 LLM 将达到最佳闭源 LLM 的水平;
3.AI 在视频,生物,化学,时间序列等领域迎来重大突破;
4.大众将更进一步关心 AI 成本(经济和环境);
5.某个社交媒体将会充斥着 AI 生成的内容;
6.1000 万 Hugging Face 上的 AI 开发者将会带来新的工作机会,降低失业率;
🔗 https://twitter.com/ClementDelangue/status/1729158744762626310
Hunt for Fun|先行
💥 一句话让 DALL·E 3 生成更炸裂的图
之前我们介绍过 DALL·E 3 这个充满魔法的 AI 生图工具,不需要复杂的提示词,简单的三言两语就能生成各类风格的图片。但初始生成的图片往往不能符合你的预期,若是一点一点地抠细节,又反倒违背了追求高效的初衷。
擅长找「Bug」的网友很快找到了一种快速提高照片质量的方法。无论初始照片的效果怎么样,你只需要输入诸如「Make it (more +形容词)/比较级」等词汇,就能让它生成视觉效果更炸裂的图片。
向左滑动查看更多内容
例如,最初生成的可能只是一碗普通的面条,看着很诱人,添加多点辣椒,辣气仿佛如火山喷发般溢出来了,但如果还嫌不够辣?那这碗来自 AI 地狱的辣面应该能满足你。
向左滑动查看更多内容
超级奶爸得是个三头六臂的全能选手、烹饪、带娃、修理等各项技能样样精通,上帝级奶爸是真物理意义上的「强」。
「Make it more」本质上是让 DELL·E 3 用夸张的手法表达对「程度之最」的理解。想要创造最美味的芝士汉堡,堆满昂贵的食材即可,A5 级日本和牛、鹅肝、松露片、可使用的金箔与汉堡的浓郁风味相得益彰,堪称汉堡届的巅峰之作。
让它生成一个咖啡师研究咖啡的场景,随着生成的图片越来越复杂,怎么像是在研究核弹?
向左滑动查看更多内容
🔗 https://twitter.com/venturetwins/status/1728956493024919604?ref\_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1729013109359280390%7Ctwgr%5Ed339d5360e13fcff64c839ec6243c1fbd92432bf%7Ctwcon%5Es2\_&ref\_url=https%3A%2F%2Fbgr.com%2Ftech%2Fchatgpt-make-it-more-trend-goes-viral-and-you-can-try-it-with-dall-e%2F
彩蛋时间
云深不知处
向左滑动查看更多内容
作者:Tatiana Tsiguleva
工具:Midjourney
Prompt:symmetrical ocean, white futuristic island suspended in the air, surrounded by green forests, light track photography, hyper quality, movie still:: minimalist greenhouse, ocean, forespank, mountains, Twilight Photography, blue --ar 2:3
链接:https://twitter.com/ciguleva/status/1724487388746109343