当前位置:首页|资讯|苹果|机器学习

一周 AI 要点:Apple发布会有多少AI元素?AI绘图二维码引网友惊呼:“真能扫出来!”

作者:好说AI发布时间:2023-06-09

在这一周,被称作 “科技圈春晚” 的苹果 WWDC 召开,“机器学习”成了当晚多次被提及的名词。而同样是在这一周,高考来了,但今年网友们除了聚焦奔赴考场的高三考生外,火起来的 AI 也成了另类焦点的“赶考新生”。


苹果召开 WWDC23 开发者大会

多次提及「机器学习」

6 月 5 日深夜,苹果举行 WWDC23 主题演讲,当然焦点无疑是 3499 美元的 MR 设备 Vision Pro 惊喜发布。

但在整场活动中, “机器学习”(Machine Learning) 和 “Transformer 模型” 两个词汇贯彻了整晚的主题演讲。

硬件:服务于使用场景

硬件方面,苹果发布了最高拥有 192GB 统一内存的 M2 Ultra 芯片,还特别强调 “用如此大的统一内存可以运行其它 PC 无法承担机器学习运算,比如用它来跑 Transformer 大模型”,用意明显。

应用层面上,AirPods Pro 还能通过机器学习 “学会” 自动调整音量,根据用户不同时间段的喜好和周围的环境来微调音量体验。

软件:主打设备端机器学习

软件方面,iOS 17 也因 “机器学习” 增色不少。首先在 “通话 Live Voicemail” 和 iMessage 上,iPhone 将能提供本地即时的语音转录内容。

而键盘输入的 “自动纠正” 借助苹果芯片的强大运算力,将能做到 “每按下一个键,iPhone 就运行一次 Transformer 语言模型”,本地的预测、学习能力表现不错。

新增的手记 APP,还能通过本地的机器学习标记出用户生活中的有趣瞬间,创建个性化的时刻建议,待用户重新查看它们时发现新的自己。

我们能从这一场主题演讲中实打实地了解苹果对于 “机器学习” 的做法:将一切隐私相关的模型落实到设备本地运行,追求机器学习的高效、实用性。

这也展示出了苹果对于机器学习、乃至于 AI 发展的明确态度:这些技术应该服务于人类,应该尊重隐私。


Midjourney v6 版本当前开发受阻

预期发布时间再后延

6 月 7 日,Midjourney 在官方 Discord 频道召开了 “Office Hours” 用户交流会,回答了用户的提问、并介绍了他们的近况。

在这场交流会中,Midjourney 开发团队坦言当前 v6 的开发落后于预期,他们必须对新版本进行重构并进行新一轮的训练,这需要他们清理数据、寻找更好的数据并对其整理,虽然目前重构的进展顺利,但预计发布日期还是会比预期时间再推迟 1 个月。

而即将到来的 v5.2 版本尽管更新幅度较小,但在 “outpainting”(扩展重绘)上可能会有不错的表现。

目前团队正优先构建独立于 Discord 的网站和移动端页面,也可以看出他们希望将服务延伸到更广受众的雄心。


必应聊天即将支持第三方浏览器

功能正向部分用户实验开放

在上周末,有 Reddit 网友展示了必应聊天在 Safari 和 Chrome 浏览器运行的截图。

后经外媒向微软广告和网络服务部门的负责人 Mikhail Parakhin 确认,微软正尝试让必应聊天支持除 Edge 外的第三方浏览器,目前正进行实验,将逐步向更多用户推出。


中国学生打造 ControlNet for QR Code

用 SD 让二维码「美如画」

近日一组非常漂亮的 “二维码” 引起了 Reddit 网友热议,说它是 “二维码”,倒不如说是“二维画”,本身是幅画,“扫码” 功能更是惊喜。人们惊呼:“真的能扫出来!”

这样的 “二维画” 被作者称作 ControlNet for QR Code,就是 Stable Diffusion 用户们熟知的那类“ControlNet”,这也意味着只要经过一些适当的操作,在未来人们可以用 AI 生成出一样漂亮的“二维画”。

创造出 “二维画” 的是 倪豪、陈柏宇、王照涵、陈智勇 这 4 位在校大学生,在有了 “用扩散模型生成一个看上去很像一张图片的二维码” 的想法后,经过长时间的 ControlNet 训练,四位同学用多种 Checkpoint + LoRA + QR Code ControlNet 的组合创作出了这些美丽的可识别二维码。

目前,他们已经把部分纹样的 LoRA 上传到了 Civitai,ControlNet for QR Code 的生成模型还在持续优化中,开发更新、模型发布、技术文档会在未来陆续公布,感兴趣的朋友可以期待一下。


文本生成视频工具 Gen-2 开启免费试用

「文生视频」时代来了

Runway 宣布视频生成模型 Gen-2 向全体用户开放,用户可直接使用提示文字 / 提示图像来创建、编辑视频内容,并支持浏览器、手机 APP 内使用。

例如输入 “汹涌的海浪”(Rough waters),Gen-2 就能生成一小段海浪视频,效果算是不错。

Gen-2 免费用户目前拥有 105 秒的视频生成额度,支持付费升级视频时长、分辨率和生成速度。


网上热议「AI 赶考」

看 AI 写出怎样的高考作文

每一年的高考作文都是全网讨论焦点,不过今年的主角不只是高三考生,还有 AI 。随着近几个月 AI 的流行,人们也在好奇国内外的这些 AI 们在高考作文上都能交出怎样的答卷。

咱们的 好说 AI 也来秀秀它的文笔,文章的最后我们来看看面对全国甲卷的作文题,它会交出怎样的答卷。

试题内容:

阅读下面的材料,根据要求写作。(60 分)

人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人。

这句话引发了你怎样的联想与思考?请写一篇文章。

要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于 800 字。



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1